
摘要: 2016年中國電影市場繼續(xù)保持火熱,影片數(shù)量和收入都再創(chuàng)新高,越來越多的資源融入到這個(gè)欣欣向榮的行業(yè)。與此同時(shí),我們還是常常被爛片刷屏,佳作一片難求。數(shù)據(jù)俠Souseki爬取了豆瓣電影上的數(shù)據(jù)并進(jìn)行分析,結(jié)論是:國產(chǎn)電影的質(zhì)量一直在下滑,一些演員更是在爛片的坑里越陷越深。
國產(chǎn)影視作品平均質(zhì)量一路下滑
為了看看國產(chǎn)電影的整體表現(xiàn),我抓取了2000年到2016年的豆瓣電影條目里有“中國”標(biāo)簽的全部數(shù)據(jù),之后對(duì)數(shù)據(jù)進(jìn)行了清洗:比如剔除信息缺失嚴(yán)重的樣本,篩掉綜藝節(jié)目、脫口秀、晚會(huì)、演唱會(huì)等類型。
由于時(shí)間等客觀因素的限制,此次分析的數(shù)據(jù)樣本不一定覆蓋了所有時(shí)段的所有國產(chǎn)影視作品,但是基本囊括了主流作品,具有一定的代表性,算是一個(gè)對(duì)總體的簡單隨機(jī)抽樣吧。
首先根據(jù)樣本數(shù)據(jù)畫了個(gè)散點(diǎn)圖,橫軸表示時(shí)間,縱軸表示豆瓣評(píng)分,散點(diǎn)的大小表示該作品的評(píng)論人數(shù),點(diǎn)越大,表明評(píng)論人數(shù)越多。紅色曲線展示了2000年1月到2016年12月,每個(gè)月上映的所有作品平均分的走向。

從這張圖可以明顯看出,2000年到2016年,國產(chǎn)影視作品的平均分走向是曲折的、迂回的,但總體趨勢(shì)是倒退的、下降的。
縱然,以豆瓣的平均分作為每個(gè)時(shí)段的評(píng)價(jià)指標(biāo)有很大的局限性和片面性。
對(duì)于觀眾而言,一個(gè)月即使?fàn)€片扎堆,只要還有一部不錯(cuò)的作品,人們就不會(huì)對(duì)這個(gè)月的觀影體驗(yàn)打太低的分。不過,平均分作為一種總體評(píng)價(jià)指標(biāo)也有重要的可取之處,至少它會(huì)提醒我,這個(gè)月真的有很多爛片。
我還制作了一個(gè)視頻,展示2000到2016年的192個(gè)月里每個(gè)月的影視作品得分分布,以及當(dāng)月的平均分。
為了增加動(dòng)態(tài)效果,同時(shí)也為了減少點(diǎn)和點(diǎn)之間的重疊,我給散點(diǎn)增加了0.2個(gè)單位范圍的隨機(jī)擾動(dòng),所以每一幀圖同一個(gè)點(diǎn)的位置可能存在細(xì)微差別。這條時(shí)間序列曲線可能存在某種固定的周期波動(dòng),有興趣的朋友可以再細(xì)致分析下它的長期趨勢(shì)和周期變化,這里先不做展開。
限制級(jí)題材片水平有待提高
豆瓣上的電影都會(huì)有相應(yīng)的類型標(biāo)簽,例如劇情、驚悚、戰(zhàn)爭等等。在我抓取到的樣本數(shù)據(jù)中,共有30個(gè)類別。下面這張圖展示了平均得分最高和最低的五個(gè)類別。

得分最高的5個(gè)類型是戲曲、紀(jì)錄片、西部、短片、歷史。
戲曲類影片的平均得分這么高是很多人想不到的。作為中國特有的藝術(shù)表現(xiàn)形式之一,戲曲類的影片常常表現(xiàn)出較高的藝術(shù)性。但由于受眾基礎(chǔ)不大,往往容易被大家忽略。
另一個(gè)常出佳片的國產(chǎn)電影類型則是紀(jì)錄片。天朝還是有很多優(yōu)秀的紀(jì)錄片和紀(jì)錄片導(dǎo)演的,像前不久,范儉執(zhí)導(dǎo)的《搖搖晃晃的人間》和王久良的《塑料王國》就在阿姆斯特丹紀(jì)錄片電影節(jié)上獲獎(jiǎng)。

?。▓D片說明:《大明王朝1566》電視劇宣傳照;圖片來源于網(wǎng)絡(luò))
另外,中國歷史題材的電視劇也有不少佳作,《大秦帝國》、《大明王朝1566》、《康熙王朝》、《走向共和》、《大宅門》等在豆瓣上都有很好的口碑。導(dǎo)演用心、劇本扎實(shí)、演員有實(shí)力,評(píng)價(jià)自然不會(huì)差。
得分最低的5個(gè)類型是災(zāi)難、冒險(xiǎn)、恐怖、情色、驚悚。
個(gè)人感覺,上世紀(jì)八九十年代,中國大陸有很多恐怖片確實(shí)蠻嚇人的,之前網(wǎng)上流傳的89年版的封神榜也是極其瘆人。
與紀(jì)錄片、歷史劇這類比較“正”的題材不同,限制級(jí)題材的電影天生自帶獵奇屬性。很多觀眾喜愛驚悚、情色、恐怖類的影片,某種程度上,是為了滿足個(gè)人的想象空間。
然而,一味追求獵奇而忽略了故事、人性等電影的基本要求,只會(huì)不斷出現(xiàn)假、大、空的“偽電影”,被人詬病也就在所難免了。
最受關(guān)注的演員和導(dǎo)演
我把每位演員參演的所有作品的評(píng)價(jià)人數(shù)進(jìn)行累加,得到了評(píng)價(jià)人數(shù)之和,也就是計(jì)算了所謂的“關(guān)注熱度”。
在累加的過程中,每部作品對(duì)所有參演演員的權(quán)重都是一樣的,也就是說不區(qū)分主角和配角。
當(dāng)然,這種計(jì)算方法有值得商榷之處,因?yàn)槟惝?dāng)時(shí)看這部片子時(shí)只是沖著你愛豆去的,并不care其他演員,不過,你必須承認(rèn)的一點(diǎn)是,他們確實(shí)與你混了個(gè)臉熟。
下圖列出了最受關(guān)注的演員前20名,同時(shí)列出了其參演的所有影視作品的平均得分。

最受關(guān)注的演員前5名是,林雪、黃秋生、陳坤、劉德華、古天樂。
林雪這個(gè)名字,乍一聽可能陌生,但他那張臉,你應(yīng)該再熟悉不過了。
就是他。

(圖片說明:香港演員林雪;圖片來源于網(wǎng)絡(luò))
導(dǎo)演方面,馮小剛、劉偉強(qiáng)、麥兆輝、杜琪峰、張藝謀是最受關(guān)注的5位導(dǎo)演。演員林雪正好是杜琪峰執(zhí)導(dǎo)影片中的??停瑢?dǎo)演的作品如此受關(guān)注,演員自然也沾光。

在列出的這20位導(dǎo)演中,姜文、王家衛(wèi)、寧浩的作品平均得分最高。又要看的人多,還要大家都說好,確實(shí)不是件容易的事呢。
在樣本數(shù)據(jù)中,我還將每位演員參演作品的數(shù)量和導(dǎo)演執(zhí)導(dǎo)作品的數(shù)量進(jìn)行了統(tǒng)計(jì),評(píng)選出了勞模演員和勞模導(dǎo)演,讓我們看看他們都是誰吧。

?。▓D片說明:左圖是勞模演員,右圖是勞模導(dǎo)演)
到底誰演了爛片?
描述做完了,還想跑個(gè)回歸。
線性模型中以豆瓣評(píng)分作為因變量,另外再加倆logistic模型,根據(jù)豆瓣評(píng)分劃定下“及格線”和“爛片”標(biāo)準(zhǔn)。
在我的樣本中,豆瓣評(píng)分均分是6.25,那么就以6.25分作為及格線,得分大于6.25分的作品才算及格。但把得分低于或等于6.25分的作品稱作爛片似乎有點(diǎn)嚴(yán)苛,所以我以平均分減去一個(gè)標(biāo)準(zhǔn)差的結(jié)果(4.29)作為劃定爛片的標(biāo)準(zhǔn)。
根據(jù)個(gè)人的興趣和喜好,我加入了以下導(dǎo)演、演員和其他控制變量。

在導(dǎo)演和演員變量方面,黃曉明、楊洋、呂中獲得了在三個(gè)模型中都顯著的殊榮。
不過呂中老師的在三個(gè)模型中估計(jì)系數(shù)的符號(hào)與另外兩位演員剛好是相反的。
以黃曉明為例,他在OLS模型中的估計(jì)系數(shù)為-0.557,在0.05的水平上顯著,這表示在其他條件都不改變的情況下,一個(gè)影視作品若有黃教主參演,那么它的豆瓣評(píng)分將平均降低0.557分。
楊洋同學(xué)同理,不再贅述。
值得一說的是,呂中老師在模型中的估計(jì)系數(shù)剛好與其他兩位演員相反,這表示,一個(gè)影視作品若有呂中老師參演,那么它的評(píng)分將平均提高0.73分,同樣根據(jù)剩下兩個(gè)模型,我們也可以判斷,呂中老師參演的作品其豆瓣得分更有可能在及格線以上,以及更不可能成為爛片。
所以,在我選取的這些演員中,與爛片顯著相關(guān),以及參演作品得分明顯較低的演員有:黃曉明、楊洋、陳學(xué)冬、楊穎、范冰冰等。
而參演作品豆瓣評(píng)分明顯較高的演員有:呂中、倪大紅、陳寶國、陳道明等
。
當(dāng)然,這里我們不能進(jìn)行粗暴的因果推斷,即認(rèn)為某某參演的電影或電視劇就有可能成為爛片。
以上分析只是體現(xiàn)了一種相關(guān)性,也就是說在既定事實(shí)中,某某參演的作品確實(shí)評(píng)分較低,但這種低評(píng)分或許有其他原因?qū)е乱参纯芍?/p>