2017-03-16 10:09:44分類:行業(yè)資訊4566
隨著技術(shù)的發(fā)展,越來越多的新聞媒體希望通過先進(jìn)的技術(shù)提高發(fā)稿數(shù)量,提升新聞服務(wù)質(zhì)量。"機(jī)器新聞寫作"是人工智能技術(shù)在新聞傳播領(lǐng)域一個(gè)現(xiàn)象級(jí)的發(fā)展。早些年,福布斯網(wǎng)站、美聯(lián)社、彭博社、洛杉磯時(shí)報(bào)等媒體已在體育、財(cái)經(jīng)、天氣等領(lǐng)域?qū)崿F(xiàn)了"機(jī)器人寫新聞"。今年以來,國(guó)內(nèi)的騰訊公司、新華社相繼推出了研發(fā)多時(shí)的新聞寫作機(jī)器人,并直接應(yīng)用于新聞寫作實(shí)踐,引發(fā)熱議。
信息科技時(shí)代,高科技武裝的機(jī)器智能正越來越多地解放著人的體力和腦力。事實(shí)上,我們正生活在一個(gè)越來越由人工智能所定義的世界里--智能搜索引擎告訴我們哪些資訊更重要;算法根據(jù)個(gè)人習(xí)慣和興趣,推算出我們應(yīng)該看什么電影,聽什么歌,買什么商品;警方利用犯罪大數(shù)據(jù)決定在哪里強(qiáng)化治安部署……就新聞?lì)I(lǐng)域而言,技術(shù)對(duì)新聞行業(yè)的入侵早已不是什么新鮮事,即使是新聞寫作,這項(xiàng)長(zhǎng)期依賴于記者采訪的累活兒,在人工智能科技的高速推進(jìn)下,也正變得越來越"新潮"。
前不久,新華社正式推出新聞機(jī)器人"快筆小新"參與寫稿項(xiàng)目。這臺(tái)智能化的機(jī)器人可以快速完成體育賽事、中英文稿件和財(cái)經(jīng)信息稿件的自動(dòng)撰寫。實(shí)際上這并不是國(guó)內(nèi)第一個(gè)"寫稿"機(jī)器人。早在9月10日,騰訊財(cái)經(jīng)一則標(biāo)題為《8月CPI同比上漲2.0%創(chuàng)12個(gè)月新高》的消息就由一款自動(dòng)新聞寫作軟件Dreamwriter"操刀"完成,這款寫作軟件能根據(jù)算法進(jìn)行及時(shí)分析和研判,在一分鐘內(nèi)將重要資訊和對(duì)信息的解讀送達(dá)用戶。在科技發(fā)達(dá)的歐美國(guó)家,相關(guān)技術(shù)更進(jìn)一步。福布斯網(wǎng)站早在兩年前就已經(jīng)啟用NarrativeScience的程序自動(dòng)生成財(cái)經(jīng)新聞。在去年7月,美聯(lián)社也開始使用自動(dòng)化技術(shù)報(bào)道公司業(yè)績(jī),截至2014年底,其智能寫作系統(tǒng)已完成了4400篇財(cái)報(bào)新聞,效率是人類記者的15倍。
那么,機(jī)器人寫稿子到底是如何運(yùn)行的呢?
對(duì)于相對(duì)"格式化"的新聞資訊,機(jī)器人消除了傳統(tǒng)媒體的弊端,可以做到瞬間反應(yīng)、迅捷生成,在短時(shí)間內(nèi)處理大量數(shù)據(jù),且差錯(cuò)率較低。他們內(nèi)容生產(chǎn)過程的核心,是基于云計(jì)算和大數(shù)據(jù)分析的人工智能,依賴于一個(gè)或多個(gè)采集存儲(chǔ)了大量高質(zhì)量數(shù)據(jù)的龐大數(shù)據(jù)庫(kù),在寫稿時(shí),機(jī)器人先從海量數(shù)據(jù)庫(kù)中找出符合新聞主題需要的原始數(shù)據(jù)信息,然后通過一系列結(jié)構(gòu)化處理、清洗,把數(shù)據(jù)信息重新排列組合,形成高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù),最后套用設(shè)定好的固定新聞模板將文本呈現(xiàn)出來。數(shù)據(jù)挖掘中間上下前后的連接邏輯也比較簡(jiǎn)單,并且數(shù)據(jù)源比較單一。這方面,在內(nèi)容相對(duì)單調(diào)枯燥,報(bào)道風(fēng)格單一,又對(duì)數(shù)據(jù)準(zhǔn)確度和速度要求很高的體育賽事播報(bào)、證券財(cái)經(jīng)類、領(lǐng)導(dǎo)人公共活動(dòng)、天氣預(yù)報(bào)等新聞中,機(jī)器人"智能填充輸出"優(yōu)勢(shì)十分明顯。正因此,無論是美聯(lián)社與AutomatedInsights(AI)公司合作,使用他們的Wordsmith平臺(tái)自動(dòng)生產(chǎn)財(cái)報(bào),還是新華社"快筆小新"應(yīng)用在中國(guó)足球超級(jí)聯(lián)賽報(bào)道,都很大程度上加快了出稿速度,減少了記者工作量。
知識(shí)概念模型技術(shù)的應(yīng)用,有助于將記者、編輯、專家話語(yǔ)智慧轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別數(shù)據(jù),從而在信息數(shù)據(jù)的整合編排過程中,機(jī)器人能快速?gòu)暮A繑?shù)據(jù)中挖掘可用于文本分析的專家智慧數(shù)據(jù),從而模仿類似專家的行為(人工智能模仿),自動(dòng)生成包括原因、結(jié)論、推測(cè)等深度分析新聞。同時(shí),若添加、串聯(lián)不同語(yǔ)言風(fēng)格的語(yǔ)料庫(kù),在出色的語(yǔ)義分析技術(shù)帶動(dòng)下,機(jī)器人新聞生成將匹配更加豐富的自然語(yǔ)言,內(nèi)容輸出將呈現(xiàn)多樣性、個(gè)性化,以適應(yīng)不同社會(huì)階層或年齡段的受眾群體。特別是隨著大數(shù)據(jù)的發(fā)展以及相關(guān)用戶行為痕跡的記錄跟蹤,與之匹配的新聞推送早已成熟,隨之而來的"私人訂制"的新聞生產(chǎn)也并非遙不可及。
其實(shí)這種憂慮為時(shí)尚早,因?yàn)楫?dāng)下的機(jī)器人新聞生產(chǎn)尚處在"稿子拼湊、語(yǔ)言堆砌"的稚拙摸索階段,即"幼年"期,在未來相當(dāng)長(zhǎng)一段時(shí)間內(nèi)機(jī)器智能還遠(yuǎn)遠(yuǎn)無法替代人的"大腦",尤其是那些需要體現(xiàn)思考價(jià)值、人文審美的新聞稿件,依舊依賴于媒體記者們來完成。"機(jī)器可以根據(jù)格式和語(yǔ)法規(guī)則寫一首詩(shī),或者一篇小說,但全世界的數(shù)據(jù)加起來,也無法讓一個(gè)程序理解愛、悲傷或恐懼。"[1]AutomatedInsight的CEORobbieAllen早前就說過:"其實(shí)就是讓機(jī)器人把數(shù)據(jù)轉(zhuǎn)化成故事,真正的難點(diǎn)在于怎么讓它看起來像人寫的,因?yàn)橹挥袛?shù)據(jù)不是好故事。"
事實(shí)也是如此,新華社"快筆小新"盡管已能夠采寫多種類型的資訊稿件,但"編輯簽發(fā)"依舊是無法忽略的重要環(huán)節(jié)。即使是美聯(lián)社也公開承認(rèn),隨著大量財(cái)報(bào)新聞?dòng)蓹C(jī)器人撰寫,新聞的質(zhì)量將會(huì)有所下降,針對(duì)一些關(guān)注度比較高的公司,如Google、蘋果的財(cái)報(bào),美聯(lián)社直接承諾將繼續(xù)由資深記者手工撰寫,以避免帶來風(fēng)險(xiǎn)性。
當(dāng)下時(shí)髦的機(jī)器人新聞寫作還有一個(gè)致命缺陷,就是其局限于現(xiàn)有數(shù)據(jù)庫(kù)的信息加工。這有兩個(gè)方面的影響:
一是平臺(tái)數(shù)據(jù)庫(kù)積累的大小、質(zhì)量、類別等,都將影響機(jī)器人新聞生產(chǎn)的內(nèi)容質(zhì)量,特別是一旦出現(xiàn)數(shù)據(jù)缺陷或算法邏輯差異,都可能導(dǎo)致不同的內(nèi)容輸出結(jié)果。更為致命的是,諸如情緒、價(jià)值這種東西是很難用數(shù)據(jù)量化并存儲(chǔ)的,具體新聞故事場(chǎng)景中,機(jī)器人新聞生產(chǎn)很難相應(yīng)加入"情感"元素,為此,他們更多只是"機(jī)械地"從數(shù)據(jù)庫(kù)里抽取形容詞。
二是新聞寫作機(jī)器人即使能通過對(duì)數(shù)據(jù)庫(kù)的深入挖掘與信息組合,創(chuàng)造出很多原創(chuàng)性新聞,但發(fā)生于社會(huì)現(xiàn)實(shí)的素材或者說實(shí)地實(shí)景的社會(huì)信息,依舊難以呈現(xiàn)。這背后實(shí)際上道出了一個(gè)機(jī)器人寫作的現(xiàn)實(shí)背景:即機(jī)器人能進(jìn)行新聞寫作并不是本身有多高明,而在于,在這個(gè)時(shí)代,新聞生產(chǎn)可以不完全依賴于線下采訪。新聞生產(chǎn)和采訪的脫離,是互聯(lián)網(wǎng)蓬勃發(fā)展對(duì)傳統(tǒng)新聞業(yè)整體性的顛覆,也是當(dāng)今時(shí)代媒體行業(yè)的重大變更。反過來也一樣,現(xiàn)實(shí)生活中的題材依然離不開記者的實(shí)地采訪,最起碼線下的信息內(nèi)容需要編輯記者人工輸入到統(tǒng)一的數(shù)據(jù)庫(kù)中,新聞寫作機(jī)器人才能進(jìn)行下一步工作。即使只有這一過程,記者的價(jià)值依舊不可替代。
盡管多家媒體推出了新聞機(jī)器人,但目前主流輿論依然認(rèn)為,記者工作是一種復(fù)雜的、高級(jí)的腦力勞動(dòng),人性是機(jī)器難以逾越的鴻溝,人類的深刻理解力和創(chuàng)造力是機(jī)器難以效仿的。不過,這種看法或許太過保守,科技進(jìn)步之下機(jī)器的進(jìn)化速度令人驚嘆,未來的機(jī)器人必將越來越智能。特別是人工智能、大數(shù)據(jù)運(yùn)算、機(jī)器學(xué)習(xí)等新技術(shù)不斷取得突破性發(fā)展,我們已看到了語(yǔ)音識(shí)別、機(jī)器翻譯、機(jī)器人寫新聞、即時(shí)數(shù)據(jù)展示、個(gè)性化推薦等許多媒介變化。當(dāng)代最有影響的媒介理論家之一DouglasRushkoff在《編程,或者被編程》一書中寫道:隨著計(jì)算機(jī)和網(wǎng)絡(luò)計(jì)算能力的不斷提升,"思考本身將不再--至少不再是獨(dú)一無二地--成為人類的特權(quán)"。瑞典學(xué)者的一項(xiàng)研究顯示,大多數(shù)讀者無法分辨自動(dòng)寫作軟件和記者撰寫的某些報(bào)道。有軟件公司負(fù)責(zé)人預(yù)測(cè),在5年之內(nèi)機(jī)器人所撰寫的文章就能獲得普利策新聞獎(jiǎng),并稱將來90%新聞稿由機(jī)器人撰寫。
顯然,過分夸大和低估智能機(jī)器帶給新聞行業(yè)乃至人類社會(huì)的影響,都是極其不負(fù)責(zé)任的。那么,如何定位當(dāng)下聲名鵲起的新聞寫作機(jī)器人相對(duì)適合呢?機(jī)器人"Quakebot"的設(shè)計(jì)者舒文克提出一種相對(duì)中性的觀點(diǎn),他認(rèn)為,機(jī)器人寫手雖有其技術(shù)優(yōu)勢(shì),但卻無法完全具備人的靈活性和創(chuàng)造力,讓機(jī)器人成為記者的幫手,相信它會(huì)使工作更有趣。國(guó)內(nèi)不少媒體人士也指出,相對(duì)程序化、枯燥的工作交由機(jī)器人后,記者們將有更多精力和時(shí)間來應(yīng)付更需要獨(dú)特角度和思考的報(bào)道。2014年3月26日,《人民日?qǐng)?bào)》刊發(fā)署名為"趙鐸"的文章《"機(jī)器人記者"忙起來》指出,機(jī)器人寫手只是一種輔助形式,它可以節(jié)省時(shí)間,把記者從一堆基礎(chǔ)數(shù)據(jù)和信息中解放出來。但機(jī)器人撰寫新聞的過程就像一個(gè)復(fù)雜的填詞游戲,一些具有固定模式的行業(yè)性文章更符合它的能力,"如果有一天記者真的被冷冰冰的機(jī)器人取代,新聞恐將淪為諸多報(bào)道模式的生硬拼盤"。
不管如何爭(zhēng)論,如今,機(jī)器人與人工智能已不再停留在暢想階段,它們正成為產(chǎn)業(yè)新風(fēng)口,掀起新一輪技術(shù)創(chuàng)新浪潮。如何適應(yīng)未來的技術(shù)變革,顯然也是國(guó)內(nèi)外媒體亟需思考的命題。筆者認(rèn)為,以下兩點(diǎn)尤其值得各媒體提前做好內(nèi)功:
1.積極搶占數(shù)據(jù)浪潮的高地
智能化離不開互聯(lián)網(wǎng)數(shù)據(jù),隨著新聞傳播業(yè)數(shù)據(jù)庫(kù)建設(shè)的發(fā)展,大數(shù)據(jù)庫(kù)不僅成為新聞媒體向用戶提供新聞信息服務(wù)的直接手段之一,也是媒體內(nèi)容生產(chǎn)走向自動(dòng)化深入挖掘轉(zhuǎn)型的重要基礎(chǔ)。特別是隨著互聯(lián)網(wǎng)跨界融合的發(fā)展,互聯(lián)網(wǎng)開放技術(shù)賦予各媒介平臺(tái)流量信息的共享與豐富,活躍于互聯(lián)網(wǎng)媒介的信息用戶正成為新聞寫作素材的間接生產(chǎn)者,每天提供著海量的網(wǎng)絡(luò)信息(數(shù)據(jù)),這些有跡可循的用戶行為痕跡都可能成為未來新聞智能創(chuàng)作的基礎(chǔ)數(shù)據(jù)??梢哉f,未來?yè)碛谢A(chǔ)數(shù)據(jù)的規(guī)模,將成為衡量一個(gè)媒體實(shí)力的重要標(biāo)志。反過來,采集大量高質(zhì)量的數(shù)據(jù),又有助于通過數(shù)據(jù)挖掘?qū)崿F(xiàn)信息篩選與新聞生產(chǎn)的個(gè)性化、精準(zhǔn)化定位,大大降低用戶獲取有效信息的成本。
2.大力推進(jìn)業(yè)務(wù)與技術(shù)深度融合
我們正在歷經(jīng)一場(chǎng)由技術(shù)應(yīng)用推動(dòng)的媒體轉(zhuǎn)型,媒體形態(tài)和輿論格局正在發(fā)生深刻調(diào)整,智能化趨勢(shì)下,新聞業(yè)無論是產(chǎn)品形態(tài),還是新聞生產(chǎn)力,都會(huì)經(jīng)歷新的洗禮,新聞傳播正處于一個(gè)重要的歷史分界點(diǎn)。但無論是現(xiàn)在還是未來,行業(yè)的信息技術(shù)含量會(huì)越來越重,其中人工智能交互將是最核心趨勢(shì)。目前,類似百度新聞和今日頭條的個(gè)性化推薦就是智能交互的初級(jí)階段。尤其是新媒體領(lǐng)域,新媒體發(fā)展最關(guān)鍵在技術(shù)層面,新媒體本身就是技術(shù)驅(qū)動(dòng)的媒體,比如雅虎、Facebook、微博、微信等,都是一個(gè)新的技術(shù)運(yùn)用很快占領(lǐng)市場(chǎng)。因此,媒體轉(zhuǎn)型必須跟蹤前沿技術(shù),創(chuàng)造自己獨(dú)特的技術(shù),打造屬于自己的獨(dú)創(chuàng)產(chǎn)品。
"機(jī)器人寫作"是知識(shí)技術(shù)融合的產(chǎn)物,機(jī)器稿件生產(chǎn)系統(tǒng)的出現(xiàn),雖然將給新聞傳播行業(yè)帶來深刻而長(zhǎng)遠(yuǎn)的變化,但萬變不離其宗的是,新聞從來都是一種極富"專業(yè)性、創(chuàng)造性"的智力活動(dòng)。在新聞寫作過程中,記者們創(chuàng)作出更具專業(yè)性、思想性的新聞內(nèi)容,我們才不至于被機(jī)器人所代表的科技力量所擊潰。