信息智能推薦算法是人工智能技術(shù)在信息傳播領(lǐng)域的應(yīng)用,它極大地提高了信息的生產(chǎn)和傳播效率,帶來(lái)了傳播方式和傳播活動(dòng)的深刻變革,同時(shí)也引發(fā)了監(jiān)管部門(mén)和用戶(hù)對(duì)這一新技術(shù)運(yùn)用中出現(xiàn)的內(nèi)容質(zhì)量和價(jià)值觀(guān)問(wèn)題、算法黑箱和信息繭房風(fēng)險(xiǎn)等多方面的關(guān)切和疑慮。面對(duì)這些關(guān)切和疑慮,學(xué)界進(jìn)行了持續(xù)研究分析,互聯(lián)網(wǎng)信息平臺(tái)不斷探索問(wèn)題的解決和風(fēng)險(xiǎn)的防控,推動(dòng)智能推薦技術(shù)的優(yōu)化創(chuàng)新,以期把握算法的特點(diǎn)、價(jià)值和規(guī)律,促進(jìn)人工智能時(shí)代信息傳播的健康發(fā)展、安全發(fā)展。
算法不是信息傳播中社會(huì)價(jià)值弱化的根源
媒體進(jìn)入大眾化和市場(chǎng)化時(shí)代以來(lái),內(nèi)容的低俗、低質(zhì)和娛樂(lè)化傾向就開(kāi)始顯現(xiàn),給主流價(jià)值的傳播帶來(lái)挑戰(zhàn)。進(jìn)入信息智能推薦算法時(shí)代,這一趨勢(shì)還在延續(xù),并有了新的表現(xiàn)形式。根本原因在于,大眾偏好的內(nèi)容往往不等同于優(yōu)質(zhì)的內(nèi)容,而用戶(hù)的需要、市場(chǎng)的要求是媒介技術(shù)發(fā)展的主要推動(dòng)力,客觀(guān)上助長(zhǎng)了內(nèi)容生態(tài)的低質(zhì)化。
從算法設(shè)計(jì)的初衷看,其本身并不會(huì)提倡標(biāo)題黨、煽情和低俗化內(nèi)容,但由于智能推薦算法要經(jīng)由網(wǎng)上海量的數(shù)據(jù)來(lái)訓(xùn)練和生成,而在全網(wǎng)已經(jīng)存在大量低質(zhì)化信息和大眾化審美品位沒(méi)有得到根本提升的情況下,加之設(shè)計(jì)算法的工程師沒(méi)有經(jīng)過(guò)專(zhuān)業(yè)的新聞倫理訓(xùn)練,主要關(guān)注內(nèi)容和用戶(hù)興趣的匹配度等指標(biāo),缺乏社會(huì)價(jià)值意識(shí),在算法發(fā)展的初期也沒(méi)有將對(duì)社會(huì)價(jià)值的導(dǎo)向要求和對(duì)低質(zhì)信息的把關(guān)需要內(nèi)化為算法的具體規(guī)則,在客觀(guān)上呈現(xiàn)出推薦內(nèi)容的低質(zhì)化傾向。如果說(shuō)在門(mén)戶(hù)網(wǎng)站和社交網(wǎng)絡(luò)時(shí)代,不符合用戶(hù)偏好的信息還能經(jīng)由編輯的專(zhuān)業(yè)推薦或關(guān)系鏈中其他人的轉(zhuǎn)發(fā)推薦而有一定的傳播空間,那么在算法時(shí)代,不同內(nèi)容之間的“馬太效應(yīng)”更加凸顯,符合偏好的內(nèi)容可以經(jīng)由算法的逐級(jí)放大有更廣泛的影響,而其他內(nèi)容則很難有生存空間。
算法并不必然助長(zhǎng)內(nèi)容生態(tài)的低質(zhì)化。這要從算法設(shè)計(jì)的主要特征分析,分為個(gè)體、群體、整體三個(gè)層次的特征:對(duì)個(gè)體用戶(hù),算法一般通過(guò)對(duì)內(nèi)容特征、人的特征、環(huán)境特征三個(gè)維度指標(biāo)的分析,在特定人和特定內(nèi)容之間做出力求精準(zhǔn)的匹配。內(nèi)容特征可能包括領(lǐng)域分類(lèi)、主題詞、實(shí)體詞、來(lái)源、質(zhì)量評(píng)分、相似文章等指標(biāo),人的特征包括興趣、年齡、性別、職業(yè)、使用行為、機(jī)型等指標(biāo),環(huán)境特征包括時(shí)間、地點(diǎn)、天氣和網(wǎng)絡(luò)類(lèi)型等。在群體層面,算法通過(guò)尋找不同用戶(hù)在興趣分類(lèi)、主題、實(shí)體詞和使用行為上的相似性,將一個(gè)用戶(hù)感興趣的內(nèi)容推薦給另一個(gè)人,這已不是基于用戶(hù)自己的歷史行為,而是基于群體隱性關(guān)聯(lián)之上的協(xié)同推薦。就網(wǎng)民整體,算法則基于內(nèi)容的熱度特征,包括全平臺(tái)的熱點(diǎn)文章或不同類(lèi)別、主題和關(guān)鍵詞的熱點(diǎn)內(nèi)容,在“冷啟動(dòng)”階段對(duì)新用戶(hù)進(jìn)行初步推薦。
要扭轉(zhuǎn)社交時(shí)代以來(lái)內(nèi)容低質(zhì)化的趨勢(shì),需要智能信息分發(fā)平臺(tái)將社會(huì)責(zé)任意識(shí)主動(dòng)地融入算法設(shè)計(jì)。算法的市場(chǎng)目標(biāo)分為中短期目標(biāo)和長(zhǎng)期目標(biāo),中短期目標(biāo)是幾個(gè)小時(shí)、一兩天之內(nèi)用戶(hù)的興趣匹配,是為了提升點(diǎn)擊率和收藏、轉(zhuǎn)發(fā)、評(píng)論等行為,而長(zhǎng)期目標(biāo)是實(shí)現(xiàn)用戶(hù)的穩(wěn)定留存和活躍使用。很多時(shí)候,短期目標(biāo)對(duì)實(shí)現(xiàn)長(zhǎng)期目標(biāo)并沒(méi)有幫助,有時(shí)候反而起反作用。以標(biāo)題黨現(xiàn)象為例,劣質(zhì)創(chuàng)作者通過(guò)噱頭可以吸引用戶(hù)點(diǎn)擊,使點(diǎn)擊率虛高,用戶(hù)可能會(huì)留下負(fù)面評(píng)價(jià),表面上提高了參與度,但卻以犧牲用戶(hù)體驗(yàn)和影響留存為代價(jià),類(lèi)似含水的點(diǎn)擊率和負(fù)面的評(píng)論率,不符合信息平臺(tái)的長(zhǎng)遠(yuǎn)利益。
當(dāng)前智能分發(fā)已成為新聞資訊客戶(hù)端、瀏覽器等應(yīng)用的“標(biāo)配”手段,從行業(yè)實(shí)踐看,居于頭部領(lǐng)先位置的App更重視用戶(hù)的長(zhǎng)期留存,更傾向于主動(dòng)避免內(nèi)容低質(zhì)化帶來(lái)的社會(huì)輿論和監(jiān)管風(fēng)險(xiǎn)。字節(jié)跳動(dòng)公司最早將智能推薦算法應(yīng)用在信息分發(fā)領(lǐng)域,在發(fā)展早期也存在內(nèi)容質(zhì)量問(wèn)題和算法偏向市場(chǎng)化的問(wèn)題,近年通過(guò)設(shè)置更多元的算法目標(biāo),綜合分析用戶(hù)瀏覽時(shí)長(zhǎng)、評(píng)論情感傾向來(lái)打擊標(biāo)題黨、煽情化等劣質(zhì)內(nèi)容,通過(guò)技術(shù)模型過(guò)濾有害信息和黃賭毒等違法違規(guī)內(nèi)容,并基于正能量信息的模型訓(xùn)練來(lái)加強(qiáng)主流價(jià)值信息的推薦。例如,信息平臺(tái)通過(guò)對(duì)上百萬(wàn)篇網(wǎng)信部門(mén)宣傳報(bào)道指令、黨報(bào)黨刊要聞等正能量信息的人工標(biāo)注,作為機(jī)器學(xué)習(xí)的模型訓(xùn)練集,模型經(jīng)過(guò)不斷優(yōu)化,對(duì)新時(shí)代建設(shè)等主流價(jià)值觀(guān)內(nèi)容的識(shí)別率準(zhǔn)確超過(guò)93%。算法對(duì)識(shí)別出的文章進(jìn)行1.5-2倍的加權(quán)推薦,目前正能量模型識(shí)別范圍已涵蓋凡人善舉、行業(yè)榜樣、知識(shí)普惠、公益慈善等眾多領(lǐng)域,平臺(tái)內(nèi)容日益多元優(yōu)質(zhì),生態(tài)越來(lái)越有益健康。而一些“信息流”平臺(tái)則表現(xiàn)出打擦邊球的意愿和行動(dòng),以對(duì)低俗化內(nèi)容的推薦來(lái)實(shí)現(xiàn)短期用戶(hù)量的“沖高”,美女、大尺度、追星、偶像成為內(nèi)容關(guān)鍵詞,這些信息經(jīng)推薦算法進(jìn)一步放大了對(duì)用戶(hù),特別是青少年用戶(hù)的影響。這已引發(fā)社會(huì)關(guān)切和監(jiān)管層的關(guān)注,已督促改進(jìn)。但效果尚不明顯,需要加大監(jiān)管力度。
在智能分發(fā)時(shí)代,要解決內(nèi)容的低俗化低質(zhì)化和社會(huì)價(jià)值弱化問(wèn)題,要從兩方面同時(shí)入手、同步加強(qiáng)。一要解決內(nèi)容生產(chǎn)的低質(zhì)化問(wèn)題,壓實(shí)社交平臺(tái)、信息平臺(tái)和創(chuàng)作者的社會(huì)責(zé)任,提升全體用戶(hù)的道德素質(zhì)和網(wǎng)絡(luò)素養(yǎng)。社交網(wǎng)絡(luò)極大賦能了用戶(hù)的創(chuàng)作權(quán)、表達(dá)權(quán)、傳播權(quán),一個(gè)個(gè)用戶(hù)需求和內(nèi)容產(chǎn)出匯聚起來(lái),越發(fā)影響著網(wǎng)上信息的議程設(shè)置和導(dǎo)向,如果此時(shí)的內(nèi)容生態(tài)不健康,那么“沒(méi)有一片雪花是無(wú)辜的”,而現(xiàn)實(shí)是大多數(shù)用戶(hù)基于原始的本能,傾向于好玩的、娛樂(lè)的、低俗的內(nèi)容。這不同于傳統(tǒng)媒體時(shí)代,新聞機(jī)構(gòu)有強(qiáng)大的社會(huì)影響力,但也負(fù)有高度的責(zé)任和使命。社交平臺(tái)、信息平臺(tái)的海量信息是推薦算法發(fā)揮作用的土壤,在個(gè)體賦權(quán)的同時(shí),用戶(hù)也需要權(quán)責(zé)平衡,要以多種方式有效提升普通人的道德素質(zhì)、媒介素養(yǎng)、算法知識(shí)、責(zé)任意識(shí)和法紀(jì)觀(guān)念,創(chuàng)作者要確保一開(kāi)始就生產(chǎn)高質(zhì)量的內(nèi)容,平臺(tái)更主動(dòng)發(fā)揮自我監(jiān)管的責(zé)任,才能從源頭上建立優(yōu)質(zhì)的內(nèi)容生態(tài)。
二要實(shí)現(xiàn)社會(huì)價(jià)值融入算法設(shè)計(jì),發(fā)揮對(duì)內(nèi)容生產(chǎn)和傳播的“獎(jiǎng)優(yōu)罰劣”把關(guān)作用,盡快邁向智能管網(wǎng)治網(wǎng)。算法幫助用戶(hù)以更智能、更高效的方式行使對(duì)內(nèi)容的選擇權(quán)利,客觀(guān)上具有對(duì)內(nèi)容創(chuàng)作的引導(dǎo)作用,商業(yè)媒體、自媒體等都會(huì)研究和分析不同平臺(tái)的算法特點(diǎn),謀求更多的內(nèi)容推薦和傳播。如果算法中融入了社會(huì)價(jià)值,就會(huì)促進(jìn)內(nèi)容生態(tài)向更健康的方向發(fā)展。如果說(shuō)落實(shí)平臺(tái)責(zé)任、提升用戶(hù)素質(zhì)是為了盡量減少網(wǎng)上的“淤泥”,而對(duì)算法的優(yōu)化則是為了做到“出淤泥而不染”。之前是將價(jià)值堅(jiān)守融入專(zhuān)業(yè)媒體人的工作,算法時(shí)代要將主流價(jià)值觀(guān)念、信息傳播倫理融入工程師的設(shè)計(jì)目標(biāo)和流程,由于代碼被認(rèn)為是網(wǎng)絡(luò)空間的“法律”,這樣做可以將制度的宏觀(guān)原則融入技術(shù)的微觀(guān)建構(gòu)之中。
美國(guó)等國(guó)家在幾年前已開(kāi)始加強(qiáng)工程師在技術(shù)研發(fā)和產(chǎn)品開(kāi)發(fā)中的倫理責(zé)任教育,谷歌和臉書(shū)等信息平臺(tái)也更加重視新聞傳播的倫理問(wèn)題。基于對(duì)重大主題宣傳等主流價(jià)值信息的人工標(biāo)注,依托機(jī)器學(xué)習(xí)訓(xùn)練正能量算法,并建立專(zhuān)門(mén)的色情、謾罵、低俗等風(fēng)險(xiǎn)識(shí)別和過(guò)濾模型,如何發(fā)揮人工智能在優(yōu)質(zhì)信息傳播和不良信息治理上的作用、實(shí)現(xiàn)智能分發(fā)時(shí)代的智能管網(wǎng)治網(wǎng)值得進(jìn)一步探索。而要實(shí)現(xiàn)全行業(yè)算法的持續(xù)優(yōu)化,急需政府、協(xié)會(huì)指導(dǎo)行業(yè)制定信息智能推薦算法的價(jià)值標(biāo)準(zhǔn)和開(kāi)發(fā)規(guī)范,對(duì)算法的目標(biāo)、特征、流程、人在其中的作用發(fā)揮等作出明確的規(guī)定,并予以有力有效的執(zhí)行。
防范算法黑箱的潛在風(fēng)險(xiǎn),促進(jìn)透明化
基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),將抓取的數(shù)據(jù)分為數(shù)以千萬(wàn)計(jì)的變量來(lái)自動(dòng)加權(quán)計(jì)算,并輸出結(jié)果,對(duì)于其中極其復(fù)雜的計(jì)算過(guò)程,人們依據(jù)現(xiàn)有的科學(xué)知識(shí)和原理難以理解。因此,一些信息智能推薦算法也可能產(chǎn)生算法黑箱問(wèn)題,這是信息傳播領(lǐng)域的新現(xiàn)象。由深度學(xué)習(xí)自動(dòng)生成的算法,不但對(duì)廣大普通用戶(hù)來(lái)說(shuō)其中的很多細(xì)節(jié)難以理解,就是對(duì)專(zhuān)業(yè)的技術(shù)人員也難以分析和解釋。
由于智能算法的不透明性,加之其實(shí)時(shí)動(dòng)態(tài)的變化,可能使其在產(chǎn)生問(wèn)題時(shí)難以及時(shí)被發(fā)現(xiàn)和監(jiān)督,而算法來(lái)自于社會(huì)上大數(shù)據(jù)的訓(xùn)練,機(jī)器很容易習(xí)得既有的偏見(jiàn),甚至滋生對(duì)輸出結(jié)果的惡意利用,將負(fù)面的效應(yīng)放大。特別是類(lèi)型化、標(biāo)簽化是算法設(shè)計(jì)中的一個(gè)重要思想,在“人以群分”中就很容易固化社會(huì)偏見(jiàn),如基于性別、種族、年齡對(duì)職業(yè)發(fā)展能力、犯罪概率做出預(yù)測(cè),經(jīng)由算法對(duì)社會(huì)“刻板印象”的清晰化和固化,就很容易對(duì)群體中的個(gè)體作出誤判和傷害。
例如,一些社交網(wǎng)絡(luò)為了減少對(duì)用戶(hù)體驗(yàn)的干擾,在一定階段內(nèi)對(duì)信息流廣告的數(shù)量有所控制,在一定時(shí)期內(nèi)只選取比較高端的廣告品牌,并基于智能算法的分析只對(duì)高端用戶(hù)定推,這一做法還一度在網(wǎng)上成為網(wǎng)民的討論熱點(diǎn),能看到推送廣告的以自己“高端”而自得,沒(méi)看到廣告的自嘲自己是“低端用戶(hù)”,還有自認(rèn)為是高端用戶(hù)的人抱怨為什么沒(méi)有看到廣告推送。這雖然只是網(wǎng)民的自我調(diào)侃,但也反映了推薦算法的分類(lèi)思想可能帶來(lái)的一些偏差。相比之下,基于算法的差別化定價(jià)就是一種價(jià)格歧視,這不限于實(shí)物商品,在信息付費(fèi)、知識(shí)付費(fèi)的時(shí)代,推薦算法對(duì)內(nèi)容產(chǎn)品的歧視性定價(jià)也可能發(fā)生。
人們擁有著對(duì)“可解釋性”的追求,歐盟《一般數(shù)據(jù)保護(hù)條例》就規(guī)定消費(fèi)者有對(duì)自動(dòng)化決策的“解釋權(quán)”,在某些條件下有權(quán)利不接受完全由人工智能自動(dòng)化系統(tǒng)做出的重大決定。難點(diǎn)是如何在現(xiàn)實(shí)場(chǎng)景中科學(xué)有效地實(shí)現(xiàn)。算法透明化作為一種可選方式被寄予希望,從當(dāng)前國(guó)內(nèi)外的實(shí)踐看,算法原理的透明化比程序代碼的透明化更切實(shí)可行。智能生成的算法代碼復(fù)雜難懂并動(dòng)態(tài)變化,一般認(rèn)為,公布后無(wú)助于消除社會(huì)的擔(dān)憂(yōu),副作用卻很明顯,如涉及企業(yè)的核心商業(yè)機(jī)密、損害企業(yè)知識(shí)產(chǎn)權(quán),代碼可能被別有用心的人利用,開(kāi)展危害社會(huì)和企業(yè)安全的活動(dòng)。
而算法原理透明化不糾纏于代碼這一過(guò)程性的中間環(huán)節(jié),體現(xiàn)了目標(biāo)管理和結(jié)果導(dǎo)向的思想。雖然黑箱問(wèn)題在信息傳播領(lǐng)域是新現(xiàn)象,但在其他領(lǐng)域古已有之。我國(guó)傳統(tǒng)的中醫(yī)診治和中醫(yī)藥就是典型的黑箱現(xiàn)象,古時(shí)候的大夫并不了解人體器官的內(nèi)部細(xì)節(jié),也不了解中草藥的化學(xué)成分和分子結(jié)構(gòu),但仍可通過(guò)自身的“望聞問(wèn)切”和不同藥材的搭配,達(dá)到治病救人的目的。
防范算法黑箱的潛在風(fēng)險(xiǎn),促進(jìn)算法的透明化,需要目標(biāo)設(shè)定的公平正義和公開(kāi)透明,算法原理科學(xué)以實(shí)現(xiàn)正確的目標(biāo),在有人工訓(xùn)練的情況下,在社會(huì)價(jià)值指引下正確選取指標(biāo)和行為特征,避免產(chǎn)生系統(tǒng)性偏見(jiàn)和歧視。對(duì)算法的輸出結(jié)果要形成信息平臺(tái)、用戶(hù)、新聞媒體、專(zhuān)業(yè)機(jī)構(gòu)、政府等內(nèi)外部的監(jiān)測(cè)體系,及時(shí)發(fā)現(xiàn)偏差并對(duì)算法進(jìn)行優(yōu)化改進(jìn),防止算法輸出落入“自證正確”的錯(cuò)誤循環(huán)。同時(shí),對(duì)算法黑箱問(wèn)題也可用人工智能輔助分析等方式來(lái)探索,在這方面國(guó)外已有一些研究和嘗試,我們可以借鑒。(作者:袁祥、王一)
