①抖音上線了安全與信任中心網(wǎng)站,網(wǎng)站公開(kāi)了抖音算法推薦系統(tǒng)的原理、用戶(hù)行為背后的算法推薦邏輯,以及平臺(tái)人工治理識(shí)別各類(lèi)風(fēng)險(xiǎn)等內(nèi)容; ②抖音推薦算法的核心邏輯是,綜合預(yù)測(cè)用戶(hù)行為概率和用戶(hù)行為價(jià)值權(quán)重,來(lái)確定視頻推薦優(yōu)先級(jí)。
《科創(chuàng)板日?qǐng)?bào)》4月17日訊(記者 張洋洋)針對(duì)算法引發(fā)的種種爭(zhēng)議,抖音公布算法原理,力圖以提升透明度來(lái)回應(yīng)公眾質(zhì)疑。
近期,抖音上線了安全與信任中心網(wǎng)站,網(wǎng)站公開(kāi)了抖音算法推薦系統(tǒng)的原理、用戶(hù)行為背后的算法推薦邏輯以及平臺(tái)人工治理識(shí)別各類(lèi)風(fēng)險(xiǎn)等內(nèi)容。該網(wǎng)站目前還處于試運(yùn)行階段,正廣泛向用戶(hù)、創(chuàng)作者、社會(huì)各界征集意見(jiàn)。
在抖音開(kāi)放日上,抖音算法工程師劉暢和抖音生態(tài)運(yùn)營(yíng)經(jīng)理陳丹丹等人,也再度闡釋了算法技術(shù)原理和平臺(tái)的治理規(guī)則。
總結(jié)來(lái)講,抖音方面稱(chēng),抖音推薦算法的核心邏輯是,綜合預(yù)測(cè)用戶(hù)行為概率和用戶(hù)行為價(jià)值權(quán)重來(lái)確定視頻推薦優(yōu)先級(jí)。
根據(jù)抖音安全與信任中心網(wǎng)站的介紹,當(dāng)用戶(hù)打開(kāi)抖音時(shí),抖音的推薦算法會(huì)給候選視頻打分,并把得分最高的視頻推送給用戶(hù)。用戶(hù)在觀看時(shí)可以對(duì)看到的視頻做出各種互動(dòng),這些互動(dòng)體現(xiàn)了用戶(hù)對(duì)這個(gè)視頻的感興趣程度。比如用戶(hù)點(diǎn)贊比不點(diǎn)贊要好,看完比沒(méi)看完要好,沒(méi)有點(diǎn)不喜歡比點(diǎn)不喜歡好。在這里,“看完了”就是一次反饋動(dòng)作,“點(diǎn)贊”也是一次反饋動(dòng)作。
用戶(hù)對(duì)觀看的視頻的每一次反饋,都有正面或者負(fù)面的價(jià)值。抖音的推薦排序模型學(xué)習(xí)的也就是這種行為反饋,推薦系統(tǒng)的目標(biāo)就是把反饋價(jià)值最高的視頻推給用戶(hù)。
▍抖音的算法原理是什么?
在接受《科創(chuàng)板日?qǐng)?bào)》等媒體采訪時(shí),抖音算法工程師劉暢介紹,抖音的推薦算法與國(guó)內(nèi)外大部分內(nèi)容推薦平臺(tái)相似,包含召回、過(guò)濾、排序等環(huán)節(jié),重點(diǎn)是學(xué)習(xí)用戶(hù)行為。
抖音基于用戶(hù)行為的推薦方法包含多種技術(shù)模型,如協(xié)同過(guò)濾、雙塔召回、Wide&Deep模型等。算法可以在完全“不理解內(nèi)容”的情況下,找到興趣相似的用戶(hù),把其他人感興趣的內(nèi)容推薦給該用戶(hù)。“協(xié)同過(guò)濾”推薦算法是最經(jīng)典的推薦算法之一,至今仍然在廣泛使用。
所謂“協(xié)同過(guò)濾”推薦,簡(jiǎn)單來(lái)說(shuō)就是協(xié)同用戶(hù)的行為,一起對(duì)海量的信息進(jìn)行過(guò)濾,從中更加快速篩選出用戶(hù)可能會(huì)產(chǎn)生行為(比如完播、點(diǎn)贊)的內(nèi)容。
基于內(nèi)容的協(xié)同過(guò)濾的大致過(guò)程是這樣的。比如用戶(hù) A 觀看了內(nèi)容 X、Y、Z,用戶(hù) B 觀看了內(nèi)容 X、Z、W,那么X 和 Z 之間就有較高的相似度。然后根據(jù)用戶(hù)對(duì)已觀看或已評(píng)分內(nèi)容的偏好,為用戶(hù)推薦與這些內(nèi)容相似的其他內(nèi)容。
重點(diǎn)是計(jì)算內(nèi)容之間的相似度,根據(jù)用戶(hù)的行為數(shù)據(jù),找出與目標(biāo)內(nèi)容相似的其他內(nèi)容。這種方法在內(nèi)容數(shù)量相對(duì)穩(wěn)定、用戶(hù)數(shù)量較大的場(chǎng)景下表現(xiàn)較好。目前,抖音算法已幾乎不依賴(lài)對(duì)內(nèi)容和用戶(hù)打標(biāo)簽,而是通過(guò)神經(jīng)網(wǎng)絡(luò)計(jì)算,預(yù)估用戶(hù)行為,計(jì)算用戶(hù)觀看這條內(nèi)容獲得的價(jià)值總和,把排名靠前的內(nèi)容推給用戶(hù)。
雖然算法能學(xué)習(xí)、預(yù)估用戶(hù)行為,但因其無(wú)法理解內(nèi)容語(yǔ)義,對(duì)內(nèi)容的理解存在不足,可能導(dǎo)致違法違規(guī)、不良內(nèi)容被推薦傳播。因此,算法在真實(shí)使用場(chǎng)景中,必須由平臺(tái)治理對(duì)其進(jìn)行約束和規(guī)范。
以抖音為例,據(jù)抖音生態(tài)運(yùn)營(yíng)經(jīng)理陳丹丹介紹,抖音的內(nèi)容治理體系是“人工參與+機(jī)器學(xué)習(xí)”相結(jié)合的模式,并組建了專(zhuān)門(mén)的平臺(tái)治理團(tuán)隊(duì)為算法設(shè)置“護(hù)欄”,抖音平臺(tái)治理體系包括異常感知、標(biāo)準(zhǔn)定義、機(jī)器識(shí)別、人工研判、風(fēng)險(xiǎn)處置等過(guò)程。
所有在平臺(tái)發(fā)布的內(nèi)容都會(huì)經(jīng)過(guò)評(píng)估,流量越高的內(nèi)容評(píng)估次數(shù)越多,標(biāo)準(zhǔn)也越嚴(yán)格;抖音內(nèi)容審核采用“人工+機(jī)器”相互配合的模式,“機(jī)器”負(fù)責(zé)“寬度”評(píng)估所有投稿,“人工”負(fù)責(zé)“深度”,確保專(zhuān)業(yè)、敏感或疑難等問(wèn)題盡可能精準(zhǔn)研判。
劉暢稱(chēng),抖音更關(guān)注用戶(hù)長(zhǎng)期價(jià)值,而非追求平臺(tái)的短期數(shù)據(jù)。為此,抖音算法考慮了眾多目標(biāo),如完播、評(píng)論、點(diǎn)贊、對(duì)作者長(zhǎng)期消費(fèi)、分享、跟拍等,力圖計(jì)算出更符合用戶(hù)長(zhǎng)期價(jià)值的目標(biāo)。
▍仍將提升治理透明度
去年年底以來(lái), 伴隨著各種社會(huì)熱點(diǎn)事件,社會(huì)各界對(duì)算法議題關(guān)注度再度攀升。
一方面,推薦算法幫助信息高效分發(fā)和連接,幫助小眾內(nèi)容、小城文旅、瀕危戲曲、寶藏商家等被大眾看到。另一方面,公眾和輿論對(duì)算法有不同解讀,典型就是“信息繭房”“平臺(tái)造神”“謠言傳播”等問(wèn)題,比如此前的郭有才走紅事件就引發(fā)了公眾對(duì)“平臺(tái)造神”等的爭(zhēng)議。
在抖音安全與信任中心網(wǎng)站上,《科創(chuàng)板日?qǐng)?bào)》記者注意到,抖音也設(shè)置了專(zhuān)門(mén)的板塊來(lái)回應(yīng),如網(wǎng)紅是平臺(tái)“強(qiáng)推”出來(lái)的嗎、網(wǎng)紅是平臺(tái)“強(qiáng)推”出來(lái)的嗎、App會(huì)“竊聽(tīng)”用戶(hù)談話嗎等。
抖音稱(chēng),算法決定了現(xiàn)象級(jí)的“網(wǎng)紅”都是廣大用戶(hù)“海選”出來(lái)的。推薦算法只能預(yù)估用戶(hù)的點(diǎn)贊、轉(zhuǎn)發(fā)等行為,而內(nèi)容是讓用戶(hù)產(chǎn)生這些行為的關(guān)鍵。
比如,一個(gè)美食博主的烹飪視頻,畫(huà)面精美、步驟清晰且創(chuàng)意十足,算法將其與有烹飪學(xué)習(xí)需求的用戶(hù)匹配,視頻得以被推送。但這不是強(qiáng)推,而是算法基于內(nèi)容與用戶(hù)需求的精準(zhǔn)對(duì)接。
創(chuàng)作者走紅是多個(gè)因素共同作用的結(jié)果,其中最主要的原因是用戶(hù)最大公約數(shù)的選擇——即用戶(hù)通過(guò)點(diǎn)贊、留言、關(guān)注、分享等行為,對(duì)自己認(rèn)同的內(nèi)容“投票”。一旦算法啟動(dòng),它就會(huì)尊重廣大用戶(hù)的選擇。
確實(shí)有一些作者在短時(shí)間內(nèi)獲得粉絲暴漲,他們往往是社會(huì)熱點(diǎn)事件的當(dāng)事人,也有創(chuàng)作者因單條作品與社會(huì)情緒共鳴、獲得媒體報(bào)道而吸引了大量關(guān)注。但是,要想接住這偶然的潑天流量,持續(xù)走紅,并不容易。
抖音作為一款國(guó)民級(jí)短視頻App,在這里發(fā)生極具爭(zhēng)議性的社會(huì)熱點(diǎn)事件,更容易使平臺(tái)成為眾矢之的。
可以看到,抖音正在通過(guò)種種舉措來(lái)提升算法和治理的透明度,以回應(yīng)公眾關(guān)切和質(zhì)疑。
也就是在抖音平臺(tái)發(fā)生多起爭(zhēng)議性社會(huì)事件之后,從去年12月以來(lái),抖音集團(tuán)副總裁李亮便頻繁活躍在微博上發(fā)言,公開(kāi)解釋各種平臺(tái)相關(guān)事件。
抖音方面稱(chēng),后續(xù)將持續(xù)增加算法和治理透明度,將在安全與信任中心,主動(dòng)公示違規(guī)案例治理情況。