“有些人認(rèn)為,算法推薦讓用戶的興趣窄化。如果長(zhǎng)久使用推薦系統(tǒng),用戶的見識(shí)、知識(shí)、見解得不到提高?!泵鎸?duì)這樣的質(zhì)疑,字節(jié)跳動(dòng)(今日頭條)資深算法架構(gòu)師曹歡歡日前表示:“這是對(duì)算法的誤解。”
曹歡歡解釋稱,聰明的算法工程師都不希望自己的用戶興趣窄化,就像沒(méi)有一個(gè)商場(chǎng)的經(jīng)理,希望顧客每一次來(lái)到商場(chǎng)都只關(guān)注同一類別的商品。商場(chǎng)經(jīng)理都希望顧客關(guān)注盡可能多的產(chǎn)品品類,算法工程師也希望用戶盡可能的拓展自己的興趣。
曹歡歡還介紹,實(shí)際上行業(yè)內(nèi)一直都在利用推薦系統(tǒng)探索拓展用戶興趣,提升內(nèi)容多樣性,現(xiàn)在主流的技術(shù)是用深度學(xué)習(xí)做推薦。并且,根據(jù)觀察發(fā)現(xiàn),推薦內(nèi)容的多樣性越好,用戶的長(zhǎng)期留存概率越大。
在今日頭條首先在資訊領(lǐng)域應(yīng)用推薦系統(tǒng)之后,現(xiàn)在推薦系統(tǒng)被越來(lái)越多的行業(yè)應(yīng)用。對(duì)于推薦系統(tǒng)的開發(fā)者來(lái)說(shuō),推薦系統(tǒng)的設(shè)計(jì)存在著不同層次的目標(biāo),有短期目標(biāo)、中期目標(biāo)、長(zhǎng)期目標(biāo)。
長(zhǎng)期目標(biāo)是利用推薦系統(tǒng)運(yùn)營(yíng)好一個(gè)業(yè)務(wù),提升用戶的長(zhǎng)期黏性。對(duì)于今日頭條來(lái)說(shuō),曹歡歡表示,希望用戶用了今日頭條等應(yīng)用之后,能一直用下去,成為我們的忠實(shí)用戶。要想讓用戶長(zhǎng)期使用,用戶體驗(yàn)就需要做得很好。
與長(zhǎng)期目標(biāo)相對(duì)應(yīng)的,是中期目標(biāo)和短期目標(biāo),中期目標(biāo)是指在短期窗口內(nèi)提高它的黏性,比如一周留存、一月留存?,F(xiàn)在推薦系統(tǒng)業(yè)內(nèi)也在做一些探索,比如利用強(qiáng)化學(xué)習(xí)的學(xué)習(xí)范式設(shè)計(jì),而不用監(jiān)督學(xué)習(xí)。
短期目標(biāo)是指用戶短時(shí)間內(nèi)對(duì)用戶的反饋。給用戶推了一篇文章,用戶有沒(méi)有點(diǎn)開、點(diǎn)贊。抖音推的短視頻,有沒(méi)有播放、點(diǎn)贊、分享。
因?yàn)槎唐谀繕?biāo)大家的感知性比較強(qiáng),因?yàn)橐苍斐闪艘恍┤藢?duì)推薦系統(tǒng)的誤解。曹歡歡介紹稱,短期目標(biāo)和長(zhǎng)期目標(biāo)的關(guān)系,有正相關(guān)性,又不能完全用短期目標(biāo)代替長(zhǎng)期目標(biāo)。根據(jù)我們的觀察發(fā)現(xiàn),推薦內(nèi)容的多樣性越好,用戶的長(zhǎng)期留存概率越大。如果只是推高熱內(nèi)容,用戶短時(shí)間也點(diǎn)擊,也停留了,今天看了也很爽。但是內(nèi)容的多樣性不好,很單一,用戶的長(zhǎng)期留存就很差。
曹歡歡舉例說(shuō),這和商場(chǎng)的經(jīng)營(yíng)類似,一個(gè)喜歡鞋子的用戶,假如每次來(lái)商場(chǎng)都能快速買到自己喜歡的鞋子,用戶的單次消費(fèi)就很開心,但最終用戶會(huì)減少來(lái)這個(gè)商場(chǎng)的消費(fèi)次數(shù),除非他又產(chǎn)生了買鞋子的需求。要把用戶長(zhǎng)期留存下來(lái),就要穿透他的興趣,拓展他的視野,讓他衣服、飲食、看電影這些消費(fèi),都在商場(chǎng)里完成。
因此,對(duì)于內(nèi)容平臺(tái)來(lái)說(shuō),提升內(nèi)容的多樣性,也是平臺(tái)的需要。所以從推薦系統(tǒng)設(shè)計(jì)者來(lái)講,非常希望推薦系統(tǒng)既短期數(shù)據(jù)有很好的表現(xiàn),也希望推的內(nèi)容是多樣化的,能滿足用戶多個(gè)興趣點(diǎn)。甚至需要挖掘用戶更多的興趣點(diǎn),盡量在一個(gè)平臺(tái)上滿足用戶更多的興趣點(diǎn)。
曹歡歡表示,一方面是推薦策略上,推薦系統(tǒng)設(shè)計(jì)中,會(huì)采用一些策略幫助系統(tǒng)避免內(nèi)容窄化,包括消重策略、打散策略。消重策略是指系統(tǒng)會(huì)對(duì)推薦的內(nèi)容進(jìn)行各種層次的分析,會(huì)識(shí)別哪兩篇文章或者視頻是非常類似的,比如雖然兩篇文章遣詞造句不一樣,但講的內(nèi)容是同一件事,對(duì)于這類相似的文章,如果給用戶推薦了文章A,跟文章A相似的其他文章就不會(huì)被推薦。
打散策略是指對(duì)于同一個(gè)方向或同一類主題的文章,比如都是足球的文章,會(huì)利用算法來(lái)保證推薦的頻率不會(huì)太高,避免用戶在前端感覺(jué)內(nèi)容的同質(zhì)化,保證內(nèi)容多樣性。
另一方面,是推薦模型本身,會(huì)針對(duì)性的做一些探索拓展用戶興趣、提升內(nèi)容多樣性的設(shè)計(jì)。
曹歡歡介紹稱,其實(shí)早在十幾年前的老一代協(xié)同過(guò)濾技術(shù),就已經(jīng)在考慮拓展用戶興趣了。協(xié)同過(guò)濾的做法非常簡(jiǎn)單、直觀,推薦系統(tǒng)會(huì)考慮你跟哪個(gè)用戶比較像,比如你們都點(diǎn)了同一類內(nèi)容,都喜歡同一類的電影,然后把相似用戶看過(guò)的,但你還沒(méi)看過(guò)的內(nèi)容推薦給你,通過(guò)相似用戶的手段實(shí)現(xiàn)了興趣的探索。
技術(shù)發(fā)展到現(xiàn)在,已經(jīng)有很多高端技術(shù)在探索用戶興趣、提升內(nèi)容多樣性,曹歡歡表示,現(xiàn)在主流的技術(shù)是用深度學(xué)習(xí)做推薦,在深度學(xué)習(xí)里面有很多方法,包括網(wǎng)絡(luò)可以做一些特殊的設(shè)置,讓它學(xué)一些新東西。因?yàn)樗杏脩?、所有?nèi)容都是高維空間的向量,可以有意識(shí)引導(dǎo)模型,讓它學(xué)習(xí)一些可能感興趣的內(nèi)容,雖然它的興趣標(biāo)簽和你不一樣。但是在這個(gè)空間里面,映射到很近的點(diǎn),讓模型容易推出去,這里面有很多高端的做法。
流量層面,曹歡歡表示公司的產(chǎn)品通常會(huì)留一部分比例流量,用來(lái)探索用戶的興趣。甚至?xí)奚唐谀繕?biāo),比如用戶某些下刷操作,會(huì)被用來(lái)推薦一些模型不確認(rèn)用戶是不是感興趣的內(nèi)容,用來(lái)探索用戶的興趣。
據(jù)了解,今日頭條對(duì)于很多重要新聞,以及部分小眾熱點(diǎn)新聞,都會(huì)進(jìn)行熱點(diǎn)運(yùn)營(yíng),通過(guò)專題、熱點(diǎn)等方式直接推給用戶。曹歡歡表示,他們認(rèn)為搜索和推薦都是非常重要的信息獲取的渠道,搜索也能夠反過(guò)來(lái)幫助推薦更了解用戶,推薦更豐富的內(nèi)容給用戶。