精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

微博推薦實(shí)時(shí)大模型的技術(shù)演進(jìn)

作者：高家華 2023-04-26 07:56:45

人工智能機(jī)器學(xué)習(xí)

本文將介紹近年來推薦大模型的演進(jìn)，以及其中一些重要的技術(shù)點(diǎn)（本文基于2022年底在DataFun的分享成文，僅代表當(dāng)時(shí)的技術(shù)和業(yè)務(wù)情況）。

一、技術(shù)路線回顧

1、業(yè)務(wù)場景與特點(diǎn)

本團(tuán)隊(duì)在微博 APP 中負(fù)責(zé)的推薦業(yè)務(wù)主要包括：

① 首頁推薦下的所有 tab 欄的內(nèi)容，信息流產(chǎn)品一般都是第一個(gè) tab 流量占比較高；

② 熱搜向下滑進(jìn)入的一個(gè)信息流，這也是我們的業(yè)務(wù)場景，也包括這個(gè)頁面上的其他信息流 tab，比如視頻頻道等；

③ 在整個(gè) APP 當(dāng)中搜索或者點(diǎn)擊推薦視頻，進(jìn)入的沉浸視頻場景。

我們的業(yè)務(wù)具有如下一些特點(diǎn)：

（1）首先，從推薦實(shí)現(xiàn)的視角來看：

① 業(yè)務(wù)場景多。

② 微博 UI 上用戶對操作和反饋多樣，內(nèi)容既可以點(diǎn)擊進(jìn)入正文頁觀看，也可以在流內(nèi)消費(fèi)，流內(nèi)反饋多樣如點(diǎn)進(jìn)博主個(gè)人頁、點(diǎn)進(jìn)正文頁、點(diǎn)圖片、點(diǎn)視頻、轉(zhuǎn)評贊等。

③ 可分發(fā)的物料類型多，如首頁推薦可分發(fā)長圖、圖片（一圖或多圖）、視頻（橫版或豎版視頻）、文章等。

（2）從產(chǎn)品定位角度來看：

① 服務(wù)熱點(diǎn)：微博在熱點(diǎn)爆發(fā)前后，流量變化特別大，用戶能在推薦里面順暢消費(fèi)熱點(diǎn)內(nèi)容，是公司對推薦產(chǎn)品的要求。

② 構(gòu)建關(guān)系：希望在推薦的微博里沉淀一些社交關(guān)系。

2、技術(shù)選型

下圖展示了我們這幾年的技術(shù)進(jìn)步脈絡(luò)。

當(dāng)前的推薦框架來講千億特征、萬億參數(shù)是標(biāo)配。與 NLP 和 CV 不同，這兩個(gè)方向太大的模型是網(wǎng)絡(luò)本身復(fù)雜度高，推薦場景有較好的稀疏性，模型尺寸比較大，訓(xùn)練往往使用數(shù)據(jù)并行的方式，每個(gè)用戶 serving 并不需要全部模型參數(shù)。

本團(tuán)隊(duì)從 2018 年至 2022 年的技術(shù)演進(jìn)，主要是大規(guī)模和實(shí)時(shí)性兩個(gè)方面。在此基礎(chǔ)上再做復(fù)雜結(jié)構(gòu)，來達(dá)到事半功倍的效果。

這里簡要介紹一下我們的 Weidl 在線學(xué)習(xí)平臺。

主要流程為：用戶行為拼接樣本，給模型來進(jìn)行學(xué)習(xí)，再推薦給用戶反饋回來，整體采用數(shù)據(jù)流優(yōu)先的設(shè)計(jì)原則來達(dá)到更好的靈活性。無論使用什么方式訓(xùn)練 KERNEL，離線的模型存儲和在線的 PS 之間的實(shí)時(shí)更新部分還是在的。不管是用手寫的 LR 或 FM，或者 Tensorflow，或者 DeepRec 訓(xùn)練模型都是可以的，對應(yīng)的模型存儲都是我們自己搭建的一套數(shù)據(jù)流，模型格式也是我們自己做的，從而保證多 Backend 下從模型訓(xùn)練到線上更新能夠在分鐘級以下，下次用戶調(diào)用時(shí)能用到新的參數(shù)。在這種設(shè)計(jì)原則下，可以很方便的切換 Backend。

Weidl 是微博自研機(jī)器學(xué)習(xí)平臺，其中 Bridge 模式可以調(diào)用各個(gè)深度學(xué)習(xí)框架的算子，也可以不用 Bridge 模式，替換成自研算子也很方便。比如我們之前使用 Tensorflow，會(huì)對 tf 進(jìn)行一些內(nèi)存分配和算子的優(yōu)化，2022 年下半年切換到 DeepRec，對 DeepRec 多一些了解之后，會(huì)發(fā)現(xiàn)之前基于 tf 的一些性能上的優(yōu)化點(diǎn)和 DeepRec 是殊途同歸的。

下圖中列出了本團(tuán)隊(duì)這些年做的一些版本，方便大家理解我們業(yè)務(wù)中各個(gè)技術(shù)點(diǎn)的貢獻(xiàn)度，首先是用基于 FM 的模型解決大規(guī)模實(shí)時(shí)推薦問題，后面依次做了基于深度的復(fù)雜結(jié)構(gòu)。從結(jié)果來看，前面使用非深度模型解決在線實(shí)時(shí)問題帶來的收益也很大。

信息流推薦與商品的推薦不同，信息流推薦基本都是大規(guī)模實(shí)時(shí)深度結(jié)構(gòu)。這塊也有一些難點(diǎn)和分歧點(diǎn)，比如：特征實(shí)時(shí)并不是模型實(shí)時(shí)的替代方案，對推薦系統(tǒng)來講，模型學(xué)到的才是比較重要的；另外在線學(xué)習(xí)確實(shí)會(huì)帶來一些迭代上的問題，但在絕對收益前，都是可以花時(shí)間克服的。

二、大模型近期技術(shù)迭代

這一章節(jié)會(huì)從目標(biāo)、結(jié)構(gòu)和特征幾方面來介紹業(yè)務(wù)的迭代模型。

1、多目標(biāo)融合

微博場景用戶操作很多，用戶表達(dá)對 Item 的喜歡會(huì)有很多種行為，比如點(diǎn)擊互動(dòng)、時(shí)長、下拉等，每個(gè)目標(biāo)都是要去建模預(yù)估，最后整體融合排序，這塊對推薦業(yè)務(wù)來講是很重要的。最開始做的時(shí)候，是通過靜態(tài)融合加離線搜參來做，后來通過強(qiáng)化學(xué)習(xí)的方法，變成動(dòng)態(tài)搜參，之后又做了一些融合公式優(yōu)化，后面還改進(jìn)成通過模型來輸出一些融合分等。

強(qiáng)化調(diào)參的核心做法是，把線上流量分成一些小的流量池，通過一些線上當(dāng)前的參數(shù)，去生成一些新的參數(shù)，去看用戶對這些參數(shù)的反應(yīng)，收集反饋進(jìn)行迭代。其中比較核心的部分是 reward 的計(jì)算，其中用了 CEM、ES。后邊用了自研的算法，以適應(yīng)自身業(yè)務(wù)需求。因?yàn)樵诰€學(xué)習(xí)變化是非常快的，參數(shù)要不能隨之變化的話就會(huì)出現(xiàn)比較大的問題，比如大家對于視頻類內(nèi)容的偏好從周五晚上到周六早上和周日晚上到周一早上，偏好的變化是非?？斓模麄€(gè)融合參數(shù)的變化要反映出用戶對一些東西的偏好的變化。

下面是模型優(yōu)化中的一些小 trick，用戶每天使用是帶周期性的，每天定時(shí) init 校正是比較好的，不然可能會(huì)走到比較偏的分支；參數(shù)初始化的時(shí)候要服從先驗(yàn)分布，先進(jìn)行先驗(yàn)化分析，再去進(jìn)行差異化融合；加入異常檢測機(jī)制，保證融合參數(shù)能一致迭代更新。

融合公式一開始選用加法融合，當(dāng)時(shí)業(yè)務(wù)目標(biāo)還沒有那么多，后來隨著目標(biāo)增多，發(fā)現(xiàn)加法融合不方便支持加更多的目標(biāo)，會(huì)弱化各子目標(biāo)的重要性影響，后邊使用了乘法融合公式。效果如 ppt 所示：

在全量版本升級為多任務(wù)之后，在此版本上優(yōu)化成，通過模型進(jìn)行目標(biāo)融合。通過模型融合，能更好地捕捉很多非線性的東西，具有更好的表達(dá)力，這樣也能做到個(gè)性化融合，每個(gè)用戶融出來的東西是不一樣的。

2、多任務(wù)

多任務(wù)是從 2019 年、2020 年開始火起來的一個(gè)概念，推薦系統(tǒng)往往需要同時(shí)關(guān)注多個(gè)目標(biāo)，比如我們的業(yè)務(wù)場景里有七個(gè)目標(biāo)：點(diǎn)擊、時(shí)長、互動(dòng)、完播、負(fù)反饋、進(jìn)主頁、下拉刷新等。對每個(gè)目標(biāo)各訓(xùn)練一個(gè)模型會(huì)消耗較多的資源且繁瑣。并且，有些目標(biāo)是稀疏的，有些則相對稠密一些，如果分開單獨(dú)做模型，那些比較稀疏的目標(biāo)一般不容易學(xué)好，放在一起學(xué)習(xí)能解決稀疏目標(biāo)學(xué)習(xí)的問題。

推薦多任務(wù)建模入門一般是從 MMOE 開始，到 SNR，再到 DMT，最后到全量的 MM，其實(shí)就是在 SNR 上做了融合網(wǎng)絡(luò)等優(yōu)化。

在做多任務(wù)之前，重點(diǎn)要解決的問題包括：多目標(biāo)之間各個(gè) loss 是否有沖突，彼此是否會(huì)有蹺蹺板效應(yīng)；樣本空間不一致的問題；loss 平衡問題等。在實(shí)際經(jīng)驗(yàn)中，無論是 PCGrad，UWL 的方法在測試數(shù)據(jù)都會(huì)體現(xiàn)出其作用，但如果放大到生產(chǎn)環(huán)境中，去在線學(xué)習(xí)不斷訓(xùn)練的話，這些方法的作用就會(huì)衰減的比較快，反而根據(jù)經(jīng)驗(yàn)去設(shè)定一些值在整個(gè)在線實(shí)習(xí)環(huán)境中也不是不可行，這塊也不太確定是不是跟在線學(xué)習(xí)相關(guān)，還是與樣本量有關(guān)。單獨(dú)做 MMOE 的效果也是比較好的，左邊是業(yè)務(wù)上實(shí)際的一些收益點(diǎn)。

下面是從 MMOE 開始的一些技術(shù)演進(jìn)。開始做多任務(wù)一般是做簡單的硬連接，后面到 MMOE，再到 SNR 或者 PLE，這些都是近年來業(yè)界比較成熟的方法。本團(tuán)隊(duì)使用的是SNR，并且進(jìn)行了兩個(gè)優(yōu)化。下圖下半部分，最左邊是 SNR 標(biāo)準(zhǔn) paper 的做法，我們把 expert 內(nèi)部的 transformation 進(jìn)行了簡化。同時(shí)會(huì)有獨(dú)享的專家和共享的專家，這里會(huì)根據(jù)一些實(shí)際業(yè)務(wù)中反饋的數(shù)據(jù)結(jié)論的實(shí)際值與估計(jì)偏差進(jìn)行一些分析，做一些單獨(dú)的專家。

3、多場景技術(shù)

我們所負(fù)責(zé)的推薦場景比較多，很自然想到使用一些多場景的技術(shù)。多任務(wù)是有些目標(biāo)比較稀疏，多場景是因?yàn)閳鼍坝写笥行?，小場景收斂的沒那么好，因?yàn)閿?shù)據(jù)量不足，而大場景的收斂比較好，即使兩個(gè)場景都差不多大，中間也會(huì)有一些涉及到知識遷移會(huì)對業(yè)務(wù)有收益，這也是最近比較熱的方向，和多任務(wù)在技術(shù)上有很多相通的點(diǎn)。

基于每個(gè)多任務(wù)模型，都可以做多場景模型，相比于多任務(wù)結(jié)構(gòu)，多加的是下圖中的 Slot-gate 層，相同的 Embedding 通過 Slot-gate 針對不同的場景表達(dá)不同的作用。通過 Slot-gate 的輸出可以分為三部分：連專家網(wǎng)絡(luò)、連進(jìn)目標(biāo)任務(wù)，或者連特征。

主模型主要是用 SNR 替換 CGC，跟多任務(wù)的迭代是一脈相成的。下面是當(dāng)前多任務(wù)和多場景混合在一起，在熱點(diǎn)和熱門兩個(gè)內(nèi)部業(yè)務(wù)場景下的應(yīng)用。其中首頁推薦為熱門流，發(fā)現(xiàn)頁推薦為熱點(diǎn)流。

整體結(jié)構(gòu)類似 SNR，上面為點(diǎn)擊、互動(dòng)和時(shí)長三個(gè)目標(biāo)塔。其中這三個(gè)目標(biāo)塔針對熱門和熱點(diǎn)兩個(gè)場景，細(xì)分為六個(gè)目標(biāo)。除外，增加了 Embeding transform layer，和 Slot-gate 不同的是，Slot-gate 是去找特征的重要性，而 Embeding transform layer 是考慮不同場景下 embedding 空間差異，去進(jìn)行 embedding 映射。有些特征在兩個(gè)場景中維度不同，通過 Embedding transform layer 進(jìn)行轉(zhuǎn)換。

4、興趣表征

興趣表征是這些年提的比較多的技術(shù)，從阿里的 DIN 到 SIM、DMT，已經(jīng)成為業(yè)界用戶行為序列建模的主流。

一開始使用的 DIN，對不同行為，構(gòu)建多個(gè)行為序列。引入 attention 機(jī)制給行為中不同物料予以不同權(quán)重，使用 local activation unit 來學(xué)習(xí)用戶序列與當(dāng)前候選排序物料的權(quán)重分布，實(shí)現(xiàn)了熱門精排方案，并取得了一定的業(yè)務(wù)收益。

DMT 的核心是把 Transformer 用在 multitask 上，本團(tuán)隊(duì)使用了簡化的 DMT 模型，移除了 bias 模塊，替換 MMoE 為 SNR，上線后也取得一定的業(yè)務(wù)效果。

Multi-DIN 是將多個(gè)序列展開，將候選物料的 mid，tag，authorid 等作為 query，分別對每個(gè)序列單獨(dú)做 attention 得到興趣表征后，拼接其他特征進(jìn)入多任務(wù)排序模型。

同時(shí)我們也做了實(shí)驗(yàn)發(fā)現(xiàn)，把序列拉的更長，比如將點(diǎn)擊、時(shí)長、互動(dòng)序列等，每個(gè)序列從 20 擴(kuò)到 50，效果更好，與 paper 中結(jié)論一致，不過序列更長需要更多的算力成本。

用戶生命周期超長序列建模和前面的長序列建模不同，不是通過請求特征就能拉到數(shù)據(jù)，而是離線構(gòu)造用戶的長行為序列特征；或者是通過一些搜索的方式，找到對應(yīng)的特征再去生成 embedding；或者是將主模型和超長序列模型分開建模，最終形成 embedding 送入主模型中。

在微博業(yè)務(wù)中，超長序列的價(jià)值沒有那么大，因?yàn)榛ヂ?lián)網(wǎng)上大家的關(guān)注點(diǎn)變化較快，比如熱搜的東西，一兩天就逐漸淡忘了，信息流中七天前的東西，分發(fā)就比較少了。因此太長的用戶行為序列，對于預(yù)估用戶對 item 的偏好價(jià)值會(huì)有一定程度的減弱。但對于低頻或者說回流用戶來說，這個(gè)結(jié)論一定程度上是不同的。

5、特征

使用超大規(guī)模的模型，在特征層面也會(huì)有一些困擾。比如有的特征理論上覺得會(huì)對模型有幫助，但加入后的效果并不能達(dá)到預(yù)期，這也是推薦業(yè)務(wù)面臨的現(xiàn)實(shí)情況。因?yàn)槟Ｐ鸵?guī)模非常大，模型中加了特別多 id 類的信息，已經(jīng)對一些用戶偏好有了不錯(cuò)的表達(dá)，這時(shí)再加一些統(tǒng)計(jì)上的特征，可能就沒那么好用，下面講下本團(tuán)隊(duì)實(shí)踐中比較好用的特征。

首先匹配特征效果都是比較不錯(cuò)的，用戶對于單個(gè)物料、單個(gè)內(nèi)容類型、單個(gè)發(fā)博者建立一些比較詳細(xì)的統(tǒng)計(jì)數(shù)據(jù)，都能帶來一些收益。

另外，多模態(tài)的特征也是比較有價(jià)值的，因?yàn)檎麄€(gè)推薦模型是基于用戶行為的，有一些低頻、冷門的 Item 在整個(gè)系統(tǒng)中用戶行為都是不足的，這時(shí)引入更多的先驗(yàn)知識能帶來更多收益。多模態(tài)通過引入 NLP 等技術(shù)引入一批語義進(jìn)來，對于低頻和冷啟動(dòng)都是有幫助的。

本團(tuán)隊(duì)做了兩種類型引入多模態(tài)特征的做法：第一種類型是把多模態(tài) embedding 融合進(jìn)推薦模型中，對底層這些 embedding 的梯度凍結(jié)，往上層的 MLP 再進(jìn)行更新；另一種方法是利用多模態(tài)在進(jìn)推薦模型之前先做聚類，把聚類的 id 扔進(jìn)推薦的模型進(jìn)行訓(xùn)練，這對于推薦模型來講是更容易引進(jìn)信息的方式，但也會(huì)丟失一些多模態(tài)具體的語義信息。

上面兩種方式，在我們的業(yè)務(wù)中都做了較多嘗試，第一種方法會(huì)帶來模型復(fù)雜度的提升，需要做很多空間變換，找特征重要性等，但能帶來不錯(cuò)的收益；第二種方法使用聚類 id 去學(xué)習(xí)，復(fù)雜度都在模型之外，線上服務(wù)也比較簡單，效果也能達(dá)到 90% 左右，而且還可以對聚類 id 做一些統(tǒng)計(jì)性的特征，結(jié)合起來效果很好。

加入多模態(tài)特征后，收益比較大的是高質(zhì)量的低曝光物料，能解決冷啟動(dòng)問題。推薦那些曝光比較少的物料，模型無法充分學(xué)習(xí)的，會(huì)很依賴多模態(tài)體帶來更多信息，對業(yè)務(wù)生態(tài)也是有正向價(jià)值的。

Co-action 的動(dòng)機(jī)是：嘗試 deepfm、wide deep 等多種特征交叉方式無果，懷疑是交叉特征與 DNN 部分共享 embedding 沖突導(dǎo)致。Co-action 相當(dāng)于加了存儲，單獨(dú)開辟存儲空間去做交叉，這里增加了表達(dá)空間，在業(yè)務(wù)中也拿到了不錯(cuò)的收益。

三、鏈路表達(dá)一致性

這部分是關(guān)于粗排和召回的內(nèi)容。對于推薦業(yè)務(wù)來講，雖然因?yàn)樗懔χС植涣藢装偃f的候選集都用精排來排，而分成召回、粗排、精排幾部分，但邏輯上是在講同個(gè)問題。如下圖舉例，粗排是會(huì)做截?cái)嗟?，最終給到精排的內(nèi)容只有 1000 左右，如果粗排和精排的表達(dá)差異較大，在截?cái)嗟倪^程中很可能會(huì)把將來精排分比較高的內(nèi)容截?cái)嗟簟＞藕痛峙诺奶卣鳌⒛Ｐ徒Y(jié)構(gòu)都不一樣，粗排一般和召回的框架比較類似，是向量檢索的近似結(jié)構(gòu)，特征會(huì)交叉比較晚，出現(xiàn)和精排模型表達(dá)差異是很自然的情況。如果能提升一致性，也會(huì)促進(jìn)業(yè)務(wù)指標(biāo)上漲，因?yàn)閮蛇吥茏プ⊥瑯拥淖兓厔荨?/span>

下圖展示了粗排一致性迭代過程中的技術(shù)脈絡(luò)，上面是雙塔的技術(shù)線，下面是 DNN 的技術(shù)線。由于雙塔的特征交互較晚，所以加了很多雙塔特征交叉的方式。但向量檢索的方式天花板有點(diǎn)太低了，所以從 2022 年開始，會(huì)有 DNN 分支來做粗排，這對于工程架構(gòu)的壓力比較大，比如要做特征篩選，網(wǎng)絡(luò)剪枝，性能優(yōu)化等，而且一次性打分的條數(shù)也會(huì)較之前有減少，但打的分更好了，因此條數(shù)變少也是可以接受的。

DSSM-autowide 是基于雙塔做了類似 Deep-FM 的交叉，帶來了業(yè)務(wù)指標(biāo)上的增幅，但下一個(gè)項(xiàng)目，換新的交叉方式，提升就沒有那么顯著了。

因此，我們覺得基于雙塔能做出的收益是比較有限的。我們還嘗試了基于雙塔做的多任務(wù)粗排模型，但還是繞不過雙塔問題。

基于上述問題，本團(tuán)隊(duì)對粗排模型進(jìn)行優(yōu)化，使用 DNN 和級聯(lián)模型做 Stacking 架構(gòu)。

級聯(lián)模型可以用雙塔先做一層篩選，篩選之后再過濾截?cái)嘟o粗排的 DNN 模型，相當(dāng)于在粗排這里內(nèi)部做了粗排和精排。換成 DNN 模型后，能支持更復(fù)雜的結(jié)構(gòu)，更快擬合用戶興趣變化等。

級聯(lián)在框架中起了比較重要的作用，如果沒有級聯(lián)模型的話，不太能從比較大的候選集中選出小候選集去給粗排的 DNN 來使用。級聯(lián)中比較重要的是怎么構(gòu)造樣本，可以看下圖。從百萬級的物料庫，召回幾千粗排，給精排 1000 內(nèi)的物料，最后曝光的是 20 條左右，用戶有行為的是個(gè)位數(shù)條數(shù)，整體是從更大的庫走到用戶有行為的漏斗過程。在做級聯(lián)的時(shí)候，核心點(diǎn)是每個(gè)部分都要進(jìn)行一些采樣，組成一些比較難的 pair 和比較簡單的 pair，來給級聯(lián)模型學(xué)習(xí)。

下圖是級聯(lián)優(yōu)化和全局負(fù)采樣帶來的收益，這里不做詳細(xì)介紹。

接下來介紹近期比較火熱的因果推斷。

我們使用因果推斷的動(dòng)機(jī)是，給用戶推的東西，如果推所有人都喜歡的東西，用戶點(diǎn)擊效果也不錯(cuò)，但用戶自己也有一些比較小眾的興趣，給用戶推這些小眾的物料，用戶也比較喜歡。這兩種東西對于用戶來講是一樣的，但對平臺來講，能推出來更小眾的東西是更個(gè)性化的，而模型更容易推出來的是第一種，因果推斷就是來解決這種問題的。

具體的做法是去組 pairwise 樣本對，對用戶點(diǎn)擊且流行度低的物料，和流行度高但用戶未點(diǎn)擊的物料，用貝葉斯的方法做 loss 訓(xùn)練模型。

在我們的實(shí)踐中，因果推斷在粗排和召回階段來做比在精排做更容易獲得收益。原因是精排模型比較復(fù)雜，精排已經(jīng)有不錯(cuò)的個(gè)性化能力，但粗排和召回即使用了 DNN，也是裁剪的 DNN，整個(gè)模型的個(gè)性化能力還是有差距的，在個(gè)性化能力比較差的地方使用因果推斷效果肯定比在個(gè)性化能力強(qiáng)的地方使用效果更明顯。

四、其他技術(shù)點(diǎn)

1、序列重排

重排是采用 beam-search 方法，設(shè)計(jì)結(jié)合 NEXT 下拉模型的 reward 函數(shù)，生成多種候選序列，選取最大收益的序列，擴(kuò)量后效果不穩(wěn)定，細(xì)節(jié)進(jìn)一步優(yōu)化中。

2、圖技術(shù)

圖技術(shù)主要包括兩部分：圖數(shù)據(jù)庫和圖 embedding。對于推薦來講，如果用圖數(shù)據(jù)庫，會(huì)更方便一些，成本更低。圖 embedding 指的是游走類的節(jié)點(diǎn)隨機(jī)游走，將圖數(shù)據(jù)（通常為高維稠密的矩陣）映射為低維稠密向量的過程。圖嵌入需要捕捉到圖的拓?fù)浣Y(jié)構(gòu)，頂點(diǎn)與頂點(diǎn)的關(guān)系，以及其他的信息（如子圖，連邊等），在此不展開介紹。

推薦中可以用基于隨機(jī)游走、圖結(jié)構(gòu)、圖對比學(xué)習(xí)等算法，做用戶與博文、用戶與作者的互動(dòng)/關(guān)注等召回。主流的方式還是把圖文、用戶等做成 embedding，給模型加特征，也有一些比較前沿的嘗試方式，如直接做端到端網(wǎng)絡(luò)，用 GNN 來做推薦。

下圖是目前端到端的模型，目前我們還在嘗試中，不是線上的主流量版本。

下圖是基于圖網(wǎng)絡(luò)生成 embedding，右邊的圖是根據(jù)賬號的領(lǐng)域算出的相似度。對于微博來講，根據(jù)關(guān)注關(guān)系算出 embedding 是有收益的。

五、問答環(huán)節(jié)

Q1：對推薦信息流很多 Item 只瀏覽不點(diǎn)擊，是怎么區(qū)分是否感興趣的呢？通過列表頁上 Item 的停留時(shí)間嗎？

A1：對的，信息流業(yè)務(wù)來講話，時(shí)長是比較重要的優(yōu)化指標(biāo)。做時(shí)長的優(yōu)化指標(biāo)，不太方便直接優(yōu)化用戶今天整體在 APP 上停留多久，優(yōu)化比較多的還是在 item 停留多久。不把時(shí)長當(dāng)作優(yōu)化目標(biāo)來做，就比較容易推很多淺消費(fèi)的內(nèi)容。

Q2：訓(xùn)練發(fā)生 fail over 模型實(shí)時(shí)更新會(huì)有一致性問題嗎？模型的一致性問題如何處理？

A2: 當(dāng)前對于推薦的學(xué)習(xí)訓(xùn)練來講，如果是 cpu 的話異步式的比較多，大家不太做成那種全局有個(gè)輪次，等輪次結(jié)束之后統(tǒng)一收集完，更新到 ps 上，再發(fā)起下輪次，因?yàn)樾阅軉栴}，大家基本不會(huì)這樣做。無論是不是實(shí)時(shí)、在線學(xué)習(xí)，都達(dá)不到強(qiáng)一致性。

如果你訓(xùn)練發(fā)生 fail over 的話，如果流式訓(xùn)練的話，是記錄在數(shù)據(jù)流上，比如 kafka 或者是 flink 上，去記載你當(dāng)前方案訓(xùn)練到哪的位置的，你的 ps 上也有你上次訓(xùn)練完的記錄，也就跟全局的差異是差不多的。

Q3：請問召回使用精排的序會(huì)不會(huì)降低召回模型迭代上限？

A3：迭代上限姑且理解為召回的天花板，那我理解召回的天花板肯定不是要超越精排，舉例來說，如果算力現(xiàn)在是無窮的話，那用精排打 500 萬物料的分是不是對業(yè)務(wù)最好的處理方式。那召回在投入不那么大的情況下，盡量把精排覺得最好的部分給他找出來，比如說讓他從召回里面那 6000 里面選出的 top15 和在 500 萬的 top15 是比較接近的，召回模塊做的就比較好了。如果大家這么理解的話，那召回使用精排的序不會(huì)降低迭代上線，反而是向著上限前進(jìn)。不過這也是我們一家之言，大家根據(jù)自己的業(yè)務(wù)導(dǎo)向，可能結(jié)論不一定是放之四海而皆準(zhǔn)的。

責(zé)任編輯：姜華來源： DataFunTalk

大模型機(jī)器學(xué)習(xí)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

国产精品无码2021在线观看| 亚洲天堂日韩av| 伊人久久一区| 一区二区三区在线免费观看| 国产精品久久久久久久久婷婷 | 少妇人妻精品一区二区三区| 国产手机视频一区二区 | 国产精品久久久久久久天堂第1集国产精品久久久久久久免费大片国产精品久久久久久久久婷婷 | 一级片久久久久| 精品国产亚洲一区二区三区在线 | 久久久亚洲精选| 国产美女免费无遮挡| 精品久久亚洲| 欧美中文一区二区三区| 91午夜在线观看| 3d成人动漫在线| www.亚洲色图.com| 成人有码在线播放| 精品免费囯产一区二区三区| 亚洲激情久久| 亚洲天堂免费观看| 99久久人妻精品免费二区| 久久婷婷五月综合色丁香| 精品久久久久久久久国产字幕| 久久久一二三四| 黄色影院在线播放| 99久久精品国产精品久久| 91精品国产自产在线观看永久| 中文字幕视频网| 欧美三级网页| 麻豆国产精品va在线观看不卡| 色婷婷av777| 成人香蕉社区| 欧美一区二区性放荡片| 91在线视频观看免费| а√天堂8资源中文在线| 亚洲视频中文字幕| 一区二区在线中文字幕电影视频| 免费毛片在线| av男人天堂一区| 国产成人精品福利一区二区三区| 国产麻豆一精品一男同| 青青草国产成人av片免费| 欧美中文字幕在线播放| 国产亚洲精品久久久久久打不开 | 人人妻人人做人人爽| 很黄的网站在线观看| 欧美激情在线一区二区| 人偷久久久久久久偷女厕| 五月天丁香视频| 成人黄色在线看| 成人毛片网站| 欧美在线 | 亚洲| 懂色一区二区三区免费观看| 91在线观看网站| 国产成人av免费看| 国产成人小视频| a级国产乱理论片在线观看99| 国产露脸91国语对白| 极品美女销魂一区二区三区| 成人情趣片在线观看免费| 亚洲午夜精品久久久| 另类小说综合欧美亚洲| 91精品国产综合久久香蕉922| 亚洲熟女乱色一区二区三区久久久| 久久亚洲影院| 国产精品视频播放| 国产精品视频一区二区三区,| 九九视频精品免费| 91人人爽人人爽人人精88v| 99热这里只有精品3| 国产99久久久久久免费看农村| 99在线免费观看视频| 国模无码一区二区三区| 久久网站热最新地址| 日本视频一区二区不卡| 在线中文资源天堂| 亚洲精品国产a久久久久久 | 三级黄色在线观看| 综合激情在线| 97涩涩爰在线观看亚洲| 亚洲不卡在线视频| 美腿丝袜在线亚洲一区| 99高清视频有精品视频| 先锋av资源站| 中文字幕一区三区| 中国丰满熟妇xxxx性| 欧美粗大gay| 777精品伊人久久久久大香线蕉| 古装做爰无遮挡三级聊斋艳谭| 精品一区二区男人吃奶| 在线电影中文日韩| 久久成人在线观看| 老司机精品导航| 91久久久一线二线三线品牌| 欧美一级做性受免费大片免费| 久久久久久久久蜜桃| 国产盗摄视频在线观看| 亚洲欧美韩国| 在线综合视频播放| 日本japanese极品少妇| 天天做天天爱天天综合网2021| 久久免费福利视频| 中文字幕在线观看第二页| 成人h精品动漫一区二区三区| 日韩经典在线视频| tube8在线hd| 精品视频123区在线观看| 久草视频福利在线| 国产精品久久久久久久| 69国产精品成人在线播放| 91久久精品国产91性色69| 91在线视频观看| 91xxx视频| 台湾成人免费视频| 国产视频久久久久久久| 精品无码人妻一区二区三区| 美女www一区二区| 久久精品一二三区| 欧美xxxxhdvideosex| 欧美三级日韩三级国产三级| 中文字幕一区三区久久女搜查官| 亚洲va在线| 国产精品老女人精品视频| 婷婷久久久久久| 亚洲一区二区三区视频在线播放| 涩涩网站在线看| 成人写真视频| 国产精品999| 日av在线播放| 午夜视频一区在线观看| 国产又粗又猛又爽又黄| 欧美在线色图| 国产精品扒开腿做爽爽爽视频 | 天堂va在线高清一区| 正在播放亚洲1区| 亚洲欧美另类在线视频| 99国产麻豆精品| 成人免费视频91| 国产精品18hdxxxⅹ在线| 精品中文字幕在线观看| 91中文字幕在线视频| 中文字幕第一页久久| 香蕉视频网站入口| 清纯唯美日韩| 国产精品视频在线播放| av电影在线观看网址| 欧美性三三影院| 99在线视频免费| 美女爽到高潮91| 一区二区三区欧美成人| 精品肉辣文txt下载| 国产午夜精品全部视频播放| 久久久蜜桃一区二区| 久久久久免费观看| 午夜视频在线瓜伦| 大色综合视频网站在线播放| 国产精品旅馆在线| 免费黄网站在线| 91精品久久久久久久99蜜桃| 成人在线观看小视频| 国产在线国偷精品免费看| 国产又粗又长又爽视频| 91蜜桃臀久久一区二区| 97在线看福利| 国产香蕉在线| 欧美三级电影网| 美国黄色小视频| 福利电影一区二区三区| 国产午夜福利在线播放| 九九热精品视频在线观看| 国产精品成熟老女人| aiai在线| 欧美一级电影网站| 国产一级片毛片| 国产女人aaa级久久久级 | 国产美女亚洲精品7777| 九九精品在线视频| 深夜福利视频在线免费观看| 午夜欧美大尺度福利影院在线看| 大又大又粗又硬又爽少妇毛片| 青草av.久久免费一区| 99热这里只有精品7| 欧美久久精品| 国产精品青草久久久久福利99| 黄网站免费在线观看| 亚洲成人免费网站| 亚洲性猛交富婆| 一区二区三区日韩在线观看| 91玉足脚交白嫩脚丫| 日精品一区二区| 中文字幕第50页| 免费欧美一区| 99久久伊人精品影院| 日本电影欧美片| 久久综合五月天| 日本大片在线观看| 欧美一级日韩一级| 日本视频网站在线观看| 亚洲人吸女人奶水| 日韩精品电影一区二区| 精品写真视频在线观看| 亚洲中文字幕无码专区| 五月精品视频| 噜噜噜噜噜久久久久久91| 91视频亚洲| 国产成人jvid在线播放| av福利导福航大全在线| 精品国偷自产在线视频99| 三级国产在线观看| 日韩一级黄色大片| 一区二区视频网| 欧美小视频在线观看| 国产亚洲精品成人| 《视频一区视频二区| 永久免费看mv网站入口78| 高清av一区二区| 男人的天堂最新网址| 天堂午夜影视日韩欧美一区二区| 欧日韩免费视频| 综合久久亚洲| 亚洲一区二区三区精品在线观看 | 成人妖精视频yjsp地址| 8x8x成人免费视频| 日韩精品成人一区二区三区 | 日本免费新一区视频| 欧美精品一区免费| 亚洲午夜电影| 乱熟女高潮一区二区在线| 无码一区二区三区视频| 亚洲精品不卡| 精品免费在线| 免费毛片一区二区三区久久久| eeuss国产一区二区三区四区| 成人性生交大片免费观看嘿嘿视频| 成人18视频在线观看| 日韩免费观看网站| 婷婷综合六月| 日韩av电影中文字幕| 久九九久频精品短视频| 欧美一级大胆视频| 涩涩在线视频| 日韩免费观看在线观看| 都市激情亚洲综合| 国产精品69久久久久| 色香欲www7777综合网| 国产成+人+综合+亚洲欧洲| 美女写真久久影院| 国产精品27p| 99精品国自产在线| 国产一区二区丝袜| 亚洲精品伦理| 91成人在线看| xxxxxhd亚洲人hd| 国产乱码精品一区二区三区中文 | 国产爆乳无码一区二区麻豆| 日韩国产一区二区| 亚洲美女搞黄| 中文字幕亚洲综合久久五月天色无吗''| 在线码字幕一区| 综合日韩在线| 亚洲欧美日韩国产综合在线| 日韩一级精品| 女性隐私黄www网站视频| 日日骚欧美日韩| 日本高清久久久| 懂色av一区二区在线播放| 亚洲欧美高清在线| 久久久国产午夜精品| 美国一级黄色录像| 亚洲精品国产一区二区三区四区在线| 久久精品美女视频| 一本大道av伊人久久综合| 天天综合久久综合| 欧美一区二视频| 天堂中文资源在线观看| 亚洲性视频网址| 永久免费网站在线| 91成人天堂久久成人| 成人免费毛片嘿嘿连载视频…| 国产日韩欧美日韩| 大伊香蕉精品在线品播放| 欧美激情导航| 97视频热人人精品免费| 免费看欧美黑人毛片| 日韩国产欧美在线播放| 可以看的av网址| 91麻豆产精品久久久久久| 老司机深夜福利网站| 亚洲va国产天堂va久久en| 欧美性受xxx黑人xyx性爽| 日韩欧美国产一二三区| 久草福利在线视频| 欧美大奶子在线| 成人日韩在线| 成人黄动漫网站免费| 日韩aaaa| 精品视频免费在线播放| 久久国产精品72免费观看| a天堂视频在线观看| 国产精品理论在线观看| 日韩精品在线不卡| 91精品国产美女浴室洗澡无遮挡| 亚洲av毛片成人精品| 成年人精品视频| 成人日韩精品| 国语精品中文字幕| 影音先锋日韩精品| 亚州精品一二三区| 99视频国产精品| 日韩在线观看视频一区二区| 欧美午夜片在线免费观看| 亚洲高清视频网站| 这里只有精品在线播放| 日韩在线伦理| 成人黄色片视频网站| 99九九热只有国产精品| 欧美黄色一级片视频| 成人久久视频在线观看| 永久免费看片视频教学| 欧美在线不卡一区| 四虎精品成人影院观看地址| 欧美第一黄网免费网站| 99精品美女视频在线观看热舞| 任我爽在线视频精品一| 国产农村妇女精品一区二区| 黄色av电影网站| 亚洲精品国产精华液| 国产精品久久久久久久成人午夜 | 4438x成人网全国最大| 国产精品久久久久国产a级| 欧美日韩一区二区三区四区不卡 | 精品国产大片大片大片| 欧美中文字幕不卡| 国产小视频免费在线网址| 国产91精品久久久久| 另类ts人妖一区二区三区| 91免费黄视频| 成人听书哪个软件好| 精品一区在线视频| 精品久久久三级丝袜| 欧美女同一区| 国产精品xxx在线观看www| 精品91在线| 亚洲成人av免费在线观看| 午夜伊人狠狠久久| 五月婷婷六月激情| 91av视频导航| 国产欧美一区二区精品久久久| 成人在线免费在线观看| 99国产一区二区三精品乱码| 国内精品福利视频| 亚洲图片欧美午夜| 成人做爰免费视频免费看| 亚洲精品乱码久久久久久蜜桃91| 日本欧美一区二区三区乱码 | 亚洲成人手机在线| 欧美一级片免费| 91精品国产高清久久久久久久久| 香蕉国产成人午夜av影院| 国产精品免费成人| 国产精品嫩草影院av蜜臀| 91精品国产综合久| 欧美激情一区二区三区高清视频 | 中文字幕久久亚洲| 香蕉成人在线| zzjj国产精品一区二区| 精品黑人一区二区三区| 国产视频在线观看一区二区| 欧美专区福利免费| 亚洲精品乱码视频| 国产成人一区在线| 成人午夜淫片100集| 中文字幕精品—区二区| 国产精品久久久久久久久久辛辛 | 成人美女在线视频| 久久99精品波多结衣一区| 一本色道久久88亚洲综合88| 偷拍自拍亚洲| 成年人黄色大片大全| 久久久午夜精品| 国产精品久久久久久久一区二区 | 婷婷综合六月| 黄色免费高清视频| aaa亚洲精品一二三区| 中文字幕一区二区三区免费看| 久色乳综合思思在线视频| 秋霞综合在线视频| 狠狠操狠狠干视频| 午夜免费久久看| 日韩成人三级视频| 亚洲激情视频| 国产视频123区| 精品国产青草久久久久福利| 欧美羞羞视频| 国产在线视频在线| 中文字幕第一区| 色网站免费观看| 国产欧美日韩精品丝袜高跟鞋| 激情综合自拍|