?嘉賓丨李本陽
撰稿丨千山
有人認為,在大數(shù)據(jù)時代每天都有海量信息產(chǎn)生,迅速捕獲感興趣的內(nèi)容越來越難,因此智能推薦是必不可少的工具。也有人不以為然,認為這種基于用戶畫像分析的推薦形式會加速信息繭房的形成,隱形攫取了個人對于信息的主動選擇權(quán)。
如何看待智能推薦這些年的發(fā)展?知識圖譜的構(gòu)建如何為個性化推薦帶來更多可能?目前有關(guān)算法規(guī)制的討論會給未來帶來哪些影響?圍繞這些議題,《技術(shù)人訪談錄》特邀汽車之家智能推薦內(nèi)容理解團隊負責(zé)人李本陽,聊一聊這些年他在這一領(lǐng)域的成長、觀察和反思。
1、抉擇:做最壞的打算,然后靜待收獲
你將面臨的最大陷阱是誤認為那些幫助你達到這個新職位的成功經(jīng)驗仍然有效。
——邁克爾?沃特金斯《最初的90天》
畢業(yè)于哈爾濱工業(yè)大學(xué)的李本陽在求學(xué)期間就擇定了自然語言處理(NLP)作為專業(yè)方向,此后的職場生涯也專注AI方向,不斷在自然語言處理、知識圖譜、大數(shù)據(jù)計算、個性化推薦等方向積累實踐經(jīng)驗。
談到選擇NLP的原因,李本陽首先提到了少年時的興趣。“我一直很喜歡對底層邏輯的探究,比如高中時候喜歡物理,喜歡研究我們所在世界的運行機理;上大學(xué)的時候,常常類比機器和人的差異,更想探究智能的機理。”
另外,良師的引導(dǎo)也影響至深。“(當(dāng)時)受哈工大關(guān)毅老師影響,常說NLP有我們一生都研究不完的課題,所以就選擇了這條路。后來(工作了)也一直沿著這個方向在走。”

正式工作以后,李本陽進入百度,從工程師做起,逐漸成長為百度新聞產(chǎn)品技術(shù)負責(zé)人,后又出走大廠,先后進入大數(shù)據(jù)創(chuàng)業(yè)公司、醫(yī)療科技公司擔(dān)任技術(shù)高管,直到如今在汽車之家?guī)ьI(lǐng)智能推薦內(nèi)容理解團隊。
回顧一路履跡,李本陽顯得淡然和審慎。他認為,作為一個技術(shù)人,期間經(jīng)歷的諸多轉(zhuǎn)折“相信很多人也經(jīng)歷過,或者未來也會有相近的軌跡”。通常來說,工作初期會更注重學(xué)習(xí)和職業(yè)化,成長后會開始權(quán)衡技術(shù)與管理的平衡。
至于選擇大廠還是創(chuàng)業(yè)公司,李本陽談到:“對我來說,大廠資源多,規(guī)范性更好,相應(yīng)的目標(biāo)拆解也更細致,也有更多團隊成果的積累,但是通常來說,每個人離公司整體的大目標(biāo)更遠一些,所處的階段也更加穩(wěn)定。而身處創(chuàng)業(yè)公司,很多工作都是從0開始,由于團隊規(guī)模比較小,大部分事情都要從基礎(chǔ)開始做,相應(yīng)的變化也會更快。”
當(dāng)年李本陽之所以從大廠出來,選擇了一家創(chuàng)業(yè)公司,主要原因是“想經(jīng)歷一下公司發(fā)展的不同階段,同時也想在這個過程中拓展自己的視野”。這并非一時興起或熱血上頭,對于風(fēng)險,他也進行了謹(jǐn)慎的預(yù)判。“我也評估過如果加入創(chuàng)業(yè)公司,公司沒有成功的話,代價是否是我和我的家庭能承受的,這一點非常重要。做最壞的打算,剩下就是收獲了。”
不過對于多數(shù)剛?cè)肼殘龅男氯藖碚f,李本陽認為“最好還是先去大公司歷練一下”,以便養(yǎng)成更好的職業(yè)習(xí)慣,觀察大廠的運作機制,這對未來成長會有更多幫助,后續(xù)再做其他選擇也會更加得心應(yīng)手。
面對環(huán)境的變化,固有的經(jīng)驗可能并不適用,如何讓自己的職業(yè)技能與不同行業(yè)快速融合,李本陽也給出了個人的一些建議。
- 保持學(xué)習(xí)心態(tài),尤其是跨領(lǐng)域,能夠快速學(xué)習(xí)掌握行業(yè)知識,以及技術(shù)結(jié)合點。
- 盡量避免頻繁地跨行業(yè),最好能讓自己之前積累的技術(shù)和經(jīng)驗在新領(lǐng)域依然有所發(fā)揮,這樣也能減少對自身的消耗。當(dāng)然所有經(jīng)歷都是寶貴的財富,關(guān)鍵要在得失之間做好取舍。
- 技術(shù)本身是具有通用性的,保持技術(shù)競爭力。
- 充分了解行業(yè)現(xiàn)狀和背景知識,跟業(yè)內(nèi)深耕多年的人多加交流,避免信息的不對稱導(dǎo)致的失敗。
彩蛋Q&A
技術(shù)人訪談錄:最近有沒有推薦的書單?
李本陽:在基礎(chǔ)技術(shù)方面,我推薦邱錫鵬教授的《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》。對于職業(yè)遷移變化比較大的人,可能會思考如何快速融入職場角色,如何在變遷中快速落地,我推薦邁克爾?沃特金斯的《最初的90天》,這本書應(yīng)該會對你有所幫助。目前我正在看的一本書是金惟純的《人生只有一件事》。
2、反思:以汽車為中心構(gòu)建知識圖譜的實踐
人工智能是我們?nèi)祟愓趶氖碌淖顬樯羁痰难芯糠较蛑唬踔烈然鹋c電還更加深刻。
——桑德爾·皮猜
技術(shù)的變化日新月異,智能推薦領(lǐng)域也不例外。在李本陽看來,近幾年智能推薦要解決的問題總體來說變化不大,常見的諸如冷啟動、推薦準(zhǔn)確、多樣性等等,但在方法上變化卻很快,比如多目標(biāo)優(yōu)化/多任務(wù)學(xué)習(xí)、多模態(tài)融合推薦、基于用戶行為序列的學(xué)習(xí)方法、結(jié)合圖譜知識圖譜特征學(xué)習(xí)等。
而在推薦系統(tǒng)中,“內(nèi)容理解”是不可或缺的部分。在門戶網(wǎng)站時代,門戶通過 "內(nèi)容類型" 對內(nèi)容進行整理,然后以頻道頁形式滿足用戶需求;在搜索/社交時代,搜索除了需要分類信息以外,還需要精確知道文本內(nèi)容是 "關(guān)于什么的",關(guān)鍵詞技術(shù)很好地解決了這個需求,谷歌在2012年提出的知識圖譜概念又為解決實體歧義問題找到了可行路徑。那么在智能時代,在內(nèi)容理解方面又有哪些新的解決方案呢?
李本陽簡要介紹了他目前帶領(lǐng)的內(nèi)容理解團隊主攻的三大方向:
- 內(nèi)容刻畫:包括對內(nèi)容標(biāo)簽體系,分類、概念標(biāo)簽、興趣詞標(biāo)簽,質(zhì)量:先驗、后驗質(zhì)量;低質(zhì)識別等,相似計算內(nèi)容相似,圖片相似,情感分析。
- 內(nèi)容生態(tài):通過前面的多維度標(biāo)簽和質(zhì)量刻畫,分析內(nèi)容生產(chǎn)和用戶消費的關(guān)系,促進生產(chǎn)更多用戶喜歡的內(nèi)容,促進內(nèi)容生態(tài)的不斷提升。
- 知識圖譜建立:圍繞以車中心的語義圖譜,支持更多應(yīng)用場景。

對于知識圖譜的建立這一點,李本陽作了進一步補充。他提到,相比傳統(tǒng)的推薦方式,算法推薦其實更為多元化,而且算法推薦除了要推得準(zhǔn)確,還要進行多層面探索,增加多樣性,從而給用戶驚喜,破除信息繭房。“這里的探索也不應(yīng)該是無目的的隨機探索。知識圖譜的多個實體關(guān)系,能更好地挖掘用戶可能偏好的內(nèi)容,為進一步探索帶來更多可能。”
李本陽解釋:“除了用戶看到的物料內(nèi)容本身,知識圖譜能夠帶來額外的知識。比如看到奧迪某款車,通過知識圖譜可以向上探索其是否喜歡德系車,是否喜歡同價位的車,是否喜歡同品牌的車等等。而且也可以使用圖的embedding,豐富item/user的表示等,從而能給出更好的結(jié)果。”
汽車之家作為由導(dǎo)購、資訊、評測、口碑等多個板塊組成的汽車服務(wù)類平臺,在看、選、買、用等維度積累了大量的汽車數(shù)據(jù)。在此基礎(chǔ)上,其技術(shù)團隊構(gòu)建了以汽車為核心的知識圖譜,為更多應(yīng)用場景提供支撐。
知識圖譜是真實世界的語義表示,圖譜構(gòu)建過程中通常會面臨較大的挑戰(zhàn)。而且面向推薦的汽車知識圖譜構(gòu)建有其特殊性,對此,李本陽梳理了團隊在實踐過程中遇到的難點和特點。
- 汽車領(lǐng)域擁有專業(yè)參數(shù)劃分和多領(lǐng)域技術(shù),所以如何讓大眾了解,而非專業(yè)了解,需要更多用戶維度的圖譜標(biāo)簽構(gòu)建,比如空間大、豪華、舒適、奶爸適用等等。
- 汽車是比較昂貴的商品, 用戶購買必然不同于電商,需要更長周期的比較和分析。在看、選、買、用過程中需要針對不同的場景構(gòu)建。
- 除了買車,很多人對汽車本身也有濃厚的興趣,同時話題可能延伸到社會、科技、娛樂等多個方面,這就涉及到對于以車為載體的閱讀內(nèi)容的興趣刻畫,比如對新能源技術(shù)感興趣、對換電、事故有關(guān)注等等。
實踐結(jié)果表明,通過構(gòu)建知識圖譜,把以汽車為核心的內(nèi)容進行組織和挖掘,提供豐富的知識信息,結(jié)構(gòu)化精準(zhǔn)刻畫興趣,支持推薦用戶冷啟、召回、排序、展示等多個維度,為業(yè)務(wù)提升帶來了積極效果。
彩蛋Q&A
技術(shù)人訪談錄:《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》于今年3月1日起實施,很多應(yīng)用已陸續(xù)上線個性化推薦關(guān)閉鍵。在數(shù)據(jù)合規(guī)時代,算法推薦模式有沒有可能走向終結(jié)?
李本陽:我不認為算法推薦模式會走向終結(jié),相反,《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》的出臺可以讓算法推薦模式更加穩(wěn)健。一方面,它規(guī)范了推薦算法的應(yīng)用,避免了大數(shù)據(jù)殺熟、誘導(dǎo)沉迷等亂象,設(shè)置了邊界,避免算法被濫用,另一方面,算法仍然有很大的發(fā)揮空間,可以在合理合規(guī)范圍內(nèi)大展拳腳。
3、管理:溝通要站在對方的角度來闡述
把“對”讓給別人,把空間還給別人,不僅對別人有幫助,更有益于彼此的關(guān)系,何樂而不為?千萬別再說“早就跟你說過了”,尤其是對孩子和員工。?
——金惟純《人生只有一件事》
從工程師到技術(shù)高管,李本陽經(jīng)歷了從單純的技術(shù)人員到技術(shù)管理者的轉(zhuǎn)變。在他看來,這兩者有鮮明的角色差異。
“技術(shù)人員更多關(guān)注的是技術(shù)方向,是項目解決方案,是自己的產(chǎn)出。而管理者更聚焦的是整體目標(biāo)和團隊產(chǎn)出,以及梯隊建設(shè)、向上匯報、團隊配合等若干事宜。兩者在思維和行為上的差異,都是由此產(chǎn)生的。所以技術(shù)偏縱深,而管理更多呈T字形,既要有自己擅長的技術(shù)點,又要兼顧協(xié)作等多方面的事情。”
在團隊協(xié)作中,溝通的藝術(shù)至關(guān)重要。李本陽分享了其在多年管理實踐中的心得:
- 團隊協(xié)作的基礎(chǔ)是有共同的目標(biāo),獲得共同的收益。如果不滿足需要更高層面的目標(biāo)協(xié)同。
- 如果目標(biāo)是一致的,在合作之初就要建立合作的分工和配合機制。這樣減少了過程中更多的問題,所謂“丑話說在前面”。
- 溝通要站在對方的角度上來闡述,說明給對方帶來的價值。這會讓對方更容易接受。

在團隊搭建上,李本陽也有一套自己選人用人的準(zhǔn)則和評判標(biāo)準(zhǔn)。
“選人方面,我首先比較看重的是性格。我欣賞踏實的性格,這種踏實更多表現(xiàn)為靠譜,我能夠放心地把具體的事交給他。其次是專業(yè)能力,最后是未來的成長潛力。對于不同階段的人,看重的點也不同,比如剛畢業(yè)的同學(xué),除了靠譜,更多還是看基本功和潛力。”
“用人方面,我是希望在完成團隊目標(biāo)的基礎(chǔ)上,個人也能取得個人的成長。這應(yīng)該是一個共贏的過程,所以我會規(guī)劃每個人的方向,希望他們專注于某個方向,在各自的方向深耕,同時要打造良好學(xué)習(xí)的氛圍,努力為團隊創(chuàng)造提升自己的空間。”
4、未來:推薦會更加多元、規(guī)范
在智能推薦領(lǐng)域,李本陽從一名新兵成長為老將,摸爬滾打多年,對于這一方向的未來,他也有自己的判斷。
其一,未來智能推薦會涉及到人的方方面面,除了以推薦信息流、商品的個性化,更多的將結(jié)合場景進行推薦,比如時間地點,使用應(yīng)用相結(jié)合。
其二,推薦形式將更加多元化,包括內(nèi)容多元,以及交互方式多元,通過交互增加顯示的興趣反饋等。
其三,推薦系統(tǒng)將更加規(guī)范化,避免濫用,同時在可解釋性方面也會做得更加深入,讓用戶更多地理解推薦的原因,人機結(jié)合也將更加密切。
此外,面對近年來關(guān)注度漸高的“算法黑箱”問題,李本陽認為關(guān)于“算法透明化”的呼聲有其正向意義。
“算法的透明,一方面是算法可解釋,另一方面把相關(guān)算法公開化,首先有助于人們加強相互理解,而不是猜測。同時,透明的算法也可以讓更多人依據(jù)算法提高效率,也有助于找到算法優(yōu)化點迭代算法,從而提高參與各方的滿意度。”

李本陽汽車之家智能推薦內(nèi)容理解團隊負責(zé)人
- 哈工大計算機本碩,自然語言處理方向
- 6年百度工作經(jīng)驗,6年AI與行業(yè)結(jié)合創(chuàng)業(yè)經(jīng)驗
- 歷任百度新聞產(chǎn)品技術(shù)負責(zé)人,大數(shù)據(jù)公司、醫(yī)療科技公司技術(shù)技術(shù)高管,現(xiàn)任汽車之家智能推薦內(nèi)容理解團隊負責(zé)人
- 專注AI方向,在自然語言處理、知識圖譜、大數(shù)據(jù)計算、個性化推薦等方向有豐富積累


























