三位大咖亮相WOT AI峰會機器學習會場,揭秘AI如何賦能行業應用
原創【51CTO.com原創稿件】2018年,人工智能作為人類開創未來最耀眼的技術之一,正在深刻影響著全球產業結構、商業模式、城市形態以及人類生活工作方式。如何讓人工智能技術為行業賦能,讓眾多行業共享科技生產力,是數字化轉型浪潮下的重要課題。作為推動人工智能務實創新的年度重要活動,11月30日-12月1日,WOT2018全球人工智能技術峰會在北京•粵財JW萬豪酒店盛大召開。60+國內外人工智能一線精英大咖與千余名業界專業人士齊聚現場,分享人工智能的平臺工具、算法模型、語音視覺等技術內容,探討人工智能如何賦予行業新的活力。
11月30下午,A會場機器學習分論壇召開,三位資深專家受邀出席發表精彩演講,會后51CTO將專家發言整理成文,希望他們的演講內容精華對大家有所幫助。
楊雪峰 深圳追一科技有限公司高級研究員
閱讀理解技術探索與在企業服務中的應用
楊雪峰的分享主要有兩部分重點,首先他介紹了機器閱讀理解的現狀、市場上前沿技術,以及機器閱讀理解的背景、意義、方法論。其次他分享了AI技術落地的難點與閱讀理解技術的產品化實踐。
在楊雪峰看來,機器閱讀理解通俗來說就是針對給定的問題找到用戶需要的答案,答案可能是文字,也可能是圖片、數字、符號、片段,不同的答案形式,難度也有很大區別,通常通過不同的數據集來處理。他在現場介紹了目前主流的四個英文數據集,即谷歌發明的CNN & Daily Mail數據集、微軟MCTest數據集、斯坦福創建的SQuAD1&2數據集,以及微軟的MS MARCO萬量級數據集。此外中文數據集做的比較好的有百度的DuReader和科大訊飛的CMRC數據集。
楊雪峰還在現場舉了幾個機器閱讀理解的應用場景:
一是客服和新員工培訓場景。由于客服流動性較大,企業需要盡量減少培訓環節,讓客服人員盡快上崗,熟悉操作手冊和業務常用文檔,而通過機器閱讀理解產品,可以第一時間解答員工疑問,幫助員工熟悉業務;
二是在金融領域里提供專業咨詢服務。由于人手有限,基金經理無法回答所有人的提問,但是通過機器閱讀理解,可以讓用戶自主查詢到詳盡的文檔和數據,提升用戶體驗;
三是兒童興趣早教,可以給兒童提供用于教育應用的通用知識問答系統,例如兒童早教機、嬰幼兒輔導等環節,孩子們可以在娛樂中豐富自己的知識。
楊雪峰在現場還以他們為南方航空提供的解決方案現身說法,他表示南方航空每周都會推出各種活動,每當這時客服人員都需要解答大量多的問題,追一科技會從上千篇文檔集中篩選出最容易被咨詢的文檔,建立模型通過自動抽取功能,推薦很多問答字段,簡化企業標注流程,并做出細致的標注,盡可能讓用戶簡單使用,滿足高并發訪問場景。“未來這個領域還有很多挑戰,尤其是金融客戶大多都是私有化部署,數據是一個閉環系統,他們希望能夠疊加自己的數據訓練新的模型,而讓服務商只提供產品邏輯即可。”
俞圓圓 杭州威佩網絡科技有限公司CTO
深度學習在電子競技行業中的應用
俞圓圓在一開場就表示,傳統體育行業的數據分析方式并不適用于電子競技領域。同樣是數據搜集,傳統體育行業是以人工搜集和技術搜集同步進行,例如某個球員又進了進個球,需要人工根據現場情況進行登記,而且更多的是依賴現場專業人員進行解讀。而這些數據分析的手段在電子競技領域則行不通,例如電子競技選手往往一天可以打幾十場游戲比賽,游戲迭代快,游戲規則和邏輯多變,傳統數據分析很難跟得上變化節奏。除此之外,游戲里角色復雜,每個角色的裝備、團隊貢獻值、傷害力等多重指標都需要做一個數據分析和展示。更特殊的是,電競行業參與者的主觀意識都很強,認知差別大,很難套用傳統體育專家分析的模式。“在過去的電競數據分析中,很多的團隊使用的傳統數學模型,往往會被玩家和用戶指責不夠客觀或是不夠全面。使用深度學習的話,就可以很有效的規避這些問題。”
對比傳統數學模型,深度學習具有可塑性、普適性、高效性三大優勢。俞圓圓指出,深度學習的模型可以是很多很多的building block,可以把很多問題全部變成工程化的問題,經過訓練后很快就可以搭建模型,而且模型很容易被移動到另外一個項目上。當然,俞圓圓也坦言,電競行業的深度學習也有缺點,需要非常多的訓練數據,而且也不能直接學習和理解。“當深度學習和電子競技游戲結合以后,處理大量的數據也不需要人工因素的干擾,客觀性更好,而且可以快速完整處理大批量數據。”
演講最后,俞圓圓詳細介紹了一個勝率分析項目AlphaMao,來展示他們如何運用深度學習的技術和模型解決電競問題的。在半年的時間中,模型每天都在通過學習新的比賽樣本來更新自己的模型,訓練數據來自六千萬場電競比賽。由于游戲規則更迭很快,所以他們既要學習過去的數據,又要更新最新的數據,而且要隨時調整提高更新數據的權重比例,最終模型擁有60%的總體準確率以及高達97.6%的相對準確率。
“未來我們關注的方向主要有三個。” 俞圓圓透露,他們將在模型中添加上時間數據,爭取可以做到實時勝率分析,而且還將對對勝率進行分析,為玩家提供更直觀有效的建議。除此之外,他們希望深度學習模型可以輕易的移植到其他游戲中。
賈榮飛 淘寶高級算法專家
重新定義人貨場——端上智能,情景計算
賈榮飛在演講中談到,消費者在購買東西的時候,不同場景下有不同的需求,例如在公司里由于時間緊迫,人們希望更快下單,但是如果是在家里,人們則更愿意舒舒服服躺在床上慢慢瀏覽購物頁面。鑒于此,淘寶希望能夠重新定義人貨場,加大對用戶手機上信息的理解,改變電商與消費者多的交互模式,從而推動電商智能化發展。
當越來越多的貨品通過電商銷售,如何準確理解消費者的需求變得更加重要。賈榮飛認為,智能手機時代給這一切提供了可能,它可以定位用戶的實時狀態,然后淘寶通過情景計算技術對用戶實時狀態進行分析和理解,更聚焦地了解客戶此次此刻需要什么。“這比原來的推薦搜索更進一步理解用戶。”他坦言,這里也存在很多難點,一來用戶信息量很大,如何在復雜信息中抽取有效信息?二來隨著處理的數據量越來越大,電商的計算能力如何支撐更大的信息量和更復雜的模型?這是非常有挑戰性的課題。
據賈榮飛介紹,淘寶對于情景計算的訴求主要是希望能夠實時處理用戶的訂單,對于單一用戶希望有更大的算力進行服務,在這樣的需求下,淘寶毫不猶豫地選擇將計算力在客戶端部署為主,在云上更多的是構建全局模型,用戶之間實現信息共享,整體情景計算的架構設計“以端為主,以云為輔。”而深度學習的模型就被應用在對用戶信息的甄別和理解上,對于判斷用戶所處環境非常有幫助。
由于這些模型都是復雜模型,而復雜模型在端上不可避免的會遇到計算能力的問題,所以淘寶就開始研究如何通過端上框架的改進來支持可計算性。賈榮飛介紹到,首先在端上會有原始數據的采集,定期獲取用戶實時狀態,發送到基礎模型生產出中間數據,為應用產品進行服務。同時在云端,淘寶會完成模型的訓練,再定期同步到用戶手機端,用實驗和各種參數確保用戶擁有良好的使用體驗。
“下一步我們希望在三個方向上做更多的嘗試,”賈榮飛透露,第一個是做用戶需求發現引擎,能夠分析出用戶在不同場景的喜好,第二個是實現從千人千面到千人千模,充分發揮用戶手機端的計算能力和對用戶的深入理解,在每個手機上訓練出一個針對單一用戶更個性化的東西。最后一個是云+端的聯合學習,淘寶希望把云+端的信息聯合在一起進行訓練,取得更好的效果。
以上內容是51CTO記者根據WOT2018全球人工智能技術峰會的《機器學習》分論壇演講內容整理,更多關于WOT的內容請關注51cto.com。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】






































