2022年8月6日-7日,??AISummit 全球人工智能技術(shù)大會(huì)??如期舉辦。在7日下午舉辦的《AI賦能產(chǎn)業(yè)實(shí)踐》分論壇上,泰凡科技副總經(jīng)理馬國(guó)寧帶來了《圖繪萬象,從柯尼斯堡到百業(yè)賦能》的主題分享,詳細(xì)分享了知識(shí)圖譜在千行百業(yè)中的賦能。
愚公如果是AI,能不能移山?
如果把愚公當(dāng)成是AI,那他能不能移山?又是如何進(jìn)行移山的?
馬國(guó)寧表示,在人工智能行業(yè),每一個(gè)垂直領(lǐng)域都是一座大山。例如在金融、工業(yè)、政務(wù)等行業(yè)中,利用算法去解決行業(yè)特定問題時(shí),大家會(huì)發(fā)現(xiàn)它與最初的設(shè)計(jì)和落地總是不同的,主要原因是由于我們的算法邏輯不一定能夠匹配行業(yè)的業(yè)務(wù)邏輯。最開始解決這個(gè)問題的方式是利用數(shù)據(jù)智能和計(jì)算智能,依靠堆數(shù)據(jù)量進(jìn)行訓(xùn)練,但是這種方法在后期也會(huì)出現(xiàn)一些瓶頸。為此,我們又開始利用人臉識(shí)別、聲音識(shí)別等感知智能的方式去解決一些場(chǎng)景中出現(xiàn)的問題。
當(dāng)感知智能也遇到瓶頸,最新的方式是利用認(rèn)知智能的算法來解決。那么,認(rèn)知智能是否能模擬人的思維認(rèn)知過程,去解決龐雜的疑難問題呢?

在認(rèn)知智能領(lǐng)域,谷歌很早就利用知識(shí)圖譜進(jìn)行了嘗試,把所有知識(shí)裝到同一個(gè)圖譜中,模擬人的思維以及推理演繹的過程。但是,自谷歌提出這個(gè)想法之后,至少到目前為止仍然沒有辦法去做到完全模擬人的思維過程。雖然圖譜的構(gòu)建過程并不復(fù)雜,但數(shù)據(jù)量足夠大之后,就會(huì)遇到各種問題。例如,WolframAlpha超過10億的實(shí)體,DBpedia超過30億的三元組,谷歌目前實(shí)體已經(jīng)超過5億,關(guān)系連接超過百億,微軟Probase僅概念的總量就已經(jīng)有千萬級(jí)別。這種情況下,先不談應(yīng)用,僅僅做搜索和查詢分析就已經(jīng)很難了。
很多學(xué)者認(rèn)為一個(gè)單點(diǎn)或者一個(gè)集群解決不了,就用兩個(gè)集群乃至十幾個(gè)集群解決這個(gè)問題。實(shí)際上,在知識(shí)圖譜里是很難進(jìn)行堆集群量的,主要原因是在如此龐大的實(shí)體和節(jié)點(diǎn)相關(guān)聯(lián)的情況下,很難讓數(shù)據(jù)分離開。
AI向產(chǎn)業(yè)賦能,誰向AI賦能?
本來想利用AI向產(chǎn)業(yè)賦能,但是從計(jì)算智能到感知智能、認(rèn)知智能,現(xiàn)在AI也需要有人向它賦能。那該怎么辦?
馬國(guó)寧認(rèn)為,方法就是站在巨人的肩膀上。

上圖中的柯尼斯堡是一個(gè)小城鎮(zhèn),但是它在數(shù)學(xué)界或者在圖論界非常有名,主要是因?yàn)橐粋€(gè)很偉大的數(shù)學(xué)家歐拉,在1736年解決了柯尼斯堡七橋問題,開創(chuàng)了一個(gè)新的數(shù)學(xué)分支圖論。知識(shí)圖譜應(yīng)用于集群或者分布式環(huán)境,需要用數(shù)學(xué)理論的基礎(chǔ)解決這些問題。
因此,計(jì)算機(jī)問題解決到一定程度時(shí)就會(huì)歸結(jié)到數(shù)學(xué)問題上,在處理大規(guī)模知識(shí)圖譜時(shí)需要對(duì)知識(shí)圖譜進(jìn)行劃分,重新利用算力解決分布式問題。那么,在劃分的過程中,如何讓分區(qū)之后的知識(shí)圖譜之間的關(guān)聯(lián)性最小?為此,在這方面我們需要用到業(yè)內(nèi)成型的或者前沿的算法,在滿足數(shù)據(jù)規(guī)模跟分布式要求的同時(shí)滿足圖劃分。

但是,目前公開實(shí)現(xiàn)或記載的算法并不能完全解決所有的問題,一個(gè)是集群化問題,一個(gè)是分布式問題。因?yàn)樵谧钚』懈钸吇蛘唔旤c(diǎn)數(shù)量情況下,很難同時(shí)滿足各個(gè)機(jī)器之間的負(fù)載平衡和通信成本問題。
如何解決這些問題呢?我們的方式是對(duì)于沒有權(quán)重的簡(jiǎn)單圖,在指數(shù)內(nèi)部把復(fù)雜度降到一個(gè)常數(shù)的程度。在有權(quán)圖上,把其中的一個(gè)指數(shù)降到常數(shù)的復(fù)雜度,這都是比較前沿的研究成果。在超圖領(lǐng)域,最終要把超圖的切割問題作為次膜k-part的特例,在確定K值的情況下,進(jìn)行求解是完全沒有問題的。

舉例說明,對(duì)于一個(gè)簡(jiǎn)單圖,有三條線的切割,在真正實(shí)踐中可以簡(jiǎn)單的理解為把整個(gè)知識(shí)圖譜切成三個(gè)集群的劃分知識(shí)圖譜。其中對(duì)于S2這個(gè)知識(shí)節(jié)點(diǎn)進(jìn)行獨(dú)立切割,另外一邊S2是一個(gè)最小獨(dú)立切割,這是我們作為一個(gè)簡(jiǎn)單的形象化描述,方便大家理解為什么把這個(gè)圖分開。
從效果來講,像METIS算法它在最小化跨越分區(qū)的頂點(diǎn)數(shù)上面,和后面的知識(shí)挖掘的時(shí)間上面比較均衡;像Hash算法,或者JA-BE-JA算法,在其中一方面可能表現(xiàn)不盡如人意,但是METIS算法表現(xiàn)是比較均衡的。
知識(shí)圖譜與百業(yè)賦能
基于技術(shù)和行業(yè)的研究,泰凡科技構(gòu)建了一套知識(shí)圖譜平臺(tái),上層是應(yīng)用服務(wù)體系,包括檢索、知識(shí)的可視化查詢、智能問答,底層把知識(shí)圖譜的“五臟六腑”構(gòu)建好。實(shí)際上,圖譜最開始是一個(gè)語(yǔ)義問題,是基于語(yǔ)義網(wǎng)發(fā)展而來的。語(yǔ)義庫(kù)的管理,包括知識(shí)如何更新、更新的顆粒度有多大、還有相關(guān)領(lǐng)域要覆蓋多少實(shí)體、覆蓋多少映射關(guān)系等,泰凡科技都會(huì)放在整體框架中。因此,這是一個(gè)非常通用的框架平臺(tái),適用于各行各業(yè)。

除此之外,整個(gè)框架中還集成了實(shí)際應(yīng)用中的必備功能,比如要實(shí)現(xiàn)知識(shí)庫(kù)全生命周期的管理,包括智能推薦、檢索、擴(kuò)展性,這些都是在產(chǎn)業(yè)落地實(shí)踐中必須去考慮的問題。此外,很多關(guān)系探索挖掘,是可以依靠知識(shí)挖掘來解決。
在接下來的時(shí)間里,馬國(guó)寧通過智慧園區(qū)、智慧樓宇、智慧交通、智慧航空、智慧科學(xué)數(shù)據(jù)分析等場(chǎng)景案例,詳細(xì)介紹了知譜圖譜在各行各業(yè)的實(shí)際應(yīng)用。
“科技創(chuàng)新的星辰大海,未來的無限可能性,是更令人心潮澎湃的,這一點(diǎn)我深以為然。”馬國(guó)寧表示,希望通過這次分享,能讓更多的同行,或者其他有志于加入這個(gè)行業(yè)的從業(yè)者,能夠更有信心的去應(yīng)用人工智能技術(shù),賦能千行百業(yè)。






















