傳統金融業面臨運營低效、風險管控不力、獲客成本高等痛點。通過金融與科技的融合破解傳統業務痛點和難點是當前金融業創新發展的重要支撐。
日前,在51CTO主辦的AISummit全球人工智能技術大會上,中關村科金副總裁鄧江帶來了主題演講《AI音視頻技術在金融場景下的應用實操》,從應用、技術、作用與價值三個層面來介紹音視頻技術與金融的技術應用與思考。
在過去的三年,疫情對整個經濟社會都造成了很大的影響。嚴重依賴于線下場景的金融業務也不例外。
AI音視頻技術在金融場景下的應用
在前幾年疫情的大環境下,金融業務受到了很大影響,國家也出臺了一系列的管理辦法,來推動無接觸金融的發展。
在新環境的要求下,在新技術的驅動下,由傳統的人工驅動的服務模式(線下人工驅動的服務模式)迭代為AI驅動的智能服務模式(線上+線下全渠道人機系統的服務模式)。傳統人工驅動的服務模式下,只能實現線下面對面、文字、電話語音、音視頻等服務模式,在AI驅動下,可以實現智能/無人網點、智能客服、智能IVR/外呼、AI智能視頻、AI虛擬員工等服務。
為了實現遠程銀行,鄧江表示,有五大核心技術在驅動整個技術的進步。五大核心技術包括,人工智能技術、實時計算、生物識別及身份核驗、數據決策數據計算、隱私保護。
在實現過程中,還有三大核心算法及四大核心技術能力,是技術落地過程中的另外兩部分技術需要。三大AI核心算法:語音技術、自然語言處理、機器視覺。四大核心技術能力:全渠道高質量的音視頻通信能力、全渠道SDK封裝及適配能力、基于音視頻的AI算法深度整合應用能力、靈活可視化的視頻服務場景編排能力。
金融場景下,智能視頻云建設的技術實操
鄧江表示,智能視頻云是一種推動基礎視頻的數字化升級,以AI智能化、RPA流程自動化,構建"人機協同、人機自助"的視頻服務新模式。其在基礎云計算資源的支撐下,底層構建支持高并發、快速響應的音視頻平臺,包括ASR、TTS、NLP、OCR、人臉識別、防翻拍、活體檢測等。在業務中臺層面,實現客戶的流程管理,高并發下的智能排隊,相關信息的統計分析,訂單的管理,一系列的中臺支撐。

在前端,除了多端介入的支持以外,一系列對于仿冒身份的多模態的生物的核驗,客戶端的自助和客服的遠程視頻,以及對現場視頻的實時計算和捕捉。最前端是業務場景端,像理財、保險、信托等等一系列的業務所對應的相關線上線下結合的流程辦理。
依托于強大的底層基礎,形成五大核心產品:多模態身份核驗、AI現場視頻服務、AI自助視頻服務、AI遠程視頻服務、AI智能音視頻質檢。并對AI視頻云的視頻服務體系進行了介紹,拆解產品體系,介紹產品特性、流程管理及產品價值。
AI音視頻技術在金融場景下的應用實操—移動信貸
傳統金融信貸面簽有六大難點:
面臨信息孤島,面簽數據獨立于風控體系,未充分發揮其動態數據價值;全人工驅動模式,質量高度依賴人員經驗,參差不齊;業務效率低,無智能化或弱智能化輔助,基層壓力大、效率低;展業渠道單一,現場式面核面簽模式,覆蓋難且成本高;業務量瓶頸,業務波峰波谷,動態擴展匹配性差;人工抽檢風險大,人工離線抽樣審核,潛在風險大,反饋及時性不足,人員工作壓力大。
鄧江在介紹了面簽難點后,又從政策層面解讀了四項由銀保監會發布的行業《通知》。鄧江表示,音視頻留痕已成為銀行業、信托業、保險業、證券行業的硬性規定。

在鄧江老師的演講中,分享了移動信貸的四個場景:遠程視頻面簽、自助視頻面簽、客戶經理上門面簽、網點柜臺現場面簽,同時介紹了全流程視頻風控流程以及中關村科金在生物防偽方向的實踐成果,即多模態生物防偽與安全平臺。
多模態生物防偽與安全平臺,支持動作、讀數等多種活體檢測方式,利用服務端強大的AI算法,提供更加精準地識別和反欺詐能力,其平臺分為四層,由接入層、核心層、功能層、場景層組成。

接入層,由微信小程序、APP、移動H5、Web、攝像機端口以及第三方系統組成。
核心層有三部分功能模塊,包括活體偽冒、欺詐檢測以及生物對比。在活體偽冒功能部分又由基礎、增強防偽檢測以及行為風險檢測組成,基礎防偽檢測包含人臉呈現式攻擊、聲紋呈現式攻擊、鏈路劫持檢測;增強防偽檢測包含,音色遷移合成檢測、深度仿造檢測;行為風險監測包含人臉姿態檢測、唇語識別、音畫同步檢測、遮擋語義分割。欺詐檢測包含身份證偽造檢測、簽章偽造檢測、人像背景相似度、聲紋團伙發現。生物對比包含對抗樣本增強學習、聲紋對比檢索、人臉對比檢索。
功能層由核驗能力評估、行為風險評估、策略管理、第三方數據接入、聯邦學習、主動攻擊攔截、加密存儲、無感注冊、無感錄制、無感刷新、生命周期管理、安全審計等12個模塊進行功能實現。
場景層包含的業務場景有,多維實名認證、授信用信、員工合規監管、中介代理檢測、電審團伙發現、CC投訴追查、辦公桌面安全、大客戶進線。
在對多模態生物防偽平臺進行了深度解析后,講解了AI智能音視頻質檢+人工抽查復查的平臺功能,借助AI視覺及語音質檢技術,在視頻服務中,實時質檢,實時糾偏(文本糾偏、語音糾偏),實時提醒用戶和業務經理,大幅提升一次通過率,避免用戶二次補錄成本高體驗差問題,其中主要涉及的技術包含智能圖像識別、智能生物特征識別、智能語音識別、智能動作識別、音畫同步檢測等。
在智能催收及智能回訪部分的介紹中,智能催收可以實現全自動化催收作業,擬人化溝通;針對不同逾期階段和客戶類型可靈活定制話術;標準話術流程,避免人工催收話術不規范引起的合規風險和投訴問題。而智能回訪可以實現撥打效率高;通過后臺統計了解客戶觸達率;熱情飽滿,不影響客戶體驗;降本增效。
在對AI智能視頻云的功能及涉及技術進行剖析后,進行了AI智能視頻云的相關案例分享,案例詳見官網視頻回放。
結語
在AI音視頻技術中,無論是人臉、聲紋、唇語、語音合成這些技術,都在場景中有深度的場景化定制。作為科技公司來說,除了打磨技術能力以外,更多的是深入業務場景,以客戶為中心,了解客戶需求,做到解決客戶業務中真實的痛點,能夠把工具用好,這是未來對于科技公司的更高要求。最終通過技術在金融場景中的深度應用,來提升整個金融業務的水平,拓寬整個金融業務的規模化發展邊界。

大會演講回放及PPT已上線,進入官網查看精彩內容--> ??AISummit全球人工智能技術大會官網??






















