2024年大數據行業(yè)預測(四)

生成式人工智能將很快從膨脹預期的頂峰走向幻滅的低谷。委婉點,即現(xiàn)在有很多關于生成式人工智能的炒作。然而,所有這些炒作意味著,對于某些組織來講,采用這項技術更多的是為了“跟上潮流”,而不是因為其是組織試圖解決的特定問題的最佳解決方案。因此,我們很可能會看到大量資金投資于失敗的生成式人工智能項目,從而陷入幻滅的低谷。這是一個閃亮的新物體,許多首席信息官和其他高級領導人可能會感到壓力,因為他們已經有了一個生成式人工智能程序。限制這些失敗項目的關鍵在于,確保組織了解使用生成式人工智能的具體原因,其與定義的業(yè)務成果相關,并建立了衡量投資成功的方法。–Rex Ahlstrom,Syniti首席技術官兼副總裁
生成式人工智能將引發(fā)高管之間的沖突,因為其會爭奪企業(yè)內部議程的控制權:近一半的高管表示,其人工智能投資明年將增加,以趕上生成式人工智能的潮流;而70%的高管已經處于生成式人工智能探索模式。現(xiàn)在,各組織正在加大人工智能在企業(yè)中的采用力度,每位高管都希望成為帶領企業(yè)踏上人工智能之旅的人。到2024年,人工智能議程將變得更加復雜,因為從首席技術官到首席信息官,再到數據分析高管,越來越多的參與者進入這個領域,以獲得控制權。高管層將需要確定其人工智能機會在哪里,以及必須與不同部門進行哪些對話,以決定由誰來領導。與此同時,首席信息官們正面臨著來自首席執(zhí)行官的壓力,要求其擴大對生成式人工智能的使用。2024年,隨著戰(zhàn)斗的繼續(xù),我們將看到首席信息官們繼續(xù)推進其探索性人工智能實驗和項目。–Alon Goren,AnswerRocket首席執(zhí)行官
小型、專業(yè)化的大型語言模型將戰(zhàn)勝龐大的通用模型。正如我們在“大數據”時代所看到的那樣——越大越好。模型的“獲勝”不是基于其擁有多少參數,而是基于其在特定領域任務上的有效性及其效率。企業(yè)將擁有自己的重點模型組合,而不是擁有一兩個大型模型來統(tǒng)治所有模型,每個模型都針對特定任務進行微調,并最小化規(guī)模以降低計算成本并提高性能。–Nick Elprin,Domino Data Lab聯(lián)合創(chuàng)始人兼首席執(zhí)行官
生成式AI將重點轉向結構化企業(yè)數據:企業(yè)將擁抱使用生成式AI從結構化數字數據中提取見解,增強生成式AI在從圖像、視頻、文本和音頻生成原始內容方面的傳統(tǒng)應用。生成式人工智能將堅持自動化數據分析,簡化模式、異常和趨勢的快速識別,特別是在傳感器和機器數據用例中。這種自動化將增強預測分析,使企業(yè)能夠主動響應不斷變化的條件、優(yōu)化運營并改善客戶體驗。–Nima Negahban,Kinetica首席執(zhí)行官兼聯(lián)合創(chuàng)始人
人工智能驅動的人類質量翻譯將使生產力提高10倍甚至更多:2023年初,每個人都認為僅LLM就能產生人類質量的翻譯。在這一年里,我們發(fā)現(xiàn)了LLM翻譯中的多個差距,從幻覺到英語以外語言的表現(xiàn)欠佳。與云存儲或服務一樣,人工智能質量翻譯的成本越來越高,翻譯幾乎所有內容的ROI變得有吸引力,為那些使用人工智能進入全球市場的企業(yè)創(chuàng)造了競爭優(yōu)勢。與人們普遍認為語言服務行業(yè)將在2024年萎縮的觀點相反,隨著更多內容的本地化,該行業(yè)將會增長,但成本更低。2024年將是翻譯成本直線下降的一年。由語言AI和AI驅動的語言質量保證提供支持的翻譯人員的工作效率可提高10倍甚至更多。–Bryan Murphy,Smartling首席執(zhí)行官
盡管2023年人們對人工智能(AI)的出現(xiàn)進行了大肆宣傳,其看似具有無限的潛力,但在醫(yī)療保健領域,我們已經開始看到基于規(guī)定性、大型語言模型(LLM)的解決方案在提供臨床建議和見解方面的局限性。到2024年,我們預計臨床醫(yī)生在人工智能方面越來越成熟,他們將尋求方法來減輕接受基于法學碩士的解決方案的規(guī)定性建議的潛在風險,而不是選擇提供循證和可解釋建議的負責任的人工智能解決方案。隨著焦點轉向負責任的人工智能,尋求將創(chuàng)新人工智能技術融入其組織的臨床工作流程的醫(yī)療保健領導者將需要了解這些工具的工作原理。依賴于獲得許可的LLM的解決方案無法為個體患者的護理提供量身定制的建議,因為這些解決方案基于數百萬個數據點,沒有具體強調個人。這些解決方案的“黑匣子”性質缺乏個性化關注和“可解釋性”,這將強調臨床醫(yī)生在決策中擁有最終決定權的必要性。因此,我們預計2024年將出現(xiàn)自然分裂:現(xiàn)有的提供臨床建議的解決方案將越來越多地基于特定數據,并為人工智能生成的見解提供證據。相比之下,旨在支持臨床醫(yī)生編寫文檔和就診總結的解決方案,嚴重依賴于自然語言生成,將受益于通用LLM的使用。–Ronen Lavi,Navina首席執(zhí)行官兼聯(lián)合創(chuàng)始人
雖然人工智能和LLM持續(xù)受歡迎,但潛在的危險也隨之增加:隨著人工智能和LLM在2023年迅速崛起,商業(yè)格局發(fā)生了深刻的轉變,其特點是創(chuàng)新和效率。但這種快速上升也引起了人們對敏感數據的利用和保護的擔憂。不幸的是,早期跡象表明,數據安全問題明年只會加劇。如果得到有效的提示,LLM擅長從培訓數據中提取有價值的見解,但這帶來了一系列獨特的挑戰(zhàn),需要現(xiàn)代技術解決方案。隨著2024年人工智能和LLM的使用繼續(xù)增長,平衡潛在收益與降低風險和確保負責任使用的需求至關重要。如果不對AI訪問的數據進行嚴格的數據保護,數據泄露的風險就會增加,從而可能導致財務損失、監(jiān)管罰款和嚴重損害了組織的聲譽。組織內部還存在內部威脅的危險風險,受信任的人員可以利用人工智能和LLM工具進行未經授權的數據共享,無論是否惡意進行,都可能導致知識產權盜竊、企業(yè)間諜活動和組織聲譽受損。來年,組織將通過實施全面的數據治理框架來應對這些挑戰(zhàn),包括數據分類、訪問控制、匿名化、頻繁審計和監(jiān)控、監(jiān)管合規(guī)性以及一致的員工培訓。此外,基于SaaS的數據治理和數據安全解決方案將在保護數據方面發(fā)揮關鍵作用,因為其使組織能夠毫無障礙地將數據融入到現(xiàn)有框架中。–James Beecham,ALTR首席執(zhí)行官
生成式AI和大語言模型(LLM)的炒作將開始消退:毫無疑問,GenAI是一次重大飛躍;然而,許多人嚴重高估了實際的可能性。盡管生成的文本、圖像和聲音看起來非常真實,似乎它們是經過深思熟慮和像人類一樣對準確性的渴望而創(chuàng)建的,但它們實際上只是統(tǒng)計上相關的單詞或圖像的集合,這些集合很好地組合在一起。但實際上,可能完全不準確。好在,如果終端用戶充分考慮人工智能的所有優(yōu)點和局限性,那么人工智能的實際輸出將非常有用。–Ryan Welsh,Kyndi創(chuàng)始人兼首席執(zhí)行官
因此,到2024年,組織將迎來對GenAI和LLM可以給其業(yè)務帶來的真正限制和好處的現(xiàn)實檢查,評估的結果將重新調整這些技術的戰(zhàn)略和采用。供應商需要讓終端用戶清楚這些好處和限制,因為其對人工智能創(chuàng)造的任何東西都持適當的懷疑態(tài)度。必須考慮準確性、可解釋性、安全性和總成本等關鍵要素。來年,GenAI領域將為企業(yè)帶來一種新的范式,在這種范式中,企業(yè)只需要在生產中部署少量基于GenAI的應用來解決特定的用例。
矢量數據庫:隨著人工智能從頭開始構建新應用,以及LLM集成到現(xiàn)有應用中,矢量數據庫將在技術堆棧中發(fā)揮越來越重要的作用,就像過去的應用數據庫一樣。當團隊尋求創(chuàng)建具有新的LLM支持功能的人工智能產品時,將需要可擴展、易于使用且操作簡單的矢量數據存儲。–Avthar Sewrathan,Timescale總經理
LLM提供商之間的競爭:大型語言模型(LLM)的格局正在升溫。OpenAI及其GPT-4 Turbo一直處于領先地位,但其他企業(yè)如Anthropic的Claude、Google的Gemini和Meta的Llama也緊隨其后。OpenAI最近的管理層動蕩,尤其是Sam Altman的事件,為這些競爭對手提供了機會,并有可能在某些領域超越OpenAI。–Tomer Borenstein,BlastPoint,Inc.聯(lián)合創(chuàng)始人兼首席技術官
當組織意識到沒有靈丹妙藥時,生成式人工智能將達到幻滅的低谷。毫無疑問,生成式人工智能的使用將在2024年繼續(xù)呈爆炸式增長。然而,如果許多組織對其效益實現(xiàn)的速度的期望不切實際,或者沒有專業(yè)知識來有效地實施和使用,可能會對生成式人工智能的性能感到失望。到2024年,我們預計會看到生成式人工智能的幻滅低谷。這并不是說生成式人工智能失敗了。這僅僅意味著生成式人工智能解決方案需要更多時間才能達到預期的結果。–Cody Cornell,Swimlane聯(lián)合創(chuàng)始人兼首席戰(zhàn)略官
人們對矢量數據庫的興趣將會激增,但這種興趣不會持久:矢量數據庫將成為許多人討論的熱門新領域,但幾年后最終將被關系數據庫吸收。每隔10年左右,就會有一種“新”數據庫技術被宣布為關系數據庫的終結,而開發(fā)人員跟隨這一潮流只是為了重新發(fā)現(xiàn)關系模型非常靈活,并且關系數據庫供應商可以很容易地將新技術應用到其產品中。以PostgreSQL的pgVector為例,了解當今關系數據庫如何處理矢量數據,以及為什么能夠忽略圍繞專用矢量數據庫的炒作。pgVector和PostgreSQL能夠快速支持圍繞矢量數據的這一用例——該項目于2021年啟動,但今年隨著對生成人工智能和矢量數據的所有興趣,其發(fā)展得很快。對于那些考慮這個領域并考慮在其項目中實現(xiàn)開源組件的人來說,pgVector使PostgreSQL成為一個顯而易見的選擇。–Dave Stokes,Percona技術員
企業(yè)正在加快投資,以保護員工的生成式人工智能,以及整體人工智能投資:對技術的投資正在增加,甚至超過了對辦公空間的投資。人工智能或許帶來了當今所有類別中最大的增長潛力,但也帶來了一些最大的風險。企業(yè)將投資抓住人工智能優(yōu)勢,同時積極緩解和解決其風險因素。隨著生成式人工智能在工作場所發(fā)揮作用,雇主正在投資指導方針、風險緩解技術和參數,特別是在保護企業(yè)信息免受“未知”風險因素影響時。McKinsey 2023年的一份報告指出,據報告采用人工智能的企業(yè)中有60%正在使用生成式人工智能。WalkMe認為,這個數字將繼續(xù)增加,就像云和互聯(lián)網的采用一樣。同一份報告發(fā)現(xiàn),生成式人工智能的兩個最大風險是不準確和網絡安全。我們預計這些問題將會升級,隨著技術狀況的改善,企業(yè)應對風險的能力將會提高。–Uzi Dvir,WalkMe首席技術官
越來越多的組織開始涉足生成式AI,并更廣泛地增加對機器學習的投資。對于想要在云平臺上運行機器學習作業(yè)的平臺團隊來說,這面臨著許多運營挑戰(zhàn)。MLOps是目前的熱門話題,但仍處于采用的早期階段——隨著越來越多的組織成熟其ML基礎設施,我們將看到該領域的進步。–Malavika Balachandran,Tadeusz高級產品經理
LLM過渡到更小的模型以提高可訪問性:雖然LLM的通用性令人印象深刻,但其需要大量的計算和存儲來開發(fā)、調整和使用,因此對于絕大多數組織來說,成本可能過高。只有擁有豐富資源的企業(yè)才有能力獲取這些資源。由于需要找到一條使其在經濟上更加可行的道路,我們應該期望看到能夠使其使用去中心化和民主化的解決方案。我們應該預見更多、更集中、更小、功耗更低的型號,將更容易為更廣泛的用戶所使用。這些重點模型也應該不易受到LLM經常遭受的幻覺影響。–Naren Narendran,Aerospike首席科學家
關于數據所有權的討論將會升溫:隨著大型語言模型(LLM)變得更加強大和復雜,關于數據所有權的爭論將會越來越激烈。與我們在開源代碼中看到的情況類似,關于大企業(yè)如何使用其不擁有的數據來訓練模型的討論正在進行中,這可能導致權力集中在少數大企業(yè)手中。為了解決這個問題,我們將看到新的數據許可框架。這些框架應確保數據所有者因其數據的使用而得到公平的補償,并確保用戶能夠以負責任和合乎道德的方式訪問和使用數據。–Bob Friday,Juniper Networks首席人工智能官
是否投資人工智能聊天機器人:我們知道,Z世代通常尋求數字形式的溝通,而不是通過電話與人交談,對于客戶服務請求尤其如此。需要注意的是,這一群體希望其媒體和技術能夠形成一種共生關系,支持聯(lián)系、參與和實用性;當其看到良好的客戶體驗時,便會知曉,并且會避免任何不佳的體驗。組織正在投資生成式人工智能功能,以吸引人們在應用上停留更長時間,并推動Z世代用戶進行更多活動。這是正確的舉措,如果做得正確,可以產生巨大的影響。組織不會僅僅通過創(chuàng)建更好的聊天機器人來獲得成功,因為Z世代渴望真實的聯(lián)系和實用性,而這是難以復制的。如果聊天機器人可以為用戶提供新的體驗、建議和其他有用的服務,那么其可能會增加特定應用或品牌網站上的活動。話雖如此,用戶可能會對GenAI機器人持懷疑態(tài)度和謹慎態(tài)度,組織需要展示漸進的勝利,以增強聊天機器人的安全性和價值。–Robin Gomez,Radial客戶服務創(chuàng)新總監(jiān)
雖然2023年是生成式AI突破的一年,但由于數據障礙,供應鏈行業(yè)在采用上落后了——只有3%的組織報告使用生成人工智能進行供應鏈管理。手動、紙質流程仍然主導著全球貿易,因此許多供應鏈企業(yè)一直在努力統(tǒng)一不同來源的大量非結構化數據。然而,解決了這一數據問題的企業(yè),將使2024年成為生成式人工智能供應鏈突破之年。隨著生成式人工智能模型被訓練成供應鏈專家,全球供應鏈將變得更加自主、自我修復和自我優(yōu)化。例如,生成式人工智能可以告訴托運人有關異常情況(由于極端天氣導致發(fā)貨延遲)、如何處理(重新路由到更可靠的位置),甚至最終執(zhí)行解決方案。通過告訴企業(yè)需要將精力集中在哪里,這些人工智能創(chuàng)新將使全球品牌能夠提供更好的客戶體驗,并以最低的成本和對環(huán)境的影響來發(fā)展業(yè)務。–AJ Wilhoit,project44首席產品官
生成式人工智能主導了今年的話題,這是有充分理由的——其將在2024年顯著成熟并擴大規(guī)模。生成式AI的大量應用目前正處于實驗階段,并有望不斷發(fā)展。真正的價值在于,其能夠幫助人們理解各種內部用例中的非結構化信息——解析大量文檔,生成更簡潔和信息豐富的摘要,并促進與這些文檔的問答交互,從而確保跨多個領域的一致性。除此之外,LLM界面和基于文本的界面將成為幾乎每個軟件產品的組成部分。這些界面將用于一切,從控制應用到回答用戶對應用本身的查詢。我們開始在企業(yè)網站中看到這種面向消費者的元素。此外,在接下來的一年里,我們可以期待看到一個向更小、更專業(yè)的LLM的轉變,從而減少培訓所需的數據量。這種轉變與更廣泛地推動開源解決方案相一致,特別是可以證明信息源譜系的模型。–Michael Curry,Rocket Software數據現(xiàn)代化總裁
生成式AI和AI編碼助手將通過嵌入式環(huán)境從一些人所謂的“初級開發(fā)人員”級別(代碼接受率為25-30%)提升到CTO級別。添加更多上下文(包括運行時上下文)的能力將以指數方式增加價值,并大幅提高人工智能生成代碼的接受率(70%或更高)。更深入一層……目前,深度調試、多文件更改、使用大文件作為輸入等活動超出了大多數編碼助理的范圍。—Elizabeth Lawler,AppMap首席執(zhí)行官
GenAI將推動轉型:2024年,GenAI將推動各個領域的轉型,使其變得更加緊迫和變革。在定制GenAI代理的幫助下,閱讀、組織和清理非結構化數據等任務可以“AI優(yōu)先”完成,減少了大量的手工工作。GenAI可以從任何地方訪問數據,但治理、數據管道和流程對于管理質量、實現(xiàn)結果、評估價值、確定權利和實現(xiàn)合規(guī)性仍然是必要的。GenAI與云相結合,可以加速與數據相關的轉型計劃。此外,GenAI還可以幫助組織超越競爭對手并加速轉型,處理財務、稅務、法律、IT、合規(guī)和其他部門的復雜任務和流程。利用GenAI作為轉型催化劑有可能在競爭對手和組織之間造成分歧,未能利用GenAI的組織可能難以與那些利用GenAI的組織競爭。–Bret Greenstein,PwC US數據和人工智能主管
我們如何在業(yè)務中使用生成式人工智能?我們是構建還是購買自己的人工智能解決方案?我們如何提高員工的技能以跟上人工智能的步伐?這些問題圍繞著所有行業(yè),而不僅僅是科技行業(yè),并指向一個共同的主題:2024年,生成式人工智能將對未來的工作產生重大影響。新技術的引入往往伴隨著來自企業(yè)領導者的巨大壓力,要求其快速部署這些新解決方案。2024年,我們將看到組織意識到其不能再觀望。其需要找到全力投入人工智能的方法。在接下來的6-12個月內,我們將看到重大轉變,更多組織投資人工智能戰(zhàn)略,并找到使用該技術重新構想其工作流程,并提高效率的方法。–Glean,Arvind Jain首席執(zhí)行官
2023年,企業(yè)正在探索人工智能的基礎知識,但我們預計2024年對定制人工智能模型的需求將激增。盡管GPT-4等LLM擁有豐富的知識,但將其應用于新領域仍會帶來挑戰(zhàn)。為了解決這一知識差距,我們預計“知識注入”將會增加,其中LLM與特定領域的數據集成,形成更專業(yè)、情境感知的人工智能解決方案。例如,將通用LLM與患者記錄合并,可以增強醫(yī)療保健行業(yè)的整體患者-提供者體驗。在商業(yè)中,將人工智能與客戶交互聯(lián)系起來,可以提供模型銷售領域的專業(yè)知識,并使收入團隊受益。隨著2024年的臨近,知識注入等趨勢為企業(yè)提供了利用LLM和特定數據庫來促進創(chuàng)新和增長的機會。–Gong,Omri Allouche研究副總裁
未完,待續(xù)…
若想查看“2024年大數據行業(yè)預測”相關篇章,請點擊:





























