精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4正接管人類數據專家!先驗知識讓LLM大膽預測,準確率堪比傳統方式

人工智能 新聞
終有一天,LLM可以成為人類數據專家,針對不同領域進行數據分析,大大解放AI研究員。

在數據科學中,AI研究員經常面臨處理不完整數據集的挑戰。

然而,許多已有的算法根本無法處理「不完整」的數據序列。

傳統上,數據科學家會求助于專家,利用他們的專業知識來填補空白,然而這一過程既耗時,卻又不實用。

如果AI可以接管專家的角色,又會如何呢?

近日,來自德國人工智能中心、大阪公立大學等團隊的研究人員,調查了LLM能否足以充當數字專家。

畢竟,當前大模型都在大量文本的基礎上進行了訓練,可能對醫學數據、社會科學等不同主題的問題有著深刻的理解。

圖片

論文地址:https://arxiv.org/pdf/2402.07770.pdf

研究人員通過將LLM的答案與實際數據進行比較,并建立了處理數據差距的統計方法。

結果表明,在許多情況下,LLM可以在不依賴人類專家的情況下,提供與傳統方法類似的準確估計。

用LLM進行「數據插補」

在分析數據時,無論是醫學、經濟學還是環境研究,經常會遇到信息不完整的問題。

這就需要用到兩種關鍵技術:先驗啟發(確定先驗知識)和數據插補(補充缺失數據)。

先驗啟發是指,系統地收集現有的專家知識,以對模型中的某些參數做出假設。

另一方面,當我們的數據集中缺少信息時,數據插補就開始發揮作用。

科學家們不會因為一些缺失而放棄有價值的數據集,而是使用統計方法用看似合理的值來填補。

研究中,主要采用的數據集為OpenML-CC18 Curated Classification Benchmark,其中包括72個分類數據集,涵蓋從信用評級到醫藥和營銷等各個領域。

這種多樣性確保了實驗涵蓋了廣泛的現實世界場景,并為LLM在不同環境下的性能提供了相關見解。

值得一提的是,最新方法中最關鍵的一個步驟便是——人為在數據集中生成缺失值,以模擬數據點不完整的情況。

研究人員用隨機缺失(MAR)模式從完整條目中生成這種缺失數據,以便與基本事實進行比較。

他們首先從OpenML描述中,為每個數據集生成一個適當的專家角色,然后使用它來初始化LLM,以便可以查詢它是否缺少值。

使用LLM進行插值,包括LLaMA 2 13B Chat、LLaMA 2 70B Chat、Mistral 7B Instruct,以及Mixtral 8x7B Instruct,每一種都進行了單獨的評估。

將這些模型與這類分析中常用的3種經驗方法進行了比較:分別用于連續特征和分類特征的平均值和模式估算、k-近鄰(k-NN)估算和隨機森林估算。

歸因質量的評估基于,連續特征和分類特征的歸一化均方根誤差(NRMSE)和F1分數。

通過這一方法,能夠讓研究人員可以調查LLM作為數據推算專家的能力,而且還可以將其表現與傳統方法進行比較。

這種創新的方法在處理不完整的數據集方面開辟了新的視角,并突出了LLM在數據科學中的潛力。

與傳統方法比較

與預期相反,分析結果表明,LLM的估算質量一般不會超過三種經驗方法。

然而,基于LLM的插補對于某些數據集是有用的,特別是在工程和計算機視覺領域。

一些數據集,如這些領域的「PC1」、「PC3」和「Satimage」,表現出NRMSE約為0.1的歸因質量,在生物學和NLP領域也觀察到了類似的結果。

有趣的是,基于LLM歸因的下游表現因領域而異。

雖然社會科學和心理學等領域表現較差,但醫學、經濟學、商業和生物學表現較好。值得注意的是,基于LLM的插補在商業領域表現最好。

此外,研究還表明,至少在某些領域,LLM可以基于其豐富的訓練數據提供準確和相關的估計,這些數據可以與真實世界的數據相匹配。

使用LLM進行數據插補是有前景的,但它需要仔細考慮領域和特定用例。

因此,這項研究結果有助于更好地理解LLM在數據科學中的潛力和局限性。

用LLM先驗啟發

此外,研究人員還利用LLM研究了先驗啟發,旨在評估LLM能否提供有關特征分布的信息,以及這對數據收集和后續數據分析有何影響。

特別是,進一步了解LLM所獲得的先驗分布的影響和有效性,并比較它們與傳統方法和模型的性能如何。

作者將LLM的估計值與Stefan等人的實驗結果進行了比較。

在該實驗中,6位心理學研究人員被問及各自領域中典型的中小效應量和皮爾遜相關性。

使用類似的問題,要求LLM模擬一個專家、一組專家或一個非專家,然后查詢優先級分布。

在進行這項工作時,可以參考或不參考對比實驗中使用的訪談方案。

這里研究人員提出一種全新的提示策略,要求模型為貝葉斯數據分析提供專家知情的先驗分布。

在此過程中,ChatGPT 3.5展示了其對學術啟發框架的熟悉程度,比如謝菲爾德啟發框架與直方圖方法相結合。

研究人員使用該框架生成了全球25個大小城市12月份典型日氣溫和降水量的先驗分布。

ChatGPT使用從訓練數據中獲得的知識進行模擬專家討論,并構建參數概率分布。

實驗結果

令人驚訝的是,不同子領域的專家角色對LLM產生的先驗沒有顯著影響。

在實驗中,無論他們扮演什么角色,他們的判斷都非常相似:

大多數人工專家都傾向于謹慎預測,認為影響較小。只有GPT-4專家比較大膽,認為影響中等偏大。

當涉及到兩個事物之間的關系時,比如天氣對我們購物行為的影響,數字助理們與真人的觀點有所不同。

有些數字助理呈現出一條中間低、邊緣高的「浴缸」曲線,而GPT-4則向我們展示了一條更平滑的鐘形曲線。

然后,作者還觀察了這些數字專家對他們的預測的信心。一些人相當謹慎,提供了保守的估計,除了Mistral 7B Instruct——對其估計的質量非常有信心。

綜上所述,這些結果還表明,LLM在某些方面能夠產生與人類專家判斷競爭的先驗,但在其他方面卻顯著不同。

結論

這項研究表明,在醫學、經濟和生物等領域,LLM已經可以基于傳統的數據插補的方法,提供有價值的見解。

LLM能夠綜合來自各種來源的知識,并將其應用于特定的應用環境,為數據分析開辟了新的視野。

特別是在專家難覓,或時間寶貴的情況下,LLM可以成為寶貴的資源。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-10-14 17:24:49

2023-10-14 13:09:53

谷歌模型

2023-10-10 14:00:00

AI模型

2023-11-20 21:56:04

AI推理

2024-01-29 12:49:00

AI模型

2023-09-19 09:20:16

2024-04-15 11:48:09

2023-08-17 13:30:28

AI測試

2023-12-04 13:51:00

模型數據

2017-05-08 09:36:50

人工智能法官法院

2025-01-21 08:00:00

2024-05-20 08:40:00

2024-10-23 11:59:33

2025-09-15 09:11:00

2024-05-27 13:42:00

2023-05-10 15:10:00

人工智能工作

2023-08-15 10:33:06

微軟必應人工智能

2024-06-11 00:04:00

GPT-4PNASLLM

2025-05-26 08:33:00

2024-01-03 13:37:00

模型數據
點贊
收藏

51CTO技術棧公眾號

亚洲国产精久久久久久| 国产高清亚洲| 成人av在线播放网站| 最近2019中文字幕大全第二页| av免费网站观看| 成人高清免费观看mv| 日本免费新一区视频| 中文字幕欧美专区| 日韩av加勒比| 在线免费观看的av| av电影一区二区| 欧美第一页在线| 国产无套精品一区二区三区| 裸模一区二区三区免费| 182在线观看视频| 久久99成人| 天天色图综合网| 欧美成人综合一区| 高清乱码免费看污| 婷婷精品视频| 欧美三区免费完整视频在线观看| 在线视频不卡一区二区三区| 精品人妻午夜一区二区三区四区 | 天天色综合色| 日韩精品综合一本久道在线视频| gogogo免费高清日本写真| 精品人妻一区二区三区含羞草| 亚洲免费高清| 国产一区二区日韩| 免费黄色在线播放| 电影一区二区三区| 国产欧美一区二区三区在线老狼| 亚洲精品欧美极品| 色欲一区二区三区精品a片| 国产精品美女久久久久人| 亚洲色图在线播放| 精品国产乱码久久久久久88av| 日韩精品在线一区二区三区| 欧美日韩亚洲一区三区| 亚洲全黄一级网站| 91精品国产乱码久久久久久久久 | 亚洲国产老妈| 怡红院精品视频在线观看极品| 日韩欧美国产三级| 和岳每晚弄的高潮嗷嗷叫视频| 成人免费视频国产| 天堂在线一区二区| 久久久在线观看| 中文字幕美女视频| 蜜乳av综合| 日韩一级成人av| 日韩一级免费片| 男人天堂手机在线| 久久精品免视看| 国产日韩欧美一区二区| 国产精品久久影视| 欧美成人高清| 波霸ol色综合久久| 精品无码在线视频| 看亚洲a级一级毛片| 一本色道亚洲精品aⅴ| 天天做天天躁天天躁| av影片免费在线观看| 国产精品伊人色| 国产精品人人做人人爽| 国产免费久久av| 亚洲一级片免费观看| a'aaa级片在线观看| 亚洲乱码中文字幕| 亚洲第一精品区| 欧美一区二区三区成人片在线| 午夜一级在线看亚洲| 欧美激情按摩在线| 欧美成人片在线观看| 亚州av乱码久久精品蜜桃| 在线精品高清中文字幕| 国精产品一区二区三区| 91免费精品国偷自产在线在线| 色欧美片视频在线观看| 国产又大又硬又粗| 亚洲色图官网| 精品久久久久久久久久久久久久 | 国产成人亚洲一区二区三区| 色婷婷亚洲一区二区三区| 亚洲熟妇av日韩熟妇在线| 黄色美女视频在线观看| 亚洲国产日韩a在线播放性色| 精品国产一区二区三区忘忧草 | 国产美女福利视频| 日本道不卡免费一区| 亚洲午夜久久久影院| 亚洲av成人精品一区二区三区| 国产亚洲观看| 日韩精品一区二区三区视频播放| 在线播放黄色av| 久久青草视频| 日韩一级完整毛片| 无码国产精品一区二区免费式直播 | 久久久精品国产99久久精品芒果| 狠狠色噜噜狠狠狠狠色吗综合| 国产美女www爽爽爽| 日本中文一区二区三区| 国产精品日本精品| www.国产黄色| av电影天堂一区二区在线观看| 狠狠色伊人亚洲综合网站色 | 日韩av在线网站| 911亚洲精选| 窝窝社区一区二区| 中文字幕av一区二区| 2025国产精品自拍| 一区在线免费| 国产精品高清免费在线观看| 国产女人18毛片水真多| caoporm超碰国产精品| 久久一区二区精品| lutube成人福利在线观看| www.日韩大片| 久久综合九色综合97婷婷女人 | xxxx性欧美| 国产亚洲欧美精品久久久久久| 亚洲女同中文字幕| 久久久噜噜噜久久| 中文天堂在线播放| 国产91精品一区二区麻豆网站| 久久av一区二区三区亚洲| 在线看av的网址| 亚洲另类中文字| 国产无套粉嫩白浆内谢的出处| 福利一区二区三区视频在线观看| 日韩欧美国产综合在线一区二区三区| 国产+高潮+白浆+无码| 一区二区三区日本久久久| 久久视频在线直播| 久久视频免费看| 日本午夜一区二区| 亚洲已满18点击进入在线看片| 欧美拍拍视频| 中文字幕制服丝袜一区二区三区 | 亚洲欧美日韩一区二区在线| 亚洲波多野结衣| 日韩成人av影视| 久久99国产精品| dy888亚洲精品一区二区三区| 亚洲国产成人91porn| 欧美成人三级在线播放| 日韩精选在线| 精品亚洲一区二区三区| www.4hu95.com四虎| 91精品秘密在线观看| 国产97在线|日韩| 色欲久久久天天天综合网| 亚洲人成小说网站色在线 | 无码人妻aⅴ一区二区三区| 欧美有码视频| 国产精品久久91| 天堂在线视频观看| 亚洲欧洲日产国码二区| 欧美三级一级片| 亚洲一区二区中文字幕在线观看| 99精品中文字幕在线不卡| 久久久国产精彩视频美女艺术照福利 | 久久久久久免费观看| 日韩福利视频导航| 欧美成人免费在线| 在线天堂新版最新版在线8| 精品国产成人在线影院 | 亚洲精品电影久久久| 国产真人无码作爱视频免费| 成人av综合网| xxxx欧美18另类的高清| 亚洲图片欧美在线| 久久精品男人的天堂| 激情六月丁香婷婷| 秋霞一区二区三区| 欧美激情第1页| 东京干手机福利视频| 一区二区三区波多野结衣在线观看| 69久久久久久| 成人在线国产| 国产一区红桃视频| 久操视频在线免费播放| 色国产综合视频| 欧美人妻一区二区三区| 亚洲在线国产日韩欧美| 久久综合九色99| 全亚洲第一av番号网站| 亚洲国产精彩中文乱码av| www..com国产| 国产午夜精品福利| 午夜免费看视频| 亚洲va久久| 国产精品啪视频| 91国内在线| 欧美一区二区三区性视频| 欧美激情第四页| 欧美午夜精彩| 91亚洲午夜在线| 青青青国内视频在线观看软件| 91精品国产全国免费观看| 久久国产在线观看| 久久亚洲免费视频| 欧美少妇性生活视频| 丝袜美腿一区二区三区动态图| 国产a∨精品一区二区三区不卡| 国产精品10p综合二区| 国产精品一区在线看| 欧美午夜精品一区| 国产精品成人69xxx免费视频| 裸体在线国模精品偷拍| 男人的天堂avav| 国产尤物久久久| 亚洲free嫩bbb| 日本不卡1234视频| 亚洲天堂成人在线视频| 91丨九色丨海角社区| 亚洲欧美区自拍先锋| www.超碰97| 美国毛片一区二区三区| 亚洲免费av网| 欧美一区 二区| 欧洲午夜精品久久久| 黄色网址免费在线观看| 亚洲精品av在线| 成人一级免费视频| 亚洲成a人v欧美综合天堂下载| 中文字幕人妻一区二区三区| 秋霞电影网一区二区| 亚洲国产激情一区二区三区| 99re热精品视频| 国产精品美女免费| √8天堂资源地址中文在线| 国产一区二区免费| 农村少妇久久久久久久| 欧美日韩三级一区二区| 日韩欧美三级在线观看| 中文字幕中文字幕一区二区| 精品无码人妻一区| 日本乱理伦在线| 欧美日韩精品在线观看| 国产精品美女高潮无套| 处破女av一区二区| 91福利免费观看| 老司机亚洲精品| 亚洲国产精品一区二区第一页 | 亚洲国产欧美在线成人app| 国产精品久久久久久久久久精爆| 一区二区三区四区激情 | 久久亚洲精精品中文字幕早川悠里| 亚欧精品在线视频| 日韩福利视频网| 国产精品12345| 中文一区一区三区免费在线观看| 日韩精彩视频| japanese色系久久精品| 91网站在线免费观看| 欧美黄页免费| 国产精品视频在线观看| 日韩av大片站长工具| 97视频在线看| 色av手机在线| 久久91精品国产91久久久| 免费av毛片在线看| 精品久久久久久久一区二区蜜臀| 国产女人18毛片水真多| 欧美精品一卡二卡| 黄色片免费观看视频| 调教+趴+乳夹+国产+精品| 亚洲视频免费播放| 亚洲美女视频在线观看| 香蕉视频在线网址| 成人精品在线播放| 亚洲成成品网站| 91女人18毛片水多国产| 日韩高清欧美激情| 日本成人中文字幕在线| 三级久久三级久久久| 美女网站免费观看视频| 麻豆成人在线观看| 在线播放av中文字幕| 久久精品国产亚洲高清剧情介绍| 亚洲娇小娇小娇小| 国产电影精品久久禁18| 大桥未久恸哭の女教师| 久久电影网电视剧免费观看| 国产福利精品一区二区三区| 激情五月婷婷综合| 涩多多在线观看| 粉嫩蜜臀av国产精品网站| 国产不卡一二三| 99国产精品99久久久久久| 男人舔女人下部高潮全视频| 国产精品水嫩水嫩| 久久黄色免费视频| 欧美性xxxx在线播放| 波多野结衣一二区| 91麻豆精品国产91久久久久久| 一级黄色片网站| 91精品国产综合久久精品性色| 乱精品一区字幕二区| 亚洲欧洲在线观看| 国产精品实拍| 国模私拍一区二区三区| 秋霞国产精品| 99高清视频有精品视频| www.自拍偷拍| 91理论电影在线观看| 亚洲欧洲综合网| 亚洲午夜久久久久久久久电影院 | 干日本少妇首页| 久久精品国产久精国产爱| 可以看的av网址| 26uuu国产在线精品一区二区| 国产精品精品软件男同| 亚洲一区二区3| 五月婷婷丁香在线| 欧美精品一区视频| 午夜视频在线看| 91国内产香蕉| 亚洲wwww| 成人av网站观看| 国产一区二区三区网| 青青草视频国产| 精品亚洲免费视频| 五月婷婷综合在线观看| 亚洲一二三四区不卡| 中文字幕手机在线视频| 欧美电影免费观看完整版| 国产黄在线播放| 日本久久久久久久久| 66精品视频在线观看| 一区二区三区av在线| 激情综合自拍| 性久久久久久久久久久久久久| 91麻豆免费观看| 亚洲国产成人精品激情在线| 欧美日韩黄色一区二区| 日批视频免费播放| 中文字幕精品一区久久久久| 天堂av在线电影| 97久久精品国产| 中文字幕区一区二区三| 欧美精品尤物在线| 欧美激情综合色综合啪啪| 天天操精品视频| 中文字幕永久在线不卡| 中文字字幕在线中文乱码| 日韩精品久久久久久福利| 成全电影大全在线观看| 99三级在线| 黑丝一区二区三区| www激情五月| 国产欧美视频在线观看| 国产成人在线视频观看| 亚洲国产日韩欧美综合久久| 91极品在线| 91一区二区三区| 欧美激情777| 可以免费在线看黄的网站| 国产午夜精品在线观看| 成人亚洲精品777777大片| 国产精品欧美大片| 青青草综合视频| 国产综合成人久久大片91| 国精产品视频一二二区| 在线成人高清不卡| 国产福利在线| 国产精品一区二区性色av| 女人av一区| 波多野结衣天堂| 国产成人精品亚洲日本在线桃色 | 国产精品久久久久一区二区三区共| 精品乱码一区内射人妻无码 | 国产一区深夜福利| 99久久www免费| 老女人性生活视频| 亚洲制服欧美中文字幕中文字幕| 成人毛片在线免费观看| 热re99久久精品国产66热| 欧美日韩精品在线一区| 精品亚洲视频在线| 国产精品久久毛片a| 亚洲风情第一页| 国产91热爆ts人妖在线| 国产欧美日韩影院| 中文字幕12页| 午夜天堂影视香蕉久久| 国产对白叫床清晰在线播放| 成人激情春色网| 影音先锋日韩资源| 欧美性受xxxx黑人| 欧美精品在线一区二区| 高清毛片在线观看| 国产精品一区二区免费看| 亚洲视频二区| 国产精品69久久久久孕妇欧美| 欧美一级高清大全免费观看| 久久男人av资源站| 神马影院午夜我不卡| 高清免费成人av|