精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

又遇到「GPT寫的review」了?看看北大&密歇根的這個研究工作

人工智能 新聞
低質量的審稿是一直讓研究者頭疼的事情。大語言模型(LLMs)的流行給審稿質量帶來轉機了嗎?

本文是對發表在計算經濟學頂級會議ACM Conference on Economics and Computation (EC'24)上的論文Eliciting Informative Text Evaluations with Large Language Models的解讀。該論文由北京大學前沿計算研究中心孔雨晴課題組與密歇根大學Grant Schoenenbeck課題組合作完成,共同一作為北京大學計算機學院博士生陸宇暄和密歇根大學博士生許晟偉。

圖片

圖片

  • 論文鏈接:https://arxiv.org/abs/2405.15077
  • 現場交流 Oral at EC’24:

Yale School of Management, New Haven, Room 2400

Wednesday, July 10. 14:30–16:00 (EDT)

介紹

你遇到過“ChatGPT”味道十足的審稿意見嗎?質量如何呢?

低質量的審稿是一直讓研究者頭疼的事情。大語言模型(LLMs)的流行給審稿質量帶來轉機了嗎?

不妨看看下面這兩個例子,你能夠分辨其中哪個是由ChatGPT-4o生成的嗎?

例1:

… The paper is engaging and addresses a highly pertinent issue: information elicitation in the context of Large Language Models (LLMs). The concept of computing conditional probability using an LLM is both elegant and innovative. …

… A primary concern is the robustness of the method used to estimate conditional probability with an LLM, which may require additional experimentation and methodological refinement to ensure reliability and applicability across diverse scenarios. …

例2:

… The paper presents a novel application of LLMs to enhance peer prediction mechanisms, which is a significant step forward from traditional methods that focus on simpler report types. …

… While the mechanisms are theoretically sound, their practical implementation, especially in real-world settings with diverse and complex textual inputs, might pose significant challenges. …

當你仔細品讀這兩個例子的語法使用和遣詞造句后,不知道有沒有分辨出來二者之間的區別。

現在公布答案:第一個例子為人類審稿人撰寫,而第二個例子則是由ChatGPT-4o生成的。

可以看出來,GPT-4o的審稿意見“看起來不錯”,但指出的問題往往是泛泛而談,這種“challenge in real-world settings”的問題對99%的研究都是適用的,而人類審稿人的意見則更加具體和實際。

即使目前大模型的能力在不斷增強,若干研究也已經探索了使用大模型輔助生成論文審稿意見的可能;但不可否認的是,大模型使得生成低質量審稿意見的成本變得無限低,這也讓學術界對濫用大模型生成低質量審稿意見感到擔憂。

如何激勵審稿人提供高質量的審稿意見呢?

粗暴的使用大模型檢測工具往往是不可取的,因為合理的運用大模型可以為非英語母語的審稿人提供必要的語言支持。而且隨著大模型的進化,當他能夠提供合理質量的審稿時,并不應當完全排斥大模型的使用。

問題的關鍵是,意見本身應當是高質量的,具有建設性和批判性的,而不是語言是如何表達的。

方法概述

來自北京大學和密歇根大學的研究者提出了兩種機制,Generative Peer Prediction Mechanism (GPPM) 和 Generative Synopsis Peer Prediction Mechanism (GSPPM),使得高質量的匯報能夠取得(期望意義上)更高的評分。

  • GPPM的靈感來自于香農互信息(Mutual Information),假設有兩個審稿人Alice和Bob,Alice的分數是,Alice的審稿意見圖片能提供多少關于Bob的審稿意見圖片的信息。
  • 在此基礎上,GSPPM試圖過濾掉審稿意見中的無效信息,例如對論文內容的概括。

方法的核心在于如何衡量Alice對于Bob意見的信息量。研究者推廣了Peer Prediction Mechanism [Miller et al., 2004],提出了使用LLM來估計圖片,作為Alice的分數。

研究團隊提出了兩種估計方法,TOKENJUDGMENT

其中,

  • TOKEN利用了LLM predict next token的能力。值得注意的是,利用大模型將文本報告預處理成統一的格式非常重要,這避免了不同語言風格和用詞習慣帶來的噪聲等影響,研究者稱這一方法為Token-Preprocess。
  • JUDGMENT提供了一種在只有Chatbot API情況下的解決方案。如上圖所示,帶有文本預處理的TOKEN實現表現整體好于JUDGMENT實現。

實驗結果

1. GPPM和GSPPM是否有能力區分出人類審稿意見和LLM生成的審稿意見?

在ICLR 2020 OpenReview數據集上,研究者隨機選出300篇論文,對每篇論文隨機指定一對Alice和Bob,然后他們將Alice的審稿意見替換為LLM(GPT-4或GPT-3.5)生成的審稿意見,觀察Alice的分數是否顯著下降。

圖片

實驗發現,在兩種機制下,分數下降都非常顯著,而且GPT-3.5生成的審稿造成的分數下降比GPT-4更加顯著。從而顯示出三種質量等級,從高到低依次是人類,GPT-4,GPT-3.5,符合預期。

同時,GSPPM的分數顯著性更高,這是由于GSPPM進一步降低了由論文概括等與意見無關的信息帶來的噪聲等影響,從而突出了審稿意見質量帶來的差異。

2. 不同估值方法是否能檢測低質量的評論意見?

與審稿類似的文本評價在互聯網經濟(例如餐廳點評,商品評價),在線課堂(例如同伴互評)等場景被廣泛應用,它們都可能會遇到低質量報告帶來的問題。因此,研究團隊還分別在Yelp餐廳點評數據集和ICLR2020 OpenReview數據集,實驗了人為降低文本評價質量是否會帶來顯著的分數下降,答案是肯定的。我們發現Token-Preprocess檢測低質量評論的能力最顯著。

圖片

三種人為降低報告質量帶來的分數下降顯著性(Yelp餐廳點評數據集)

圖片

三種人為降低報告質量帶來的分數下降顯著性(ICLR2020 OpenReview數據集)

方法和理論結果

本文的理論依據主要來源于用信息論的方法量化隨機變量之間的相關性,研究團隊用大模型的預測能力作為實現量化文本相關性的手段。

注意到,如下公式所示,Alice的期望分數就是圖片,其中圖片對Alice為常數。因此Alice想要獲得高分,就需要增加自己的審稿意見能提供Bob的意見的信息量,即圖片

圖片

圖片

根據以上思路,該團隊證明了在LLM的估計近似準確的假設下,所有人都提供高質量的信息是一個近似貝葉斯納什均衡(Bayesian Nash Equilibrium):即對于每個人,提供更差的審稿意見會帶來更低的期望分數。

未來工作

這篇論文率先在計算經濟學領域中,提出激勵高質量文本評價的機制。這樣一個全新的交叉領域帶來了若干開放問題,例如

  • 能否收集人類對審稿意見的評分,驗證與文中機制評分的相關系數?
  • 能否進一步降低文中機制評分的噪聲?
  • 能否在其他領域測試文中機制的能力,如中文文本?

研究者在論文中提供了更多細節討論,并歡迎讀者進一步討論和交流。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2009-12-03 14:53:49

.NET Framew

2017-06-06 17:03:59

機器學習模型算法

2023-07-18 19:11:21

配置信令系統

2022-02-23 14:18:53

If-Else入參接口

2017-05-23 08:54:51

2019-09-06 10:31:45

軟件開發地圖

2021-06-08 13:55:41

AI 數據人工智能

2024-06-04 08:30:32

2020-06-19 10:17:11

Code ReviewKPI代碼

2023-03-27 17:45:16

研究AI

2021-01-25 20:47:43

技術研發實踐

2024-05-14 07:30:52

OpenAIGPT-4模型

2025-05-30 01:30:00

Anthropic技巧AI

2024-12-20 14:37:47

2025-09-04 09:04:13

2023-03-16 19:17:57

2018-08-16 15:11:47

Code ReviewPPT代碼

2020-07-20 14:10:48

AI 數據人工智能

2023-08-10 09:00:00

2021-09-09 18:12:22

內存分段式網絡
點贊
收藏

51CTO技術棧公眾號

亚洲伊人伊色伊影伊综合网 | youjizzjizz亚洲| 精品一区视频| 亚洲一二三专区| 国产精品久久久久免费| 亚洲图片在线视频| 粉嫩精品导航导航| 色av一区二区| 热久久免费视频精品| 美女被艹视频网站| 国产性一乱一性一伧一色| 国产在线播放观看| 久草视频免费在线| theporn国产在线精品| 欧美色视频日本版| 一区二区精品在线观看| 亚洲奶汁xxxx哺乳期| 国产一区激情| 国产一区二区三区四区福利| 久久精品一二三四| 免费日韩电影| 亚洲人成影院在线观看| 精品视频一区二区| 国产精品久久久久久在线| 欧美日韩在线大尺度| 夜夜嗨av色一区二区不卡| 俄罗斯女人裸体性做爰| www.久久.com| 亚洲va欧美va人人爽| 天堂资源在线亚洲视频| 国内精品久久久久伊人av| 国产高清av在线播放| 精品无人乱码| 9国产精品视频| 一本色道久久88综合日韩精品 | 黄网站在线免费看| 国产成人亚洲精品狼色在线| 国产精品高清在线观看| 欧美亚洲日本在线| 精品亚洲精品| 欧美一级高清大全免费观看| 国产精品igao| av在线最新| 国产精品亲子伦对白| 美日韩精品免费| www天堂在线| 精品一区二区三区免费| 国产精品伦子伦免费视频| 日本熟妇毛茸茸丰满| 99精品全国免费观看视频软件| 激情深爱一区二区| 中文字幕一区二区三区不卡| 久久久久久99| 亚洲免费成人在线| 国产成人超碰人人澡人人澡| 国产日韩精品入口| 亚洲一卡二卡在线| 国产精品久久久久久久免费软件 | 久久久噜噜噜| 人体精品一二三区| 精产国品一区二区| 欧美视频福利| 久久免费视频网| 日韩伦人妻无码| 日韩一级网站| 午夜成人免费视频| 一本色道久久综合亚洲精品高清 | 久久久综合精品| 国产精品极品美女在线观看免费| 天天射天天干天天| 在线亚洲观看| 北条麻妃一区二区三区中文字幕 | 国产精品视频yy9099| 男女视频免费看| 国产美女一区| 国产成人久久久| 一区二区乱子伦在线播放| 免费成人在线视频观看| 成人国产精品色哟哟| av男人天堂av| 不卡电影一区二区三区| 欧美日韩国产精品一卡| 在线激情免费视频| 97精品久久人人爽人人爽| 日本不卡电影| 精品一区二区三区中文字幕| 在线91免费看| 99免费观看视频| 琪琪久久久久日韩精品| 亚洲视频日韩精品| 女人18毛片毛片毛片毛片区二| 四虎8848精品成人免费网站| www.日本久久久久com.| 一起操在线播放| 最新日韩av| 国产精品视频久久久| 99热这里只有精品9| 成人免费观看视频| 午夜精品一区二区在线观看| 香蕉成人app免费看片| 欧美日韩一区二区免费在线观看| 三级视频中文字幕| 国产一区二区三区亚洲综合| 日韩视频123| 漂亮人妻被黑人久久精品| 日本大胆欧美| 欧美国产在线视频| 国产一级片免费在线观看| 久久福利精品| 国产精品久久一区二区三区| 你懂的视频在线观看| 中文字幕佐山爱一区二区免费| 男女激情无遮挡| 日日夜夜综合| 亚洲欧美精品伊人久久| 免费精品在线视频| 久久人人超碰| 高清国产在线一区| 男人的天堂在线视频免费观看| 亚洲图片激情小说| 欧美日韩在线观看不卡| 美女扒开腿让男人桶爽久久动漫| 国产性猛交xxxx免费看久久| 久久久久久久久久一区二区三区 | 国产精品久久免费看| 日韩国产成人无码av毛片| 日韩毛片免费视频一级特黄| 欧美精品乱人伦久久久久久| 男生草女生视频| 91tv官网精品成人亚洲| 国产成人免费91av在线| 96日本xxxxxⅹxxx17| 中文字幕免费观看一区| 欧美日韩在线不卡视频| 粉嫩一区二区三区四区公司1| www高清在线视频日韩欧美| www.久久久久久久| www.日韩精品| 亚洲乱码日产精品bd在线观看| 国产精品av一区二区三区| 精品乱码亚洲一区二区不卡| 日本中文字幕免费在线观看| 久久狠狠亚洲综合| 久久国产精品高清| av在线播放资源| 亚洲成年网站在线观看| 免费网站看av| 国产1区2区3区精品美女| 天堂v在线视频| 伊人久久综合网另类网站| 中文字幕综合在线| 中文字幕免费播放| 国产精品理论片| www亚洲成人| 日韩国产一区二区三区| 国产精品电影观看| 99青草视频在线播放视| 欧美日韩日本视频| 欧美一区二区三区观看| 久久久久国产精品一区二区| 日本不卡免费新一二三区| 欧美最新精品| 日韩中文字幕视频在线| 中文字幕永久在线观看| 国产精品免费免费| 亚洲男人天堂2021| 激情综合网址| 国产精品青青草| 青草影视电视剧免费播放在线观看| 日韩亚洲欧美中文三级| 国产在线精品观看| 99国产欧美另类久久久精品| 国产裸体舞一区二区三区| 亚洲肉体裸体xxxx137| 日韩av高清不卡| 日本在线视频站| 日韩欧美国产综合一区| 一区二区三区在线播放视频| 国产69精品久久久久777| 大陆极品少妇内射aaaaa| 国产99精品| 国产在线精品播放| 在线观看中文字幕的网站| 亚洲白拍色综合图区| 精品免费囯产一区二区三区 | 精品视频在线看| 黑鬼狂亚洲人videos| 99久久精品国产麻豆演员表| 热久久精品免费视频| 中文在线日韩| 欧美久久在线| 国产一区二区三区| 日本精品视频在线| a毛片在线看免费观看| 日韩高清人体午夜| 在线免费看91| 亚洲电影一区二区三区| www..com.cn蕾丝视频在线观看免费版| 久热国产精品| 美女在线免费视频| 国产欧美一区| 国产66精品久久久久999小说| brazzers在线观看| 国产亚洲一区二区在线| 成人免费观看在线视频| 欧美性黄网官网| 99热99这里只有精品| 国产精品一二三四| 男人添女荫道口图片| 久久精品亚洲人成影院| 免费看国产精品一二区视频| 亚洲精品在线a| 国产精品极品美女粉嫩高清在线| 爱搞国产精品| 伊人一区二区三区久久精品| 色一情一乱一区二区三区| 欧美久久久久久久久| 欧美一级淫片免费视频黄| 亚洲一区二区三区视频在线播放 | 视频在线观看免费高清| 亚洲视频大全| 成人免费看片视频在线观看| 精品国产乱码久久久久久蜜坠欲下| 国产精品视频免费观看| 国产在线不卡一区二区三区| 国产精品一二区| 日本免费久久| 91国产精品91| 丁香花在线观看完整版电影| 久久国产视频网站| 日本福利在线| 中文字幕亚洲无线码a| 能在线看的av| 精品亚洲男同gayvideo网站 | 中文字幕av一区| 免费播放片a高清在线观看| 精品国产百合女同互慰| 国产黄色一区二区| 91精品久久久久久久99蜜桃| 一区二区三区www污污污网站| 在线观看亚洲一区| 无码人妻精品一区二区三区蜜桃91 | 亚洲精品二区三区| 一卡二卡3卡四卡高清精品视频| 日韩欧美ww| 99国产视频| 2020最新国产精品| 国产精品嫩草在线观看| 久久久久97| 韩日午夜在线资源一区二区| 日本综合精品一区| 99精品在线直播| 超碰精品在线观看| 国产一区二区三区四区五区加勒比| 青草伊人久久| 亚洲精品免费网站| 中文字幕一区日韩精品| 国产一区二区三区黄| 亚洲三级网页| 亚洲精品在线观看免费| 欧美大片aaaa| 一区二区三视频| 欧美一区久久| 男人日女人视频网站| 亚洲黄页一区| 99国产精品白浆在线观看免费| 亚洲一级黄色| 欧美 国产 日本| 免费人成精品欧美精品| 高清av免费看| 国产精品自拍av| 亚洲av无码一区二区三区观看| 久久日一线二线三线suv| 免费看的黄色录像| 一区二区三区在线影院| 成年人视频在线免费看| 欧美色视频在线| 亚洲av无码一区二区三区dv| 亚洲国产婷婷香蕉久久久久久 | 最近2019中文字幕第三页视频| 国产黄a三级三级三级av在线看| 欧美剧在线观看| 自拍偷拍欧美视频| 国产精品美女999| 国产精品一级在线观看| 九色一区二区| 日韩高清欧美| 欧美 日韩 国产 高清| 欧美日韩三区| 人妻丰满熟妇av无码区app| 国产一区二区三区四| 免费的av网站| 国产亚洲精品资源在线26u| 日韩激情小视频| 国产精品国产精品国产专区不蜜| 国产亚洲精品久久久久久打不开| 91久久一区二区| 国产视频www| 亚洲人在线视频| 久久五月精品中文字幕| 国产精品日韩电影| 精品视频在线观看网站| 欧美在线激情| 国产一区二区三区四区三区四| 九九热免费精品视频| 国产精品一卡二卡在线观看| 日韩人妻无码精品综合区| 亚洲最新视频在线播放| 国产成人av免费| 日韩成人av网| 天堂av资源在线观看| 国产精品久久久久7777婷婷| 精品女人视频| 欧美精品一区二区性色a+v| 亚洲第一毛片| 欧美污在线观看| 国产精品久久久久久久久免费丝袜 | 一区二区蜜桃| 国产一线二线三线在线观看| 盗摄精品av一区二区三区| 亚洲 欧美 国产 另类| 在线影院国内精品| 四虎影院在线域名免费观看| 欧美激情欧美激情| 久久综合给合| 亚洲国产日韩欧美| 久久久人人人| jizz日本免费| 亚洲va天堂va国产va久| www.狠狠干| 色先锋资源久久综合5566| 91精品影视| 日韩免费中文专区| 最新成人av网站| 日韩aaaaa| 精品国产福利视频| 亚洲欧美综合在线观看| 欧美劲爆第一页| 亚洲国产视频二区| 中文字幕人妻熟女人妻洋洋| 国产黄色91视频| 国产成人自拍网站| 91精品在线免费观看| 黄色在线免费看| 成人在线视频网| 91亚洲人成网污www| 午夜免费福利视频在线观看| 国产精品色一区二区三区| 中文字幕av影视| 北条麻妃久久精品| 国产成人免费视频网站视频社区 | 欧美日本一道| 成人欧美一区二区三区在线| 欧美日韩性在线观看| 一区二区xxx| 亚洲视频每日更新| 国产露脸91国语对白| 色综合久综合久久综合久鬼88| 亚洲青青久久| 国产av熟女一区二区三区| 东方欧美亚洲色图在线| 黄色激情视频在线观看| 精品无人区太爽高潮在线播放 | 国产伦视频一区二区三区| 亚洲日本黄色| 亚洲综合av在线播放| 一区二区免费在线播放| 五月天丁香视频| 国产精品美女无圣光视频| 91久久国产| 国产51自产区| 欧美午夜精品伦理| 欧美三级理伦电影| 国产一区精品在线| 日韩中文字幕av电影| 欧美日韩黄色网| 亚洲国产欧美一区二区丝袜黑人| 电影一区二区三区| 亚洲一区二区三区免费看| 国产精品一级黄| 国产区一区二区三| www.xxxx精品| 神马久久av| 男女污污视频网站| 欧美日韩精品在线播放| 九色porny在线| 含羞草久久爱69一区| 麻豆久久一区二区| 国产在线观看免费av| 亚洲性生活视频| 18国产精品| 国产欧美一区二| 红桃视频成人在线观看| 永久免费在线观看视频| 国产一区精品视频| 精品一区二区三区在线观看国产 | 伊人电影在线观看| 茄子视频成人在线观看| 粉嫩绯色av一区二区在线观看| 黄色免费av网站|