精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini

發布于 2025-2-20 10:16
瀏覽
0收藏

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

論文鏈接:https://arxiv.org/pdf/2502.12150 
Git鏈接:https://github.com/locuslab/llm-idiosyncrasies

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區


亮點直擊

  • 高準確率的模型區分:通過簡單的文本嵌入模型微調,實現了高達97.1%的分類準確率,顯著高于隨機猜測的20.0%。
  • 語義保留變換下的強魯棒性:即使對文本進行重寫、翻譯或總結等語義保留變換,分類準確率仍保持在90%以上,表明LLM的獨特性不僅體現在詞匯層面,還體現在語義層面。
  • 開放描述生成:利用LLM作為評判者,生成每個模型獨特行為的詳細描述,為理解不同LLM的輸出模式提供了新的視角。
  • 對合成數據訓練的警示:研究結果表明,使用合成數據訓練LLM時需謹慎,因為這些獨特性可能會在訓練過程中被繼承,影響模型的輸出行為。

總結速覽

解決的問題

  • 區分不同LLM生成的文本:研究旨在識別和區分不同大語言模型(LLM)生成的文本,揭示各模型的獨特輸出模式。
  • 理解LLM的獨特行為:通過分析LLM生成的文本,探討這些模型的獨特行為及其在語義層面的表現。

提出的方案

  • 文本分類任務:設計一個簡單的分類任務,通過訓練分類器來預測給定文本的生成模型。
  • 文本變換分析:通過對生成的文本進行隨機打亂、重寫、翻譯和總結等變換,分析這些變換對分類準確率的影響。
  • 開放描述生成:利用LLM作為評判者,生成每個模型獨特行為的詳細描述。

應用的技術

  • 文本嵌入模型微調:對現有的文本嵌入模型進行微調,以適應LLM生成的文本。
  • 多模型分類:在多個LLM(如ChatGPT、Claude、Grok、Gemini和DeepSeek)之間進行多分類任務。
  • 語義保留變換:通過重寫、翻譯和總結等技術,保留文本的語義內容,同時觀察分類準確率的變化。

達到的效果

  • 高分類準確率:在五分類任務中,分類器在驗證數據上達到了97.1%的準確率。
  • 強魯棒性:即使在文本長度和格式受控的情況下,分類器仍能保持高準確率。
  • 語義層面的獨特性:即使經過語義保留的文本變換,分類準確率仍顯著高于隨機猜測,表明LLM的獨特性也體現在語義層面。

評估LLM的獨特性

大語言模型(LLMs)具有一些共同特征。首先,都采用了基于自注意力機制的Transformer架構。其次,它們使用自回歸目標進行訓練,即根據前面的上下文預測序列中的下一個token。最后,它們的訓練數據集有顯著的重疊,通常包含大量多樣化的來源,如Common Crawl、Wikipedia和Stack Overflow。鑒于這些相似性,自然會問:LLMs的輸出方式是否相同?如果不同,如何有效衡量它們的差異程度?

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

主要觀察結果

神經網絡在分類LLM輸出時表現出驚人的高準確率。這一觀察結果在不同設置下(例如,跨模型家族和規模)都具有魯棒性。由于本文的任務本質上是一個序列分類問題,微調了一個強大的序列嵌入模型LLM2vec,并添加了一個N分類頭,報告了最終的準確率。


大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

  1. 對話API("chat"類):包含GPT-4o、Claude-3.5-Sonnet、Grok-2、Gemini-1.5-Pro和DeepSeek-V3,除DeepSeek外均為閉源模型。
  2. 指令微調LLM("instruct"類):包含Llama3.1-8b、Gemma2-9b、Qwen2.5-7b和Mistral-v3-7b四個同規模不同家族的模型。
  3. 基礎LLM("base"類):指令微調LLM的基礎版本,僅通過大規模文本預訓練獲得。


每類模型生成11K文本序列(10K訓練,1K驗證)。對話API和指令微調LLM使用UltraChat數據集,基礎LLM使用FineWeb數據集生成文本。

跨模型家族分類 下表1展示了不同組合的分類結果。在二分類任務中,神經網絡持續保持90%以上準確率(僅個別例外),多數組合達到99%準確率。在更具挑戰性的N分類任務中,分類器在三個組別均保持87.3%以上的強性能,凸顯了不同LLM間的顯著差異性。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

同模型家族內分類 當區分同家族模型時(如Qwen2.5系列的7B/14B/32B/72B模型),分類難度增加但仍顯著優于隨機水平(二分類最高85.5%,全組合59.8%)。區分同模型的基礎版與指令微調版時,分類器可達96.8%準確率。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

分布外響應泛化 分類器在四個不同來源的指令數據集(UltraChat、Cosmopedia、LmsysChat、WildChat)上展現出強泛化能力(下表3),表明其學習到了穩健且可遷移的模式。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

控制實驗

研究者們在多個控制設置下分析合成分類任務的行為特征(下文僅報告各組N分類準確率)。


提示層面干預 通過添加長度控制("請提供簡潔回答,單段不超過100詞")和格式控制("請使用純文本,避免格式token")指令,發現分類準確率仍保持高位(下表4),表明LLM特征深度嵌入于生成文本中,不受表層約束影響。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

輸入長度控制 下圖2顯示,隨著輸入token數量增加,分類性能逐步提升。值得注意的是,對話API和指令LLM僅需單個token即可獲得約50%準確率,表明首個token已包含顯著區分信號。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

采樣方法分析 下表5顯示,區分同一LLM不同解碼策略(貪婪解碼、溫度采樣、top-k、top-p)生成的響應時,最高準確率僅59%。在五分類任務(不同溫度softmax采樣)中,準確率37.9%僅略高于20%基線,表明解碼策略對輸出可分性影響有限。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

文本嵌入模型對比 下表6顯示,不同世代嵌入模型(ELMo、BERT、T5、GPT-2、LLM2vec)均能實現高準確率,其中LLM2vec性能最佳(對話API 97.1%,指令LLM 96.3%,基礎LLM 87.3%)。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

訓練數據規模 下圖3表明分類性能隨訓練樣本量增加而提升,僅需10個樣本即可超越隨機基線(指令LLM 40.3%)。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

LLM具體特有模式

本文使用ROUGE-1、ROUGE-L和BERTScore等指標量化LLM輸出的詞匯差異(下表7),發現不同LLM生成的文本相似度顯著低于同模型不同采樣結果。以下從三個維度剖析具體特有模式:

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

詞匯與字母

文本重組 通過去除特殊字符并進行詞匯/字母級重組(下表8),發現:

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

  • 去除特殊字符后分類準確率保持高位(對話API 95.1%,指令LLM 93.8%)
  • 詞匯重組僅導致小幅下降,表明特征主要編碼于詞匯分布
  • 字母重組使準確率接近隨機水平(49-56%),字母分布差異極?。ㄏ聢D5)大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

特征短語 使用TF-IDF特征訓練邏輯回歸模型(對話API 85.5%,指令LLM 83.7%),提取各模型top10特征短語(下圖6)。例如:

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

  • ChatGPT偏好"such as"、"certainly"等過渡詞
  • Claude傾向"according to"、"based on"等引用表達首詞選擇分布也呈現顯著差異(下圖7)。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

Markdown格式

保留Markdown元素(加粗、斜體、標題等)并替換文本為"xxx"后(下表9):

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

  • 對話API和指令LLM仍保持73.1%/77.7%準確率
  • 基礎LLM接近隨機水平(25%)各模型格式使用習慣差異顯著(圖8),例如:

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

  • Claude較少使用加粗和標題
  • ChatGPT偏好結構化格式(下圖4)

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

語義層面

改寫測試 使用GPT-4o mini進行改寫、翻譯和摘要后(下表10):

  • 改寫和翻譯文本分類準確率與原文本相當
  • 摘要文本準確率下降但仍顯著優于隨機表明語義信息對分類具有決定性作用。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

開放性語言分析 使用ChatGPT作為評估者對響應進行開放性描述(下圖9),發現:

  • ChatGPT偏好詳細描述和復雜格式
  • Claude側重簡潔表達和核心內容

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

研究啟示

合成數據中的特有模式

在Llama3.1-8b和Gemma2-9b上使用UltraChat(ChatGPT生成)進行監督微調后:

  • 模型間分類準確率從96.5%降至59.8%
  • 使用合成數據微調的模型仍保留源模型特征(準確率98.9%)表明合成數據訓練會傳播源模型特有模式。

模型相似性推斷

通過排除法訓練分類器并評估被排除模型的響應歸屬(下圖10),發現:

  • Claude、Grok、Gemini輸出常被誤判為ChatGPT
  • DeepSeek和ChatGPT輸出與Phi-4關聯密切該方法為評估前沿模型相似性提供了量化工具。

大語言模型都有哪些特質?區分度達97%!DeepSeek&ChatGPT&Claude&Grok&Gemini-AI.x社區

結論

本文證明了大語言模型(LLMs)中存在獨特性,并研究了一種旨在量化其程度的合成任務。只需在LLM輸出上微調預訓練的文本嵌入模型,就能在預測文本來源時獲得極高的準確率。這一現象在不同的提示數據集、LLM組合以及其他多種設置中均持續存在。本文還明確了LLM中這些獨特性的具體形式。希望本文的工作能夠鼓勵進一步研究理解LLM中的獨特性。


本文轉自AI生成未來 ,作者:AI生成未來


原文鏈接:??https://mp.weixin.qq.com/s/3Os_qpHJAsA21vzVUZjKzg??

收藏
回復
舉報
回復
相關推薦
国产玉足榨精视频在线观看| 亚洲欧美综合自拍| 国产精品白丝av嫩草影院| 亚洲一区二区三区视频在线 | 在线观看中文字幕码| 国产韩国精品一区二区三区| 亚洲国产精品成人av| 无人在线观看的免费高清视频 | 亚洲免费在线看| 精品999在线观看| 伊人久久成人网| 樱桃成人精品视频在线播放| 在线电影av不卡网址| 在线中文字日产幕| 欧美一级做a| 色一区在线观看| 午夜精品视频一区| 2019亚洲日韩新视频| 国产大屁股喷水视频在线观看| caoporn成人| 欧美伦理视频网站| 成人羞羞国产免费网站| 欧美日韩经典丝袜| 国产精品亲子乱子伦xxxx裸| 国产精品久久久一区二区三区| 国产乱码在线观看| 99国产精品视频免费观看一公开| 色小说视频一区| av在线网站观看| 视频国产精品| 欧美老年两性高潮| 性欧美极品xxxx欧美一区二区| 国产白丝在线观看| 亚洲精品亚洲人成人网在线播放| 日韩高清三级| 青青草在线播放| av中文一区二区三区| 97超碰人人看人人| 亚洲天堂久久久久| 三级做a全过程在线观看| 亚洲精品2区| 亚洲日本成人女熟在线观看| 国产精品无码在线| 精品精品国产毛片在线看| 日韩视频一区二区在线观看| 亚洲一区二区福利视频| 欧美一级做a| 欧美高清激情brazzers| 国产高潮免费视频| 免费成人高清在线视频| 欧美自拍丝袜亚洲| 在线免费视频a| 日本在线视频一区二区| 91高清在线观看| 免费激情视频在线观看| 日韩精品第一| 欧美三级中文字幕在线观看| 久热精品在线观看视频| 日日夜夜亚洲| 欧美剧在线免费观看网站| 午夜精品久久久久久久99热影院| 日韩五码电影| 日韩一级大片在线| 国产情侣久久久久aⅴ免费| 国产成人aa在线观看网站站| 日韩成人av网址| 变态另类丨国产精品| 亚洲最大在线| 中文字幕av一区二区| 潘金莲一级黄色片| 超碰最新在线| 亚洲先锋影音| 久久综合免费视频影院| 农村妇女精品一区二区| 伊人久久亚洲热| 91精品国产九九九久久久亚洲| 69视频免费在线观看| 久久婷婷一区| 国产日韩欧美中文| 性一交一乱一透一a级| youjizz久久| 欧美精品尤物在线| 一级日本在线| 亚洲一区二区美女| 久在线观看视频| jizz欧美| 精品日韩99亚洲| 无码人妻精品一区二区三应用大全| 狠狠操综合网| 另类视频在线观看| 五月天综合激情| 蜜乳av一区二区| 国产91精品入口17c| 深夜福利视频在线观看| 亚洲精品动漫| 国产精品乱人伦一区二区| 青青草免费在线视频观看| 国产精品电影| 欧美日韩国产综合一区二区| 动漫av在线免费观看| 九九综合九九| 欧美极品第一页| 欧美一级做a爰片免费视频| 国产一区二区三区久久久| 欧美日韩亚洲一区二区三区在线观看| 欧美被日视频| 日韩欧美在线视频免费观看| 国产探花在线观看视频| 久久97视频| 欧美韩日一区二区| 在线视频免费观看一区| 成人福利电影精品一区二区在线观看| 婷婷久久五月天| a级片在线免费观看| 在线综合视频播放| 免费网站在线高清观看| 亚洲激情网站| 亚洲自拍偷拍色片视频| 国产一二在线观看| 欧美日韩人人澡狠狠躁视频| 无套白嫩进入乌克兰美女| 国产一区二区三区站长工具| 国内精品视频一区| a在线观看视频| 欧美经典一区二区| 99久久久无码国产精品6| 91在线一区| 久久综合色88| 一级黄色大片网站| 国产午夜亚洲精品理论片色戒| 男人添女荫道口喷水视频| 高清一区二区中文字幕| 自拍视频国产精品| 波多野结衣一区二区在线| 99久久99久久精品免费观看| 欧美精品在线网站| 天堂在线资源视频| 亚洲丁香日韩| 欧美亚洲成人xxx| 蜜桃在线一区二区| 亚洲福利一区二区三区| 娇妻高潮浓精白浆xxⅹ| 国产一区清纯| 国产日韩亚洲精品| gogo高清午夜人体在线| 精品免费国产一区二区三区四区| 手机在线免费看片| 精品一区二区三区免费播放| 亚洲一区二区高清视频| 久久青草免费| 中文字幕日韩精品在线观看| 成人黄色三级视频| 国产精品三级av| 欧美午夜aaaaaa免费视频| 青青草原综合久久大伊人精品| 国产精品午夜一区二区欲梦| 在线观看的av| 欧美精品一级二级三级| 亚洲成人生活片| 国产999精品久久久久久| 成年女人18级毛片毛片免费| 都市激情亚洲| 国产91精品最新在线播放| 日本韩国一区| 欧美日韩免费在线视频| 国产免费一区二区三区香蕉精| 中文有码在线播放| 国产精品国产精品国产专区不蜜| 日本中文字幕影院| 亚洲字幕久久| 国产精品免费在线| 裤袜国产欧美精品一区| 中文字幕av日韩| 精品国自产在线观看| 亚洲国产精品嫩草影院| 欧美深性狂猛ⅹxxx深喉| 日韩**一区毛片| 91传媒免费视频| 日韩在线你懂的| 国产精品入口夜色视频大尺度| 成人av黄色| 亚洲激情成人网| av网站中文字幕| 国产精品久久久久久久久免费桃花 | 久久精品人人做人人爽电影蜜月| 日韩亚洲视频在线| 精品国产三区在线| 7m第一福利500精品视频| xxxxx日韩| 欧美xxxx在线观看| 香蕉污视频在线观看| 亚洲精品综合在线| 在线免费观看成年人视频| 精品一区二区三区视频在线观看| 僵尸世界大战2 在线播放| 欧美日韩一二| 成人免费视频网站| 国产原创一区| 66m—66摸成人免费视频| 在线视频三区| 日韩精品在线观| 国产精品乱码一区二区| 岛国av午夜精品| 国产一二三区精品| 国产香蕉久久精品综合网| 亚洲成年人av| 久久成人久久爱| 国产xxxxx在线观看| 午夜国产精品视频免费体验区| 日本高清一区| 国产精品午夜av| 成人免费直播live| gogo亚洲高清大胆美女人体| 欧美极度另类性三渗透| 毛片免费不卡| 在线观看国产成人av片| 午夜视频福利在线观看| 日韩你懂的电影在线观看| 中文字幕一区二区三区四区视频 | 欧美电影免费网站| 亚洲自拍偷拍在线| 激情小说亚洲| 国产精品爱久久久久久久| 国产激情在线播放| 久久97精品久久久久久久不卡| 69av在线| 激情综合色播激情啊| 欧美日韩精品免费观看| 国产精品流白浆在线观看| 91美女片黄在线观| 四虎地址8848精品| 国产日韩欧美日韩| 久久久久久久性潮| 国产精品普通话| 欧美123区| 国产精品久久久久久久久久ktv | 中文字幕一区二区三区人妻电影| 国产成人福利片| 少妇高潮一69aⅹ| 国产高清精品网站| 丰满少妇中文字幕| 国产精品自拍毛片| 少妇欧美激情一区二区三区| 国产精品自产自拍| 在线播放av网址| 成人在线一区二区三区| 伦理片一区二区| 不卡电影一区二区三区| 国产xxxxxxxxx| 99精品视频一区| wwwwww日本| 国产日韩影视精品| 久久午夜精品视频| 中文字幕字幕中文在线中不卡视频| 国产中文字幕久久| 亚洲欧美日韩一区| 久久亚洲AV无码| 亚洲国产综合在线| 日本三级视频在线| 懂色aⅴ精品一区二区三区蜜月 | 日韩亚洲欧美在线| www.国产麻豆| 亚洲国产精品久久久久| 视频一区二区在线播放| 亚洲无线码在线一区观看| 大乳在线免费观看| 久久精品国产亚洲精品| 秋霞在线视频| 欧美亚洲另类在线| 亚洲成人va| 91亚洲一区精品| 国产精品一线| 日韩电影大全在线观看| 欧美大片aaaa| 日本精品久久久久久久久久| 久久久久久亚洲精品杨幂换脸| 一级特黄性色生活片| 国内成+人亚洲+欧美+综合在线| 永久免费看片在线观看| 91一区二区在线观看| 色欲AV无码精品一区二区久久| 亚洲欧美日韩人成在线播放| 成人免费区一区二区三区| 欧美这里有精品| 欧美 另类 交| 国产三级精品三级在线观看国产| 欧美日韩亚洲一区二区三区在线观看| 91麻豆精品国产91久久久平台 | 免费不卡在线视频| 四川一级毛毛片| 久久先锋影音av鲁色资源| 日日碰狠狠添天天爽| 偷拍日韩校园综合在线| 一二三四区视频| 日韩电影中文字幕在线| 国产原创精品视频| 欧美一区三区三区高中清蜜桃| 亚洲精品毛片| 免费看国产精品一二区视频| 91精品国产乱码久久久久久 | 制服诱惑一区| 一本色道久久综合| 在线观看免费看片| 国产欧美视频在线观看| 久久亚洲AV无码| 在线不卡免费欧美| 免费理论片在线观看播放老| 欧美另类极品videosbestfree| 日韩精品免费观看视频| 国产一区二区三区奇米久涩| 香港欧美日韩三级黄色一级电影网站| 5月婷婷6月丁香| 国产suv精品一区二区6| 貂蝉被到爽流白浆在线观看| 岛国精品视频在线播放| 亚洲风情第一页| 久久影院模特热| 欧美黑粗硬大| 日日骚一区二区网站| 国产精品毛片在线看| 免费观看污网站| 亚洲精品免费播放| 伊人影院中文字幕| 亚洲午夜av久久乱码| 亚洲欧美se| 狠狠色伊人亚洲综合网站色| 欧美大片专区| 九九九九九伊人| 国产精品三级视频| 一区二区乱子伦在线播放| 国产视频精品免费播放| 僵尸再翻生在线观看| 亚洲自拍偷拍色片视频| 一区二区电影| 波多野结衣免费观看| 亚洲天堂久久久久久久| 亚洲一区在线观| 综合av色偷偷网| 成人午夜毛片| 亚洲精品久久久久久一区二区| 视频一区欧美日韩| 国产毛片久久久久久久| 色婷婷国产精品| 国产精品99999| 国产精品日韩一区| 人人狠狠综合久久亚洲婷婷| 日本三级黄色网址| 美女在线视频免费| 国产精品视频yy9099| 欧美最新另类人妖| 视频在线观看免费高清| 综合久久综合久久| 亚洲AV无码乱码国产精品牛牛| 九九视频这里只有精品| 7777精品| 日本毛片在线免费观看| 久久综合色8888| 波多野结衣黄色| 色青青草原桃花久久综合| 欧美在线一级| 日韩精品久久一区二区| 成人av在线网站| 国产精品suv一区| 日韩在线观看免费全集电视剧网站| 欧美伊人亚洲伊人色综合动图| 日韩成人午夜影院| 白白色 亚洲乱淫| 男操女视频网站| 久久视频在线看| 精品视频高潮| 一级黄色香蕉视频| 日韩美女视频一区| 国产综合在线播放| 国产精品91久久久| 亚洲高清资源在线观看| 免费不卡的av| 91成人国产精品| av电影高清在线观看| 精品国产乱码久久久久久88av | 国产精品高潮视频| 青青草国产成人a∨下载安卓| 初高中福利视频网站| 午夜精品久久久久久久| www免费网站在线观看| 国产v亚洲v天堂无码| 日韩综合在线视频| 久久精品波多野结衣| 伊人久久久久久久久久久| 亚洲精品a区| 韩国中文字幕av| 亚洲成人自拍网| 亚洲麻豆精品| 国产三级精品在线不卡| 秋霞电影一区二区| 99免费在线观看| 日韩最新中文字幕电影免费看| 久久99偷拍| 亚洲高清视频免费| 一本大道av伊人久久综合| 91精品久久|