精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

調用多個ChatGPT API相互對話,清華開源的多輪對話數據UltraChat來了

人工智能 新聞
UltraChat 解決了數據荒的一大難題。

自 ChatGPT 發布以來,這段時間對話模型的熱度只增不減。當我們贊嘆這些模型表現驚艷的同時,也應該猜到其背后巨大的算力和海量數據的支持。

單就數據而言,高質量的數據至關重要,為此 OpenAI 對數據和標注工作下了很大力氣。有多項研究表明,ChatGPT 是比人類更加可靠的數據標注者,如果開源社區可以獲得 ChatGPT 等強大語言模型的大量對話數據,就可以訓練出性能更好的對話模型。這一點羊駝系列模型 ——Alpaca、Vicuna、Koala—— 已經證明過。例如,Vicuna 使用從 ShareGPT 收集的用戶共享數據對 LLaMA 模型進行指令微調,就復刻了 ChatGPT 九成功力。越來越多的證據表明,數據是訓練強大語言模型的第一生產力。

ShareGPT 是一個 ChatGPT 數據共享網站,用戶會上傳自己覺得有趣的 ChatGPT 回答。ShareGPT 上的數據是開放但瑣碎的,需要研究人員自己收集整理。如果能夠有一個高質量的,覆蓋范圍廣泛的數據集,開源社區在對話模型研發方面將會事半功倍。

基于此,最近一個名為 UltraChat 的項目就系統構建了一個超高質量的對話數據集。項目作者嘗試用兩個獨立的 ChatGPT Turbo API 進行對話,從而生成多輪對話數據。

圖片

  • 項目地址:https://github.com/thunlp/UltraChat
  • 數據集地址:http://39.101.77.220/
  • 數據集交互地址:https://atlas.nomic.ai/map/0ce65783-c3a9-40b5-895d-384933f50081/a7b46301-022f-45d8-bbf4-98107eabdbac

具體而言,該項目旨在構建一個開源、大規模、多輪的基于 Turbo APIs 的對話數據,方便研究者開發具有通用對話能力的強大語言模型。此外,考慮到隱私保護等因素,該項目不會直接使用互聯網上的數據作為提示。為了確保生成數據質量,研究者在生成過程中采用了兩個獨立的 ChatGPT Turbo API,其中一個模型扮演用戶角色來生成問題或指令,另一個模型生成反饋。

圖片

如果直接使用 ChatGPT 基于一些種子對話和問題讓其自由生成,容易出現話題單一、內容重復等問題,從而難以保證數據本身的多樣性。為此,UltraChat 對對話數據覆蓋的主題和任務類型進行了系統的分類和設計,還對用戶模型和回復模型進行了細致的提示工程,它包含三個部分:

  • 關于世界的問題(Questions about the World):這部分對話來自于對現實世界中的概念、實體和對象相關的廣泛詢問。所涉及的主題涵蓋科技、藝術、金融等多個領域。
  • 寫作與創作(Writing and Creation):這部分對話數據著重于指示 AI 從頭進行創作一個完整的文本材料,并在此基礎上進行后續的提問或進一步指導以完善寫作,撰寫的材料內容類型包括文章、博客、詩歌、故事、戲劇,電子郵件等等。
  • 對于現有資料的輔助改寫(Writing and Creation):該對話數據是基于現有資料生成的,指令包括但不限于改寫、續寫、翻譯、歸納、推理等,涵蓋主題同樣非常多樣。

這三部分數據覆蓋了大部分用戶對于 AI 模型的要求。同時,這三類數據也會面臨著不同的挑戰,為此需要不同的構造方法。

例如,第一部分的數據主要挑戰在于如何在總量為幾十萬組對話中盡量廣泛地涵蓋人類社會中的常見知識,為此研究者從自動生成的主題和來源于 Wikidata 的實體兩個方面進行了篩選和構造。

第二、三部分的挑戰主要來自于如何模擬用戶指令,并在后續對話中讓用戶模型的生成盡量多樣化的同時又不偏離對話的最終目標(按照要求生成材料或改寫材料),為此研究者對用戶模型的輸入提示進行了充分的設計和實驗。在構造完成之后,作者還對數據進行了后處理以削弱幻覺問題。

目前,該項目已經發布了前兩部分的數據,數據量為 124 萬條,應該是目前開源社區內規模最大的相關數據集。內容包含在現實世界中豐富多彩的對話,最后一部分數據將在未來發布。

世界問題數據來源于 30 個具有代表性和多樣性的元主題,如下圖所示:

圖片


  • 基于以上元主題,該項目生成了 1100 + 子主題用于數據構建;
  • 對于每個子主題,最多生成 10 個具體問題;
  • 然后使用 Turbo API 為 10 個問題中的每一個生成新的相關問題;
  • 對于每個問題,如上所述迭代地使用兩個模型生成 3~7 輪對話。

此外,該項目從維基數據中收集了最常用的 10000 個命名實體;使用 ChatGPT API 為每個實體生成 5 個元問題;對于每個元問題,生成 10 個更具體的問題和 20 個相關但一般的問題;采樣 20w 個特定問題和 25w 個一般問題以及 5w 個元問題,并為每個問題生成了 3~7 輪對話。

接下來我們看一個具體的例子:

圖片

我們在 UltraChat 平臺上測試了數據搜索效果。例如,輸入「音樂(music)」,系統會自動搜索出 10000 組與音樂相關的 ChatGPT 對話數據,并且每組都是多輪對話

圖片

輸入關鍵詞「數學(math)」的搜索結果,有 3346 組多輪對話:

圖片

目前,UltraChat 涵蓋的信息領域已經非常多,包括醫療、教育、運動、環保等多個話題。同時,筆者嘗試使用開源的 LLaMa-7B 模型在 UltraChat 上進行監督的指令微調,發現僅僅訓練 10000 步后就有非常可觀的效果,一些例子如下:

圖片

世界知識:分別列出 10 個很好的中國和美國大學?

圖片

想象問題:當時空旅行成為可能后,有什么可能的后果?

圖片

三段論:鯨魚是魚嗎?

圖片

假設問題:證明成龍比李小龍更出色

圖片

總體來說,UltraChat 是一個高質量、范圍廣的 ChatGPT 對話數據集,可以和其它數據集結合,顯著地提升開源對話模型的質量。目前 UltraChat 還只放出了英文版,但也會在未來放出中文版的數據。感興趣的讀者快去探索一下吧。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-08 07:33:48

2025-07-04 00:00:00

2025-07-17 09:28:09

2025-07-14 07:30:00

2023-05-21 23:40:03

開源圖文模型

2025-10-27 01:50:00

2023-04-04 19:09:20

ChatGPT開源

2020-04-23 13:51:05

AI管理GUI

2023-04-28 09:02:24

智能客服人工智能Siri

2023-01-14 14:59:05

達摩院

2023-05-08 06:52:47

開源PythonAPI

2024-01-08 13:33:00

數據訓練

2025-04-21 08:13:58

ChatGPTAINLP

2025-06-09 08:30:00

2023-09-02 12:49:01

2023-03-15 09:36:14

模型

2020-08-04 14:18:56

算法開源Github

2025-03-24 12:42:52

2025-05-23 09:18:25

點贊
收藏

51CTO技術棧公眾號

四虎影视国产精品| 日本免费不卡视频| 99久久视频| 欧美v日韩v国产v| 亚洲精品中文字幕乱码三区 | 91chinesevideo永久地址| a视频免费观看| 亚洲成人毛片| 欧美日韩在线一区| 久久视频免费在线| 婷婷婷国产在线视频| 久久精品在线| 欧美巨乳美女视频| 亚洲无人区码一码二码三码的含义| 亚洲精品777| 黑丝美女久久久| 成年人三级视频| 国产原创av在线| 国产精品一区二区三区网站| 国产成人av网| 日韩免费一二三区| 亚洲h色精品| 亚洲午夜激情免费视频| 中文字幕无码人妻少妇免费| 国产美女亚洲精品7777| 91福利在线免费观看| 欧美亚洲黄色片| 岛国成人毛片| 中文字幕第一区| 欧美性大战久久久久| 日韩在线观看视频一区| 欧美性生活一级片| 亚洲国产一区二区三区在线播放| 欧美一区二区视频在线观看| 福利在线一区二区三区| 亚洲精品mv| 性做久久久久久久免费看| 300部国产真实乱| 免费在线观看av网站| 国产午夜一区二区三区| 欧美不卡在线一区二区三区| 日本美女一级片| 成人午夜视频网站| 成人欧美一区二区三区在线观看| 国产精选久久久| 久久成人精品无人区| 国产精品久久久一区| 4438国产精品一区二区| 欧美亚洲免费| 国产成人亚洲综合91精品| www..com国产| 亚洲综合精品四区| 欧美专区在线观看| 亚洲男人第一av| 国产亚洲精品久久久久婷婷瑜伽| 性金发美女69hd大尺寸| 91高清视频在线免费观看| 免费观看一区二区三区| 深夜福利一区| 精品sm捆绑视频| 欧美一区二区免费在线观看| 欧美18免费视频| 日韩成人黄色av| 亚洲一区二区三区四区av| 久久香蕉精品香蕉| 亚洲精品在线不卡| 人妻少妇无码精品视频区| 欧美午夜精品一区二区三区电影| 自拍偷拍亚洲欧美| 日韩一区二区三区四区在线| 欧美精品99| 韩剧1988免费观看全集| 中文字幕精品无码一区二区| 日韩精品欧美精品| 成人国产精品色哟哟| 精品国产乱码一区二区三 | 亚洲最新av| 欧美黑人狂野猛交老妇| 在线观看 中文字幕| 国产精品久久麻豆| 香蕉视频官网在线观看日本一区二区| www.xxxx欧美| 黄色小视频在线免费看| 久久综合图片| 国产日韩在线看片| 丰满人妻一区二区三区四区53| av成人免费在线观看| 日韩亚洲不卡在线| 四虎影院观看视频在线观看 | 色老头一区二区三区| 综合五月激情网| 国产情侣一区| 国产精品一区二区在线| 99热这里是精品| 久久综合av免费| 国产成人三级视频| 国模套图日韩精品一区二区| 欧美日本不卡视频| 中文文字幕文字幕高清| 日韩欧美一区二区三区在线视频| 欧美激情xxxxx| 亚洲高清视频免费观看| 国产**成人网毛片九色| 色播亚洲婷婷| 国产精品一二三产区| 欧美日韩在线综合| japanese在线观看| 国产精品99在线观看| 国内精品伊人久久| a天堂在线视频| 中文字幕av一区 二区| 久久亚洲精品无码va白人极品| 高清av一区二区三区| 精品国产乱码91久久久久久网站| 美女福利视频网| 香蕉亚洲视频| 国产欧美日韩综合一区在线观看| 日本a级在线| 欧美a级片一区| 一区二区三区精品视频| 欧美成人黑人猛交| 国产精品白丝一区二区三区 | 亚洲综合图区| 欧美在线观看视频一区二区三区| 久久精品无码专区| 亚洲成人三区| 成人美女av在线直播| 国产最新视频在线观看| 欧美日韩激情网| 精品人妻一区二区免费| 在线观看国产精品入口| 国产精品日韩电影| 国产精品99999| 色诱视频网站一区| 欧美熟妇精品黑人巨大一二三区| 亚洲福利免费| 国产伦一区二区三区色一情| 4438x成人网全国最大| 欧美丰满高潮xxxx喷水动漫| 国产第一页精品| 日韩不卡在线观看日韩不卡视频| 欧美18视频| 欧美1级2级| 亚洲视频在线看| 无码人妻精品一区二区蜜桃色欲| 久久一区二区三区国产精品| 欧美黑人经典片免费观看| 国产精品久久久网站| 久久成人这里只有精品| jizz中国女人| 亚洲一二三区不卡| xfplay5566色资源网站| 亚洲精品黄色| 久久综合毛片| 天堂久久午夜av| 中文字幕亚洲一区在线观看| 亚洲午夜精品久久久| 中文字幕一区二区不卡 | 婷婷激情成人| 久久成人亚洲精品| 国产福利视频一区| aaa一区二区三区| 一区二区三区在线影院| 亚洲国产精品第一页| 亚洲特色特黄| 免费亚洲精品视频| 成人av色网站| 欧美乱大交xxxxx另类电影| 亚洲黄色a级片| 狠狠色狠色综合曰曰| 91成年人网站| 国模一区二区三区白浆| 日韩精品综合在线| 亚洲桃色综合影院| 国产精品永久在线| 日韩专区av| 亚洲免费中文字幕| 一区二区三区免费在线| 亚洲综合色区另类av| 精品夜夜澡人妻无码av| 久久狠狠亚洲综合| 国产精品成人久久电影| 国产精品中文字幕亚洲欧美| 成人做爽爽免费视频| 国产污视频在线播放| 少妇av一区二区三区| 空姐吹箫视频大全| 日本韩国精品在线| 欧美极品aaaaabbbbb| 久久久国产精品午夜一区ai换脸| 免费网站在线观看黄| 国产日韩一区| gogogo免费高清日本写真| 加勒比色综合久久久久久久久| 国产精品久久不能| 美足av综合网| 中文字幕日韩av电影| 手机看片福利永久| 欧美日韩aaaaa| 日本特级黄色片| 亚洲美女少妇撒尿| 微拍福利一区二区| 成人av网址在线| 捷克做爰xxxⅹ性视频| 亚洲一区黄色| 国产亚洲精品久久久久久久| 欧美日韩看看2015永久免费 | 欧美成欧美va| 久久综合九色综合久久久精品综合| 久久人人爽av| 久久青草久久| av免费看网址| 国产精品成久久久久| 日韩免费av一区二区三区| 99re8这里有精品热视频免费 | 国产精品超碰97尤物18| 免费黄色在线视频| 国产91精品久久久久久久网曝门| 91人人澡人人爽人人精品| 日韩图片一区| 拔插拔插海外华人免费| 牛牛国产精品| 欧美性受xxxx黑人猛交88| 大胆日韩av| 区一区二区三区中文字幕| 免费观看成人www动漫视频| 91传媒视频免费| 亚洲人成网站在线在线观看| 国产精品6699| 欧美黄色网页| 欧美亚洲视频在线观看| 极品在线视频| 欧美—级a级欧美特级ar全黄| caoporn免费在线视频| 日韩最新中文字幕电影免费看| 婷婷av一区二区三区| 精品噜噜噜噜久久久久久久久试看| 国产精品特级毛片一区二区三区| 欧美日韩一区久久| 亚洲视频在线免费播放| 欧美性大战久久久久久久蜜臀| 99久久久久久久久| 色综合天天综合给合国产| 亚洲欧美综合自拍| 色综合久久99| 成人黄色三级视频| 精品污污网站免费看| 一区二区www| 3d动漫精品啪啪| av在线免费在线观看| 日韩你懂的电影在线观看| 亚洲成a人片在线| 亚洲精品一区二区三区蜜桃下载| 丰满少妇在线观看bd| 亚洲成人精品视频| 欧美少妇另类| 在线日韩欧美视频| 99久久国产综合精品五月天喷水| 一区二区日韩| 精品亚洲欧美日韩| 尤物tv在线精品| 亚洲bbw性色大片| 亚洲成av人片乱码色午夜| 黄色成人在线免费观看| 亚洲麻豆视频| 大香煮伊手机一区| 久久国产精品色婷婷| 色偷偷中文字幕| av综合在线播放| 91成人在线免费视频| 亚洲视频免费观看| 91香蕉视频网| 午夜久久久影院| 国产一级片av| 日韩午夜激情免费电影| 乱精品一区字幕二区| 亚洲欧美在线播放| 欧美性猛交xxx乱大交3蜜桃| 欧美大片网站在线观看| 天堂av中文在线观看| 国产精品免费久久久久久| 久久久久久久久成人| 久久青青草原| 小处雏高清一区二区三区| 国产精品无码人妻一区二区在线| 日韩黄色片在线观看| 熟妇无码乱子成人精品| 久久综合久久久久88| 国产精品白丝喷水在线观看| 午夜精品久久久久久不卡8050| 中文字幕福利视频| 亚洲精品一线二线三线无人区| av福利精品| 国产69精品久久久久9| 久久91超碰青草在哪里看| 国产欧美韩日| 国产精品久久久久久久免费观看| 欧美一区二区中文字幕| 毛片一区二区三区| 国产成人无码一区二区在线观看 | 视频一区国产精品| 精品69视频一区二区三区Q| 99视频免费播放| 成人高清视频免费观看| 青花影视在线观看免费高清| 一本色道久久综合亚洲精品按摩| 亚洲精品一区二区三区新线路| 一本色道久久88综合亚洲精品ⅰ| 国产一线二线在线观看| 国产日韩欧美电影在线观看| 免费精品国产| 人人妻人人澡人人爽欧美一区双| 精品一区二区三区视频在线观看 | 国产成人精品久久亚洲高清不卡| 成人不卡视频| 久久久精彩视频| 国内精品福利| a级大片免费看| 国产精品国产三级国产有无不卡| 五月婷婷视频在线| 亚洲国产成人久久综合| 人人超在线公开视频| 成人乱色短篇合集| 欧美gay男男猛男无套| 国产精品第12页| 91久色porny| 国产一区二区99| 亚洲成人中文字幕| 俺来也官网欧美久久精品| 亚洲自拍偷拍第一页| 亚州av乱码久久精品蜜桃| 污污的网站免费| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 国产v片在线观看| 精品国偷自产在线视频| 日韩成人精品一区二区三区| 日产精品久久久一区二区| 亚洲欧美日韩专区| 草草地址线路①屁屁影院成人| 天天影视网天天综合色在线播放| 亚洲免费黄色片| 午夜精品一区二区三区在线视频| 福利在线一区| 久久久亚洲国产精品| av中文一区二区三区| 亚洲精品1区2区3区| 日韩精品在线观看一区| 手机av在线| 欧美在线激情| 蜜臀av一区二区| 黄色香蕉视频在线观看| 51精品秘密在线观看| 伊人影院蕉久影院在线播放| 97视频热人人精品| 亚洲国产三级| 亚洲第一香蕉网| 欧美视频在线不卡| 欧美日韩在线资源| 91九色蝌蚪嫩草| 国产亚洲毛片| 又色又爽的视频| 日韩欧美的一区二区| 超碰99在线| 日韩欧美一区二区三区四区五区| 毛片一区二区三区| 久久高清无码视频| 亚洲精品日韩丝袜精品| 国产一区二区三区朝在线观看| 一区二区不卡视频| 国产成人av影院| 6080午夜伦理| 综合国产在线观看| 日韩精品视频中文字幕| 无码专区aaaaaa免费视频| 亚洲国产精品av| 亚洲国产999| 日本免费一区二区三区视频观看| 日韩片欧美片| 完美搭档在线观看| 欧美日韩在线播放一区| 爱情岛论坛亚洲品质自拍视频网站| 欧美区高清在线| 国产一区啦啦啦在线观看| 天天操天天干视频| 久久影院在线观看| 秋霞影视一区二区三区| 亚洲综合激情视频| 午夜精品久久久| 高清全集视频免费在线| 欧美精品欧美精品| 国产精品白丝av| 国产在线观看第一页| 高清亚洲成在人网站天堂| 日韩精品免费| 一出一进一爽一粗一大视频| 欧美久久久一区| 偷拍视频一区二区三区| 米仓穗香在线观看| 日本一区二区免费在线| 国产综合在线播放|