精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

每一個人的大模型:開源BELLE項目集訓練、數據、模型、評估、APP一體

開源 新聞
BELLE 的目標是促進中文對話大模型開源社區的發展,愿景是成為能夠幫到每一個人的 LLM Engine。

最近一段時間,以 “羊駝” 家族為代表的各類 ChatGPT 替代模型不斷涌現。一方面,開源社區也有了可以與 ChatGPT “一較高下” 的開源模型;而另一方面,各模型在如何提升 LLM 的指令表現方面以及評估 LLM 效果的方法不盡相同。

此前,一個基于斯坦福的 Alpaca 、并進行了中文優化的項目受到大家關注,即開源中文對話大模型 70 億參數的 ??BELLE??BEveryone's Large Language model Engine)。它基于斯坦福的 Alpaca 完成,但進行了中文優化,并對生成代碼進行了一些修改,不僅如此,模型調優僅使用由 ChatGPT 生產的數據(不包含任何其他數據)。

BELLE 的目標是促進中文對話大模型開源社區的發展,愿景是成為能夠幫到每一個人的 LLM  Engine。

相比如何做好大語言模型的預訓練,BELLE 更關注如何在開源預訓練大語言模型的基礎上,幫助每一個人都能夠得到一個屬于自己的、效果盡可能好的具有指令表現能力的語言模型,降低大語言模型、特別是中文大語言模型的研究和應用門檻。為此,BELLE 項目會持續開放指令訓練數據、相關模型、訓練代碼、應用場景等,也會持續評估不同訓練數據、訓練算法等對模型表現的影響。

BELLE 項目亮點包括:

  • 研究報告:從指令微調策略到模型評估范式等多方面探究提升大語言模型指令表現能力的因素
  • 數據開放:豐富、大量且持續完善的訓練和評估數據
  • 開箱即用的多種模型和指令微調 / LoRA / 量化代碼
  • 多終端 LLM 推理和聊天 app,無需聯網,離線運行

還有其他功能,請移步 Github 項目 。

圖片

項目地址:https://github.com/LianjiaTech/BELLE

BELLE 項目的研究方向著眼于提升中文指令調優模型的指令跟隨、指令泛化效果,降低模型訓練和研究工作的門檻,讓更多人都能感受到大語言模型帶來的幫助。

為此 BELLE 進行了一系列研究,涵蓋模型評估方法、影響模型指令表現效果的因素、模型調優等多方面。

最近,兩篇相關論文已經公開,下面我們看看論文內容。

論文介紹

論文 1:Towards Better Instruction Following Language Models for Chinese: Investigating the Impact of Training Data and Evaluation

圖片

論文地址:https://arxiv.org/pdf/2304.07854.pdf

為了推動開源大語言模型的發展,大家投入了大量精力開發能夠類似于 ChatGPT 的低成本模型。首先,為了提高模型在中文領域的性能和訓練 / 推理效率,我們進一步擴展了 LLaMA 的詞匯表,并在 34 億個中文詞匯上進行了二次預訓練。

此外,目前可以看到基于 ChatGPT 產生的指令訓練數據方式有:1)參考 Alpaca 基于 GPT3.5 得到的 self-instruct 數據;2)參考 Alpaca 基于 GPT4 得到的 self-instruct 數據;3)用戶使用 ChatGPT 分享的數據 ShareGPT。在這里,我們著眼于探究訓練數據類別對模型性能的影響。具體而言,我們考察了訓練數據的數量、質量和語言分布等因素,以及我們自己采集的中文多輪對話數據,以及一些公開可訪問的高質量指導數據集。

為了更好的評估效果,我們使用了一個包含一千個樣本和九個真實場景的評估集來測試各種模型,同時通過量化分析來提供有價值的見解,以便更好地促進開源聊天模型的發展。

這項研究的目標是填補開源聊天模型綜合評估的空白,以便為這一領域的持續進步提供有力支持。

實驗結果如下:

圖片

其中 BELLE-0.5M-CLEAN 是從 230 萬指令數據中清洗得到 0.5M 數據,其中包含單輪和多輪對話數據,和之前開放的 0.5M 數據不是同一批數據。

需要強調指出的是,通過案例分析,我們發現我們的評估集在全面性方面存在局限性,這導致了模型分數的改善與實際用戶體驗之間的不一致。構建一個高質量的評估集是一個巨大的挑戰,因為它需要在保持平衡難易程度的同時包含盡可能多樣的使用場景。如果評估樣本過于困難,那么所有模型的表現將會很差,更難辨別各種訓練數據和策略的效果;相反,如果評估樣本都相對容易,評估將失去其比較價值。同樣地,評估集多樣性不夠的時候,容易出現評估有偏(例如當某個模型的訓練和評估領域或任務類型十分一致)。二者的聯合分布還可能導致部分任務上難易區分度高,部分任務上難易區分度低,進一步加大評估的難度和有效性。此外,必須確保評估數據與訓練數據保持獨立。

圖片

圖 1 評估集的難易度與多樣性分布示意圖

基于這些觀察,我們謹慎地提醒不要假設模型僅通過在有限數量的測試樣本上獲得良好結果就已經達到了與 ChatGPT 相當的性能水平。我們認為,優先發展全面評估集的持續發展具有重要意義。

這篇工作中的相關數據和模型將會于近日在 BELLE 項目中開源。

論文 2:A Comparative Study between Full-Parameter and LoRA-based Fine-Tuning on Chinese Instruction Data for Instruction Following Large Language Model

圖片

論文地址:https://arxiv.org/pdf/2304.08109.pdf

為了實現對大語言模型的指令調優,受限于資源和成本,許多研究者開始使用參數高效的調優技術,例如 LoRA,來進行指令調優,這也取得了一些令人鼓舞的成果。相較于全參數微調,基于 LoRA 的調優在訓練成本方面展現出明顯的優勢。在這個研究報告中,我們選用 LLaMA 作為基礎模型,對全參數微調和基于 LoRA 的調優方法進行了實驗性的比較。

實驗結果揭示,選擇合適的基礎模型、訓練數據集的規模、可學習參數的數量以及模型訓練成本均為重要因素。

我們希望本文的實驗結論能對大型語言模型的訓練提供有益的啟示,特別是在中文領域,協助研究者在訓練成本與模型性能之間找到更佳的權衡策略。 

實驗結果如下:

圖片

其中的 Average Score 是基于本項目集目前開放的 1000 條評估集合得到的(見下文評估數據部分)。LLaMA-13B + LoRA (2M) 代表使用 LLaMA-13B 作為基礎模型和 LoRA 訓練方法,在 2M 指令數據上進行訓練的模型;而 LLaMA-7B + FT (2M) 代表了一個使用全參數微調進行訓練的模型。所有這些實驗都是在 8 塊 NVIDIA  A100-40GB GPU 上進行的,實驗細節請參考我們的論文。

根據評估,我們的模型在數學任務上表現不佳,得分大多低于 0.5。為了驗證  LoRA  在特定任務上的適應能力,我們使用增量 0.25M 數學數據集(math_0.25M)來提升模型的數學能力,并與增量微調方法作為對比。從實驗結果可以看出,增量微調仍然表現更好,但需要更長的訓練時間。LoRA 和增量微調都提高了模型的整體性能。從論文附錄中的詳細數據可以看出,LoRA 和增量微調都在數學任務中顯示出顯著的改進,而只會導致其他任務的輕微性能下降。

總體而言:1) 選擇基礎模型對于 LoRA  調整的有效性具有顯著影響;2)增加訓練數據量可以持續提高 LoRA 模型的有效性;3)LoRA  調整受益于模型參數的數量。對于 LoRA 方案的使用,我們建議可以在已經完成了指令學習的模型的基礎上針對特定任務做 loRA 的自適應訓練。

同樣地,該論文中的相關模型也會盡快開放在 BELLE 項目中。

持續完善的訓練和評估數據

目前 BELLE 已經開放的數據分為兩部分:最近開放的 10M 中文數據集與早前開放的 1.5M 中文數據集。

10M 中文數據集

包含數個由 BELLE 項目產生的不同指令類型、不同領域的子集。目前正在逐步整理中,將會逐漸發布。

  • School Math:包含約 25 萬條生成的中文數學題數據,包含解題過程
  • Multiturn Chat:包含約 80 萬條生成的用戶與助手的多輪對話
  • Generated Chat:包含約 40 萬條生成的給定角色的多輪對話
  • train_2M_CN:包含約 200 萬條生成的多樣化指令任務數據

評估數據

如上文所述,評估數據的質量對評估 LLM 的效果十分關鍵。BELLE 項目開放的中文評估集包含由 BELLE 項目產生的約 1000 條不同指令類型、不同領域的評估樣例,并試圖兼顧評估集的多樣性與難易度。評估集的數據分布見圖 2。

圖片

多樣性方面,評估集涵蓋 extract、open qa、closed qa、rewrite、generation、summerization、classification、brainstorming、others 9 種任務類型,并涵蓋市場銷售、健康飲食、語言文學、旅行、多種編程語言、環保、音樂、歷史、廚藝、影視、體育賽事、醫學、金融、科技等多個主題。任務類型分布見圖 2 (a)。

難易度方面,評估集目前盡可能加入了一些難度偏高的樣本,并且平衡評估集與標注回復的平均指令長度分布。

多終端模型推理和聊天應用 ChatBELLE

開源社區中已經誕生了如 llama.cpp、GPT4ALL、WebLLM 等 LLM 離線部署加速方案。雖然這些項目已經將動輒幾十 GB 的顯存需求和專業 GPU 的算力需求降低至一般的消費電子設備也可運行,但大多仍然需要一些技能才可部署及體驗。

BELLE 希望進一步拓展大語言模型的使用場景,讓更多用戶即使沒有專業設備也能感受到 LLM 帶來的幫助。提供了純離線、跨平臺的 BELLE 聊天應用:結合 4bit 量化后的 ChatBELLE 模型、llama.cpp 和 Flutter 跨平臺 UI,用戶僅需安裝 app、下載模型,即可在各類移動設備上不需聯網本地體驗 ChatBELLE 模型。

首先來看看效果:

macOS

在 M1 Max Macbook 上僅使用 CPU 實時運行,無論是加載還是推理都十分迅速:

圖片

相信隨著 LLM 端上推理相關算法和軟硬件技術的逐步發展,純離線端上模型的效果將越來越好。BELLE 項目將持續優化 ChatBELLE 模型的性能和 App 功能,努力為更多用戶帶來更優質更豐富的體驗。

小結

近兩個月,LLM 開源社區在基礎模型研究、模型指令微調、模型應用場景等多方面的進展稱得上日新月異、百花齊放。BELLE 項目組對這些進展感到欣喜之余,也希望貢獻自己微薄之力,促進開源 LLM,特別是中文開源 LLM 的發展。

雖然在大家不懈努力下開源模型在效果方面已經取得了長足進步,甚至一些模型在個別方面已經與 ChatGPT 甚至 GPT-4 效果比肩,我們仍然需要直面與 OpenAI 的差距。目前,ChatGPT 的能力之多樣、指令跟隨和泛化能力之強、安全性之高,仍然需要開源社區腳踏實地地不斷提升來追趕。在全社區的共同努力下,希望大語言模型將真正屬于每一個人,能夠幫助到每一個人。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-20 17:47:48

模型訓練python后端

2013-03-08 02:52:03

個人開發項目糾錯

2019-12-17 18:25:35

物聯網電腦互聯網

2015-06-12 15:29:06

一個人的爆品

2020-11-06 18:12:19

大數據區塊鏈螞蟻金服

2023-12-20 07:35:03

大模型數據治理機器學習

2018-02-01 17:31:35

微信

2013-08-14 10:23:22

創業個人創業互聯網創業

2025-03-07 09:18:10

2011-06-16 14:21:43

習慣管理

2013-06-07 10:42:53

2013-01-09 17:19:45

Win 8操作系統

2022-01-26 11:00:58

存儲

2025-06-03 06:30:05

2009-02-26 10:19:56

2017-07-13 12:33:15

戴爾

2014-05-29 10:43:29

斯諾登棱鏡監聽

2022-11-10 09:28:40

框架開發

2015-09-24 14:12:34

醫療大數據數據化

2024-05-23 12:57:59

點贊
收藏

51CTO技術棧公眾號

一区二区三区四区亚洲| av男人天堂一区| 欧美成人精品在线| 欧美bbbbb性bbbbb视频| 国产一区二区三区四区五区3d| 亚洲欧美二区三区| 裸模一区二区三区免费| 一级特黄aaa大片在线观看| 国产一区亚洲| 正在播放欧美一区| 国产又粗又长又爽| 在线播放成人| 欧美午夜视频一区二区| 亚洲第一综合网站| 深夜福利视频在线观看| 国产乱子伦视频一区二区三区 | 成人97人人超碰人人99| 国产精品丝袜一区二区三区| 久久久久噜噜噜亚洲熟女综合| 国产精品嫩草影院在线看| 日韩免费看网站| www.亚洲高清| 亚洲欧洲日本韩国| 亚洲制服欧美中文字幕中文字幕| 亚洲免费不卡| 视频一区二区在线播放| 国产精品中文欧美| 国产精品视频自拍| 国产寡妇亲子伦一区二区三区四区| 欧美一区二区| 精品国产一区二区三区在线观看| 可以直接看的无码av| 亚洲小说春色综合另类电影| 欧美视频精品在线| 男人亚洲天堂网| 在线播放高清视频www| 欧美影视一区| 久久综合一区二区| 99国内精品久久久久久久软件| 最近中文字幕在线免费观看| 久久久亚洲一区| 欧美亚洲成人免费| 日韩精品一区二区在线播放| 狠狠入ady亚洲精品经典电影| 日韩在线观看成人| 一本在线免费视频| 日本一区二区在线看| 国产一区二区欧美日韩| 成人片黄网站色大片免费毛片| 精品av导航| 亚洲国语精品自产拍在线观看| 亚洲av无码专区在线播放中文| 国产一区二区三区精品在线观看| 欧美精品第1页| caoporm在线视频| 免费看一区二区三区| 91精品久久久久久久91蜜桃| 久久久久久综合网| 久久久久毛片免费观看| 精品免费一区二区三区| 韩国三级在线看| 久久精品国产亚洲5555| 亚洲精品xxxx| 最近中文字幕在线mv视频在线| 国产区精品区| 日韩亚洲成人av在线| 一级片一级片一级片| 欧美日韩视频一区二区三区| 97视频免费在线观看| 特级西西444www大精品视频免费看| 最新国产拍偷乱拍精品 | 亚洲熟女www一区二区三区| 51精产品一区一区三区| 欧美激情精品久久久久久久变态| 日操夜操天天操| 三级影片在线观看欧美日韩一区二区| 国产精品视频成人| 亚洲男女视频在线观看| 2022国产精品视频| 亚洲一区二区三区涩| 91麻豆一二三四在线| 午夜精品久久久久久久| 欧美亚洲日本在线观看| 91精品国产一区二区在线观看| 日韩一级精品视频在线观看| 无码人妻精品一区二区三区温州| 成人国产精品一级毛片视频| 美女少妇精品视频| 久久精品视频1| 久久99精品久久久久婷婷| 岛国一区二区三区高清视频| 男人久久精品| 亚洲精品精品亚洲| av免费网站观看| 成人av资源网址| 中文字幕久久久| 国产无遮无挡120秒| 日韩激情视频网站| 国产精品久久一区二区三区| 国产美女性感在线观看懂色av| 亚洲人成小说网站色在线| 国产一区二区在线视频播放| 四虎国产精品成人免费影视| 亚洲精品电影网| 欧美黄色aaa| 视频精品一区二区| 国产精品一区二区三区不卡 | 亚洲一区二区五区| 亚洲第一狼人区| 人体久久天天| 欧美成人四级hd版| 无码久久精品国产亚洲av影片| 国产91精品一区二区麻豆网站| 色999日韩自偷自拍美女| 超碰在线资源| 日韩免费高清视频| 精品无码一区二区三区蜜臀| 视频一区中文字幕| 久久精品国产第一区二区三区最新章节| 免费a级毛片在线播放| 欧美视频13p| 岛国av免费观看| 亚洲综合小说| 国产欧美在线播放| 国产高清免费在线播放| 欧美日韩一区二区三区| 国产精九九网站漫画| 91久久国产| 国产精品久久久久久久久免费看| 男人天堂网在线| 欧美日韩在线免费| 亚洲一区二区三区四区五区六区| 午夜日韩电影| 96sao精品视频在线观看| 天天影视久久综合| 欧美日韩一区二区三区四区| av电影网站在线观看| 91精品推荐| 91久久精品视频| 免费av毛片在线看| 欧美精品三级日韩久久| 午夜国产福利视频| 精品无人码麻豆乱码1区2区 | 欧美日韩免费不卡视频一区二区三区| 少妇久久久久久久久久| 男女av一区三区二区色多| 久久成人资源| 欧美成人影院| 亚洲性69xxxbbb| 亚洲天堂免费av| 国产精品对白交换视频| 一级做a爱视频| 欧美不卡在线| 国产伦精品一区二区三区照片91| 污网站在线免费看| 亚洲国产精品电影在线观看| 日韩网红少妇无码视频香港| jvid福利写真一区二区三区| 男人天堂1024| 红桃成人av在线播放| 国产精品啪视频| 国产一二区在线| 精品福利一二区| 国产精品999在线观看| 久久婷婷国产综合精品青草| 能看的毛片网站| 午夜国产一区二区| 99国产在线观看| 美女露胸视频在线观看| 亚洲最新视频在线| 国产熟女一区二区三区五月婷| 亚洲免费av网站| 毛茸茸free性熟hd| 日本午夜一本久久久综合| 亚洲一区二区三区乱码| 中文在线综合| 日本高清+成人网在线观看| 在线播放麻豆| 亚洲成人教育av| 中文字幕在线2018| 一个色在线综合| 一级片视频免费看| 国产精品一二三四五| 国产在线青青草| 婷婷亚洲综合| 精品蜜桃一区二区三区| 全球最大av网站久久| 色综合91久久精品中文字幕| 欧美偷拍视频| 欧美一区二区三区的| 日韩精品一区二区亚洲av| 成人免费小视频| 国产精品嫩草av| 精彩视频一区二区| 久久国产亚洲精品无码| 66视频精品| 日本精品一区| 国产色噜噜噜91在线精品| 国产精品美女久久久免费| heyzo高清国产精品| 色先锋资源久久综合5566| 色呦呦免费观看| 91精品国产一区二区人妖| 日本中文字幕久久| 亚洲国产精品一区二区尤物区| 在线观看免费黄色网址| 99久久伊人精品| 欧美熟妇精品一区二区| 免费成人小视频| 色综合av综合无码综合网站| 欧美视频导航| 美国av在线播放| 成人羞羞在线观看网站| 欧美男人的天堂| 牛牛精品成人免费视频| 97久久夜色精品国产九色| 欧洲亚洲精品久久久久| 日韩免费在线看| 理论片午夜视频在线观看| 欧美寡妇偷汉性猛交| 国产在线1区| 日韩中文字幕国产精品| 黄色av网站在线免费观看| 亚洲激情 国产| www.亚洲欧美| 欧美一二区视频| 国产精品久久久久久久久毛片 | 中文字幕在线看高清电影| k8久久久一区二区三区| 亚洲熟妇一区二区| 狠狠色伊人亚洲综合成人| 91女神在线观看| 免费看黄色91| 在线观看高清免费视频| 日产国产高清一区二区三区| av网站在线观看不卡| 亚洲欧美日本日韩| 日本韩国欧美在线观看| 在线视频观看日韩| 欧美精品久久久久久久免费| 韩国av一区| 九九热只有这里有精品| 在线欧美三区| 欧美极品欧美精品欧美| 国产日韩欧美一区在线| 97超碰青青草| 久久蜜桃资源一区二区老牛| 黄色高清无遮挡| 日韩精品电影在线| 亚洲综合色在线观看| 美女视频黄 久久| 午夜视频在线网站| 国产一区二区三区四区五区入口| www.偷拍.com| 丁香激情综合国产| 亚洲中文字幕无码av| 91蝌蚪porny成人天涯| 亚洲精品视频大全| 欧美激情资源网| 久久精品一区二区三区四区五区| 亚洲欧美日韩小说| 日本少妇bbwbbw精品| 激情亚洲一区二区三区四区| www五月天com| 欧美电影一区二区| www.色婷婷.com| 精品无人区太爽高潮在线播放 | 欧美xxxx14xxxxx性爽| 黄网av在线| 人九九综合九九宗合| 成人性片免费| 成人黄色片视频网站| 在线一级成人| 亚洲AV无码成人精品一区| 国产精品a久久久久| 国产97在线 | 亚洲| 美国毛片一区二区| 日本一区二区免费视频| 久久天堂av综合合色蜜桃网| 欧美丰满熟妇bbbbbb| 欧美日韩国产精品一区二区三区四区| 天天干,天天干| 日韩一区二区三区四区五区六区 | 视频一区在线| 日本10禁啪啪无遮挡免费一区二区| 色欧美自拍视频| 黄色成人在线看| 蜜桃视频一区二区| 亚洲精品激情视频| 国产精品丝袜91| 国产一级片免费观看| 欧美色网站导航| 天天射,天天干| www.精品av.com| 在线观看特色大片免费视频| 成人妇女淫片aaaa视频| 另类在线视频| 日本精品免费视频| 久热精品视频| 99re这里只有| 亚洲特黄一级片| 无码人妻丰满熟妇精品| 欧美α欧美αv大片| 在线国产91| 欧美一级电影久久| 综合伊人久久| 热这里只有精品| 日产欧产美韩系列久久99| 怡红院一区二区| 亚洲黄网站在线观看| 精品国产青草久久久久96| 亚洲福利在线视频| 国产网站在线免费观看| 国产精品欧美一区二区三区奶水 | 亚洲精品一区久久久久久| 超碰在线免费公开| 国产精品在线看| 国产中文字幕一区二区三区| 福利视频一二区| 国产高清不卡二三区| 91高清免费观看| 欧美日本一区二区| av电影在线网| 国产成人一区二区三区小说| 久久成人福利| 国产无限制自拍| 高清久久久久久| 日本午夜在线观看| 在线播放欧美女士性生活| 国产爆初菊在线观看免费视频网站| 国语对白做受69| 欧美巨大xxxx| 欧美亚洲精品一区二区| 91在线一区二区| 日韩特黄一级片| 亚洲精品美女久久| 英国三级经典在线观看| 久久精品magnetxturnbtih| 最新亚洲视频| 国产伦精品一区二区三区妓女| 精品欧美一区二区三区| 日韩国产福利| 国产精品夫妻激情| 精品日韩在线| 污版视频在线观看| 欧美激情一区二区三区不卡| 欧美男人天堂网| 中文字幕亚洲欧美日韩高清| 麻豆久久久久| 午夜探花在线观看| 国产成人福利片| 一级片免费网址| 亚洲色图综合久久| 欧美日韩精品一区二区三区视频| 亚洲精品乱码视频| 精一区二区三区| 久久久99精品| 日韩国产高清污视频在线观看| 成人免费看视频网站| 日韩中文字幕av在线| 激情六月婷婷综合| 久久久久人妻一区精品色欧美| 亚洲成色999久久网站| 日韩影院在线| 日韩久久久久久久| 狠狠色丁香九九婷婷综合五月| 久久久精品人妻一区二区三区四| 亚洲成年人影院在线| 日本久久免费| 一本二本三本亚洲码| 成人国产电影网| 国产一区二区视频免费| 久久天天躁狠狠躁夜夜躁2014 | 国产美女在线观看一区| 国产香蕉在线视频| 亚洲视频综合网| 国产精品xnxxcom| av之家在线观看| 国产精品久久久久久亚洲毛片 | 国产理论片在线观看| 久久久亚洲国产| 国内亚洲精品| 国产一级二级av| 91久久精品一区二区三| 成年人黄视频在线观看| 看欧美日韩国产| 国内外成人在线| 日韩视频免费观看高清| 日日噜噜噜夜夜爽亚洲精品 | 欧美jizz18| 极品美女扒开粉嫩小泬| 国产精品美女久久久久久久久| 亚洲精品国产片| 国产日韩欧美91| 久久久亚洲人| www.99re7.com| 不卡av电影院| 欧美日韩在线二区| 亚洲最大的黄色网| 91麻豆精品国产综合久久久久久|