精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

直追GPT-4!李開復Yi-34B新成績公布:94.08%的勝率超越LLaMA2等主流大模型

人工智能
Elo評分越高,說明模型在真實用戶體驗上的表現越出色,可說是眾多大模型評測集中最能展現 “Moment of Truth 真實關鍵一刻” 的用戶導向體驗對決。

僅次于GPT-4,李開復零一萬物Yi-34B-Chat最新成績公布——

在Alpaca經認證的模型類別中,以94.08%的勝率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT!

圖片圖片

不僅如此,在加州大學伯克利分校主導的LMSYS ORG排行榜中,Yi-34B-Chat也以1102的Elo評分,晉升最新開源SOTA開源模型之列,性能表現追平GPT-3.5。

在五花八門的大模型評測中,伯克利LMSYS ORG排行榜采用了一個最為接近用戶體感的 “聊天機器人競技場” 特殊測評模式,讓眾多大語言模型在評測平臺隨機進行一對一 battle,通過眾籌真實用戶來進行線上實時盲測和匿名投票,11月份經25000的真實用戶投票總數計算了20個大模型的總得分。

Elo評分越高,說明模型在真實用戶體驗上的表現越出色,可說是眾多大模型評測集中最能展現 “Moment of Truth 真實關鍵一刻” 的用戶導向體驗對決。

圖片圖片

△LMSYS ORG榜單(發布于2023年12月8日)

中文能力方面,Yi-34B-Chat 微調模型同樣不遑多讓。SuperCLUE是一項針對中文能力的排行榜,從基礎能力、專業能力和中文特性能力三個不同的維度,評估模型的能力。

根據11月底發布的《SuperCLUE中文大模型基準評測報告 2023》,11月下旬首度發布的 Yi-34B Chat,迅速晉升到和諸多國產優秀大模型齊平的 “卓越領導者” 象限,在多項基準評測中的 “SuperCLUE 大模型對戰勝率” 這項關鍵指標上,Yi-34B-Chat 取得31.82%的勝率,僅次于GPT4-Turbo。

△中文SuperCLUE排行榜(發布于2023年11月28日)△中文SuperCLUE排行榜(發布于2023年11月28日)

對話場景實測

Yi-34B-Chat 模型實力在不同的對話場景中實力如何?來看幾個更直觀的問題演示:

例如“喂”給Yi-34B-Chat如下問題:

Transformer 模型結構能不能走向 AGI ?

圖片圖片

不難看出,Yi-34B-Chat的回答可以說是有理有據。

再來:

給我生成一個小紅書文案,給大家安利一只豆沙色的口紅。

圖片圖片

回答可以說是非常符合現在小紅書主流的帶貨風格了。

中文理解方面,我們再出一道題:

小王給領導送了一份禮物后。領導說:“小王,你這是什么意思?”小王:“一點心意,意思意思。”領導:“你這就不夠意思了。”小王:“小意思,小意思。”領導:“小王,你這人真有意思。”小王:“也沒什么別的意思。”領導:“那我多不好意思。”小王:“是我不好意思。”這個意思到底是什么意思?

圖片圖片

可以看到,即便是在非常“繞”的中文理解方面,Yi-34B-Chat也是精準的拿捏住了。

據零一萬物介紹,除了 Yi 系列強基座的貢獻以外,Yi-34B-Chat 模型的效果還得益于其人工智能對齊(AI Alignment)團隊采用了一系列創新對齊策略。通過精心設計的指令微調流程,不僅強化了模型在理解和適應人類需求方面的能力,還使得模型與人類價值觀對齊,包括幫助性(Helpful),可靠性(Honest),無害性(Harmless)等。

在強基座設定下,該團隊采用了一種輕量化指令微調方案,該方案涵蓋了單項能力提升和多項能力融合兩個階段。
其中,單項能力包括通用指令跟隨、創意內容生成、數學、推理、編程、泛COT、對話交互等。通過大量的消融實驗,針對模型單能力構建和多能力融合總結了獨家認知經驗。

在數據的量和質方面,一方面,團隊在強基座模型上,實現僅需要少量數據(幾條到幾百條),就能激發模型特定單項能力;另一方面,數據質量比數量重要,少量高質量數據比大量低質量數據更好。通過關注超出模型能力的“低質量”數據,減少了模型“幻覺”。

在指令多樣性與難度方面,團隊通過在各能力項下構建任務體系,實現了訓練數據中的指令均衡分布,大幅提升了模型泛化性。通過復合指令構造和指令難度進化,不僅提升了模型效果,也顯著降低了對數據量的需求。

在風格一致性方面,團隊發現訓練數據的風格會影響模型收斂速度和能力上限的逼近程度,因此統一了回復風格,比如重點設計了CoT的回復風格,實現在輕量SFT情況下,避免了風格不一致加劇模型的“記憶”現象。

在多能力融合階段,團隊采用網格搜索的方法來決定數據配比和超參數的設置,通過基準測試和自建評測集的結果來指導搜索過程,成功實現模型的多能力融合。

不僅如此,Yi模型開源首月,數據也很亮眼。

在Hugging Face社區下載量為16.8萬,魔搭社區下載量1.2萬。在GitHub 獲得超過4900個Stars。

由于性能表現強勁,多家知名公司和機構推出了基于Yi模型基座的微調模型,比如獵豹旗下的獵戶星空公司推出的OrionStar-Yi-34B-Chat模型,南方科技大學和粵港澳大灣區數字經濟研究院(簡稱IDEA研究院)認知計算與自然語言研究中心(簡稱CCNL中心)聯合發布的SUS-Chat-34B等,均性能表現優異。而AMD和Hugging Face合作的GPU加速大模型的實驗中,也選擇了Yi-6B作為范例項目。

知名技術寫作者蘇洋表示,在他觀察的近期Hugging Face榜單中,前三十名有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的 68B 和 70B 模型的數量目前只留有幾個,“從這點看 Yi 對于開源生態的幫助還是非常巨大的。”

用戶真實反饋實錄

Yi-34B開源發布后,開發者Eric Hartford就發現了模型存在的一個小問題。

他在郵件中寫道:

感謝你們提供了一個優秀的模型。Yi模型使用了與LLaMA模型完全相同的架構,只是將兩個張量改了名字。由于圍繞LLaMA架構有很多投資和工具,保持張量名稱的一致性是有價值的。”Eric建議,在Yi被廣泛傳播前,及時恢復張量名稱。

零一萬物意識到命名問題的疏忽對開發者造成的不便,跟Eric和其他開發者提出說明,表達誠摯的歉意,并很快便在各開源平臺重新提交模型及代碼,完成了開源社區的版本更新。

然而Eric自己也沒有預想到,他的這個建議,在國內竟被曲解、誤讀,引發了輿論關于Yi模型“抄襲”LLaMA的質疑。

事實上,一個模型核心技術護城河是在架構之上,通過數據訓練獲得的參數和代碼,在沿用了開源社區普遍使用的LLaMA 架構之上。

根據零一萬物團隊的說法,他們是從零開始,用高質量的數據集、自研訓練科學和AI Infra打造了 Yi-34B 在內的系列模型。為了執行對比實驗的需要,對部分推理參數進行了重新命名。原始出發點是為了充分測試模型,而非刻意隱瞞來源。

身處這場輿論風暴的中心,Eric也在X(twitter)上寫道:

他們沒有在任何事情上撒謊。所有的模型都是在相互借鑒架構。架構是學術研究的產物,已經發表在論文中,任何人都可以自由使用,這絲毫不減損Yi團隊的成就。他們從零開始使用自己創建的數據集訓練Yi,對開源領域的貢獻是值得贊揚的。

圖片圖片

緊接著,他又說,“使用Llama架構沒有任何問題。訓練才是關鍵。Yi給了我們目前可獲得的最佳模型,沒有任何可抱怨的。”

現在,Eric已經成為Yi-34B的忠實擁躉,會使用Yi-34b-200k數據集訓練其他的模型產品,并感嘆絲滑般的訓練體驗。

數字化創業者,開發者,技術寫作者蘇洋表示:

我自己本身是大模型產品的重度用戶,除了用了很久的 Tabnine、Copilot 做代碼輔助生成之外,也算是第一批開始氪金使用 Chat 的玩家,基本各家廠商模型出來都會申請內測,體驗模型的實際能力。這里除去工作中接觸和使用模型的機會外,作為獨立開發者,玩了十幾年的代碼,我個人也非常好奇模型究竟能夠發展到什么程度。

我了解到 Yi-34B 有幾個渠道,當時的 Huggingface 榜單第一名、小圈子朋友的“點贊”和“吐槽”、各種群里刷屏的消息。

圖片圖片

我是開發者,同時也是終端用戶,所以非常好奇,這個模型到底行不行?或者說更想知道模型哪里是行的,哪里是不行的。尤其是榜單分數這么高,質疑聲浪也這么高?與其霧里看花、眾說紛紜,不如自己實際跑一跑。

于是,我嘗試使用家里本地的機器,在純 CPU 環境、CPU & GPU 混合環境下對模型進行測試,結果比想象中要好。

尤其是社區中的 finetune 后的版本,在對新聞、研究報告的摘要總結方面,對非結構化的信息中的實體識別和抽取上表現非常不錯。早些時候,官方還未推出 Chat 版本時,來自社區的 Chat 版本在對話的過程中,通史類的問答表現也非常不錯。當然,可能是由于零一在訓練過程中,出于安全考慮,過濾太多語料的緣故,一些本土化的內容仍然不夠深入。

而且,不光是我的個人體驗,海外也有用戶有相同體感,在“海外貼吧” Reddit 上有分享自己的感受,你們可以自己搜搜看。

我會時不時的瀏覽下 HF 的榜單,在最近榜單中的前三十名,有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的 68B 和 70B 模型的數量目前只留有幾個,從這點看 Yi 對于開源生態的幫助還是非常巨大的。

34B 普通用戶努努力還是能自己相對低成本跑起來的,68 和 70B 的模型想要本地運行,需要更多的資源。但其實目前分數其實相比較 34B 拉不開太多,也就三四分平均分,但參數量差了一倍。換言之,企業想部署使用,所需要的成本也可以得到非常大的節約。

目前國產大模型在開源榜單上已經是第一梯隊,但如果把競爭范圍追加到閉源模型、尤其是海外的模型,仍有很大的距離要去追趕。目前的普遍體驗是開源模型最多只有 GPT-3.5 + 的水平。

我個人相信國產大模型是能夠很快追趕至第一梯隊的。

就如同很多底子很好,又勤奮刻苦的中國大學生,能夠在使用正確方法的前提下,通過努力,不斷的進入更好的學習環境,不斷刷新自己成績,取得耀眼的學術成就。現實中,哪怕是對華人苛刻的 “八大藤校”,是不是中國人越來越多了呢?

只要底子好,堅持使用開源的正確路線和方法,做好本地化適配和調優,就有希望。

參考鏈接:
[1]https://huggingface.co/01-ai/[2]https://www.modelscope.cn/organization/01ai

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-09-11 15:57:16

人工智能模型GPT-4

2023-09-19 14:56:00

模型訓練

2023-08-27 12:54:59

GPT-4神秘版本Code

2024-02-07 12:13:03

AI模型

2025-05-30 07:40:56

2023-07-25 09:23:23

Llama 2GPT-4

2024-05-20 08:40:00

2024-03-27 13:32:00

AI數據

2023-06-05 12:32:48

模型論文

2023-08-21 10:36:23

2024-01-30 21:18:57

模型智能CMMLU

2023-10-11 13:09:52

訓練模型

2024-06-17 18:04:38

2023-09-07 13:25:00

AI模型

2024-12-25 20:01:13

2023-06-08 11:27:10

模型AI

2023-08-27 14:08:17

開源代碼Meta大模型

2023-11-09 12:41:40

AI數據

2023-11-15 09:23:00

模型AI
點贊
收藏

51CTO技術棧公眾號

午夜激情视频在线播放| 欧美中文字幕一区二区三区亚洲 | 成年女人免费视频| av影院在线| 国产一区二区三区在线观看精品 | 国产乱人伦偷精品视频不卡| 国内自拍欧美激情| 日本高清www| 国产欧美视频在线| 亚洲品质自拍视频| 蜜桃欧美视频| 欧美精品亚洲精品日韩精品| 成人在线电影在线观看视频| 欧美成人a在线| 中文字幕第80页| 欧美一级在线亚洲天堂| 欧美久久久精品| 一区二区视频观看| 日韩电影精品| 亚洲影院免费观看| 波多野结衣精品久久| 中文字幕在线天堂| 激情欧美一区二区三区| 亚洲欧洲日产国产网站| www.黄色网| 欧美久久久网站| 偷窥国产亚洲免费视频| 天堂av免费看| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 久久综合狠狠| 97不卡在线视频| 久久久久亚洲AV成人| 男男gay无套免费视频欧美| 欧美一区欧美二区| 嫩草影院国产精品| 韩日成人影院| 欧美日韩国产一中文字不卡| 日本福利视频网站| 欧美成人三区| av亚洲精华国产精华精| 91久久国产精品| 在线免费观看中文字幕| 日韩不卡一区二区三区| 日本电影亚洲天堂| 国偷自拍第113页| 激情久久久久久久| 欧美猛男性生活免费| 黄色片在线观看免费| 亚洲人挤奶视频| 日韩高清av在线| 最新在线黄色网址| 日韩欧美天堂| 亚洲国产欧美一区二区丝袜黑人| 亚洲理论中文字幕| 91精品视频一区二区| 欧美日韩成人综合在线一区二区| 国产成人精品无码播放| 国产精品粉嫩| 在线观看日韩电影| 国产区二区三区| 欧美成人三级| 51精品视频一区二区三区| 日韩无套无码精品| a欧美人片人妖| 91成人在线精品| 青青草精品视频在线观看| 国产极品久久久久久久久波多结野| 精品久久久久久中文字幕一区奶水| 日本一本中文字幕| 九色porny自拍视频在线播放| 亚洲最大色网站| 少妇人妻大乳在线视频| 中日韩高清电影网| 亚洲一区二区不卡免费| 久久这里只有精品23| 嗯~啊~轻一点视频日本在线观看| 亚洲国产视频一区| 成熟了的熟妇毛茸茸| av亚洲一区二区三区| 欧美日韩国产一级片| 久久久精品视频国产| 日韩精品视频在线看| 亚洲国产高清福利视频| 呦呦视频在线观看| 国产影视一区| 欧美成人精品xxx| 久久久久久久久久久久久久免费看| 亚洲精品乱码久久久久久蜜桃麻豆| 2019中文字幕全在线观看| 欧美在线视频精品| 国产精品一区二区三区四区| 国产一区二区不卡视频在线观看 | 国产高清不卡| 91精品在线免费| 黄色网址在线视频| 首页国产精品| 久久亚洲一区二区三区四区五区高| 国产午夜激情视频| 免费成人美女在线观看.| 亚洲精品欧美日韩专区| 青春有你2免费观看完整版在线播放高清 | 中文字幕观看视频| 国产成人免费视频精品含羞草妖精| 久久久久久久久久久久久9999| 黄色片在线看| 一区二区三区高清不卡| 成人观看免费完整观看| 九九九九九九精品任你躁| 亚洲精品在线视频| 最新黄色av网址| 国产日本精品| 91精品国产综合久久香蕉的用户体验 | 免费视频观看成人| 精品免费日韩av| 少妇精品无码一区二区免费视频| 亚洲成人日韩| 国产精品1区2区在线观看| 免费av一级片| 中文字幕一区二区三区在线不卡| 黑森林福利视频导航| 成人激情自拍| 久久成人亚洲精品| 无码一区二区三区| 99久久伊人久久99| 99re6这里有精品热视频| 九九热线视频只有这里最精品| 日韩视频免费直播| 中文字幕伦理片| 亚洲一区二区三区高清不卡| 国产富婆一区二区三区 | 韩国v欧美v日本v亚洲| 中文字幕第99页| 国产午夜精品一区二区| 91视频最新入口| 国产精品一区二区中文字幕| 欧美另类第一页| 国产精品一区二区av白丝下载| 久久毛片高清国产| 免费无码不卡视频在线观看| 韩国三级大全久久网站| 久久精品2019中文字幕| 少妇太紧太爽又黄又硬又爽| 国产ts人妖一区二区| 伊甸园精品99久久久久久| 黑人精品一区| 一区二区三区视频免费| 青青草视频在线观看免费| 久久综合成人精品亚洲另类欧美| 人妻少妇精品无码专区二区| 超碰成人免费| 欧美精品一区二区免费| 国产夫妻性生活视频| 亚洲人被黑人高潮完整版| 香蕉视频xxxx| 欧美久久视频| 国产福利久久精品| 国产99在线观看| 日韩成人高清在线| 久久精品国产亚洲AV无码麻豆| 国产69精品一区二区亚洲孕妇| 中文字幕在线亚洲精品| 国产精品欧美一区二区三区不卡| 大胆欧美人体视频| 一区二区三区精| 亚洲私人影院在线观看| 麻豆免费在线观看视频| 欧美成人tv| 999国内精品视频在线| 91麻豆一二三四在线| 精品蜜桃在线看| 在线免费观看亚洲视频| 成人免费观看男女羞羞视频| 国产h视频在线播放| 美女网站一区| 成人亚洲欧美一区二区三区| 美足av综合网| 日韩欧美的一区| 婷婷激情五月网| 中文字幕欧美三区| 宇都宫紫苑在线播放| 亚洲毛片av| 少妇免费毛片久久久久久久久| 浪潮色综合久久天堂| 欧美另类xxx| 男生女生差差差的视频在线观看| 欧美日韩久久久一区| 久久久久久久久99| 国产午夜精品美女毛片视频| 天天爽夜夜爽视频| 中文在线不卡| 熟女熟妇伦久久影院毛片一区二区| 国产乱人伦精品一区| 国产精品av在线| av网站在线免费| 亚洲免费一在线| 国产av无码专区亚洲a∨毛片| 中文字幕在线观看不卡| 91精品国产高清91久久久久久 | 神马影视一区二区| 97在线中文字幕| 巨胸喷奶水www久久久| 欧美日韩国产第一页| 欧美自拍偷拍第一页| 欧美区一区二区三区| 天堂中文在线网| 亚洲精品你懂的| 中文字幕乱视频| 久久97超碰色| 97xxxxx| 欧美黄色一级视频| 亚洲欧洲一区二区福利| 你懂的在线观看一区二区| 成人女保姆的销魂服务| 成人免费图片免费观看| xxx一区二区| 国产在线免费观看| 精品国产污污免费网站入口| 国产精品久久久久久在线| 色88888久久久久久影院野外| 久草视频免费在线播放| 国产精品久久久久久久岛一牛影视 | 欧美一区二区视频在线播放| 日韩免费视频| 免费在线成人av电影| 九九热hot精品视频在线播放| 91网站在线免费观看| 香蕉成人影院| 国产成人精品一区二区| free性m.freesex欧美| 欧美第一淫aaasss性| aa在线视频| 久久精品最新地址| 91社区在线观看| 一区二区三区四区视频| 精品无吗乱吗av国产爱色| 日韩精品黄色网| 亚洲av无码一区二区乱子伦| 欧美日韩电影一区| 91国偷自产中文字幕久久| 欧美特黄级在线| 国产一级精品视频| 一区二区三区四区在线免费观看| www.av免费| 国产精品伦理一区二区| www.4hu95.com四虎| 国产精品日产欧美久久久久| 91视频免费看片| 中文字幕在线观看一区| 亚洲区一区二区三| 1区2区3区精品视频| 黄色一级大片在线免费观看| 日韩一区在线看| 精品亚洲乱码一区二区| 国产精品成人免费精品自在线观看| 999久久久国产| 最好看的中文字幕久久| 久久久久久久久毛片| 亚洲综合一区二区精品导航| 国产精品 欧美 日韩| 欧美日韩国产在线看| 亚洲精品国产无码| 欧美主播一区二区三区美女| 在线视频 中文字幕| 欧美日韩高清一区二区不卡| 亚洲天堂avav| 666欧美在线视频| 亚洲av无码国产精品久久不卡| 亚洲成人动漫在线播放| 精品人妻av一区二区三区| 亚洲电影天堂av| 国产原创av在线| 亚洲天堂久久av| 麻豆传媒在线完整视频| 欧美高清在线观看| 秋霞在线视频| 欧美中文字幕在线| 午夜不卡一区| 国内成+人亚洲| 大片网站久久| 天天爱天天做天天操| 99国产精品视频免费观看一公开| 一区在线观看免费| 91ts人妖另类精品系列| 亚洲国产精品国自产拍av| 色老板免费视频| 亚洲电影第三页| 日本一二三区不卡| 欧美色中文字幕| a视频免费在线观看| 日韩精品欧美激情| 肥臀熟女一区二区三区| 国产一区二区日韩| 影音先锋男人资源在线| 国产91对白在线播放| 欧美美女被草| 久久五月天婷婷| 成人看的羞羞网站| 日韩免费在线观看av| 日日噜噜夜夜狠狠视频欧美人| 奇米777在线| 久久久久久毛片| 久久久久久久久精| 欧美视频一区二区三区在线观看| 国产熟女一区二区丰满| 亚洲免费精彩视频| a篇片在线观看网站| 国产suv精品一区二区| 999精品视频在线观看| 久久精品日产第一区二区三区乱码| 9999国产精品| 成人性免费视频| 国产精品资源站在线| 亚洲ⅴ国产v天堂a无码二区| 无码av免费一区二区三区试看 | 亚洲男同1069视频| 成人毛片一区二区三区| 亚洲电影免费观看高清完整版在线观看 | 亚洲精品成人三区| 小嫩嫩精品导航| 国产高潮视频在线观看| 亚洲精选免费视频| 在线亚洲欧美日韩| 日韩精品福利在线| 9lporm自拍视频区在线| 91gao视频| 91精品国产91久久久久久黑人| 精品免费国产一区二区| 成人ar影院免费观看视频| 极品尤物一区二区| 色av成人天堂桃色av| 久久久久久青草| 91av视频在线观看| 久久久久97| 日韩精品视频在线观看视频| 国产精品夜夜嗨| 加勒比婷婷色综合久久| 欧美肥妇毛茸茸| 男人天堂久久久| 97人人爽人人喊人人模波多| 国产成人免费视频网站视频社区 | 99热99热| 国产精品久久| 中文字幕第3页| 精品久久久久久久久久久| 日本黄色一区二区三区| 欧美国产第一页| 成人午夜三级| 成人一对一视频| 另类成人小视频在线| 国产wwwwxxxx| 欧美日本一区二区三区四区| 黄色网页在线观看| 亚洲自拍偷拍色片视频| 欧美黄色一区二区| 美女伦理水蜜桃4| 精品久久久久久亚洲国产300| 蜜臀av中文字幕| 青青草99啪国产免费| 欧美美乳视频| 午夜免费福利在线| 国产精品福利影院| 在线观看免费视频a| 久久大大胆人体| 超碰一区二区三区| 色综合久久久久无码专区| 国产欧美精品一区二区色综合| 又污又黄的网站| 久久99国产综合精品女同| 精品嫩草影院| 日韩一级片播放| 亚洲婷婷综合久久一本伊一区 | 亚洲成人久久一区| 国产原创视频在线观看| 国产成人精品免费视频大全最热| 亚洲影院在线| 日韩在线视频免费看| 欧美精品视频www在线观看| 欧美亚洲系列| 欧美一区激情视频在线观看| 老司机午夜精品99久久| 特级片在线观看| 亚洲精品一区av在线播放| 成人国产精品| 奇米777四色影视在线看| 91网上在线视频| 一级片一区二区三区| 欧美精品激情blacked18| 国产尤物久久久| 在线免费观看av网| 欧美日韩亚洲精品一区二区三区 | 免费国产自久久久久三四区久久| 五月婷婷丁香色| 亚洲v精品v日韩v欧美v专区| 浮生影视网在线观看免费| 91在线精品观看| 日本一不卡视频| 久久精品欧美一区二区| 在线观看免费高清视频97| 欧州一区二区三区| 国产男女激情视频|