精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

這就翻車了?Reflection 70B遭質疑基模為Llama 3,作者:重新訓練

人工智能 新聞
Reflection 70B 能不能經受住社區的考驗呢?今天 AI 模型獨立分析機構 Artificial Analysis 進行了獨立評估測試,結果有點出乎意料。

最近,開源大模型社區再次「熱鬧」了起來,主角是 AI 寫作初創公司 HyperWrite 開發的新模型 Reflection 70B。最近,開源大模型社區再次「熱鬧」了起來,主角是 AI 寫作初創公司 HyperWrite 開發的新模型 Reflection 70B。

它的底層模型建立在 Meta Llama 3.1 70B Instruct 上,并使用原始的 Llama chat 格式,確保了與現有工具和 pipeline 的兼容性。

這個模型橫掃了 MMLU、MATH、IFEval、GSM8K,在每項基準測試上都超過了 GPT-4o,還擊敗了 405B 的 Llama 3.1。

憑借如此驚艷的效果,Reflection 70B 被冠以開源大模型新王。該模型更是由兩位開發者(HyperWrite CEO Matt Shumer 和 Glaive AI 創始人 Sahil Chaudhary)花了 3 周完成,效率可謂驚人。

Reflection 70B 能不能經受住社區的考驗呢?今天 AI 模型獨立分析機構 Artificial Analysis 進行了獨立評估測試,結果有點出乎意料。

該機構表示,Reflection Llama 3.1 70B 的 MMLU 得分僅與 Llama 3 70B 相同,并且明顯低于 Llama 3.1 70B。

圖源:https://x.com/ArtificialAnlys/status/1832505338991395131

還有科學推理與知識(GPQA)和定量推理(MATH)基準測試的結果,同樣不如 Llama 3.1 70B。

圖源:https://x.com/ArtificialAnlys/status/1832457791010959539

此外,Reddit 上 LocalLLaMA 社區的一個帖子比較了 Reflection 70B 與Llama 3.1、Llama 3 權重的差異,結果顯示,Reflection 模型似乎是使用了經過 LoRA 調整的 Llama 3 而不是 Llama 3.1。

貼主還提供了以上模型權重比較結果的代碼來源。


from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
import matplotlib.pyplot as plt
import seaborn as sns

base_model_name = "meta-llama/Meta-Llama-3-70B-Instruct"
chat_model_name = "mattshumer/Reflection-Llama-3.1-70B"
base_model = AutoModelForCausalLM.from_pretrained(base_model_name, torch_dtype=torch.bfloat16)
chat_model = AutoModelForCausalLM.from_pretrained(chat_model_name, torch_dtype=torch.bfloat16)

def calculate_weight_diff(base_weight, chat_weight):
    return torch.abs(base_weight - chat_weight).mean().item()

def calculate_layer_diffs(base_model, chat_model):
    layer_diffs = []
    for base_layer, chat_layer in zip(base_model.model.layers, chat_model.model.layers):
        layer_diff = {
            'input_layernorm': calculate_weight_diff(base_layer.input_layernorm.weight, chat_layer.input_layernorm.weight),
            # 'mlp_down_proj': calculate_weight_diff(base_layer.mlp.down_proj.weight, chat_layer.mlp.down_proj.weight),
            # 'mlp_gate_proj': calculate_weight_diff(base_layer.mlp.gate_proj.weight, chat_layer.mlp.gate_proj.weight),
            # 'mlp_up_proj': calculate_weight_diff(base_layer.mlp.up_proj.weight, chat_layer.mlp.up_proj.weight),
            'post_attention_layernorm': calculate_weight_diff(base_layer.post_attention_layernorm.weight, chat_layer.post_attention_layernorm.weight),
            'self_attn_q_proj': calculate_weight_diff(base_layer.self_attn.q_proj.weight, chat_layer.self_attn.q_proj.weight),
            'self_attn_k_proj': calculate_weight_diff(base_layer.self_attn.k_proj.weight, chat_layer.self_attn.k_proj.weight),
            'self_attn_v_proj': calculate_weight_diff(base_layer.self_attn.v_proj.weight, chat_layer.self_attn.v_proj.weight),
            'self_attn_o_proj': calculate_weight_diff(base_layer.self_attn.o_proj.weight, chat_layer.self_attn.o_proj.weight)
        }
        layer_diffs.append(layer_diff)
    return layer_diffs

def visualize_layer_diffs(layer_diffs):
    num_layers = len(layer_diffs)
    num_components = len(layer_diffs[0])

    fig, axs = plt.subplots(1, num_components, figsize=(24, 8))
    fig.suptitle(f"{base_model_name} <> {chat_model_name}", fontsize=16)

    for i, component in enumerate(layer_diffs[0].keys()):
        component_diffs = [[layer_diff[component]] for layer_diff in layer_diffs]
        sns.heatmap(component_diffs, annot=True, fmt=".6f", cmap="YlGnBu", ax=axs[i], cbar_kws={"shrink": 0.8})
        axs[i].set_title(component)
        axs[i].set_xlabel("Layer")
        axs[i].set_ylabel("Difference")
        axs[i].set_xticks([])
        axs[i].set_yticks(range(num_layers))
        axs[i].set_yticklabels(range(num_layers))
        axs[i].invert_yaxis()

    plt.tight_layout()
    plt.show()

layer_diffs = calculate_layer_diffs(base_model, chat_model)

visualize_layer_diffs(layer_diffs)

還有人貼出了 Matt Shumer 在 Hugging Face 對 Reflection 70B 配置文件名稱的更改,可以看到從 Llama 3 70B Instruct 到 Llama 3.1 70B Instruct 的變化。

圖片圖片

這樣的事實擺在眼前,似乎讓人不得不信。各路網友也開始發聲附和,有人表示自己從一開始就懷疑它是 Llama 3,當用德語問模型一些事情時,它卻用英語回答。這種行為對于 Llama 3 非常常見。

圖片圖片

還有人奇怪為什么 Reflection 70B 模型一開始就得到了如此多的炒作和關注,畢竟第一個談論它是「頂級開源模型」的人是開發者本人(Matt)。而且更確切地說,模型是微調的。

圖片圖片

更有人開始質疑開發者(Matt),認為他只是這家公司(GlaiveAI)的利益相關者,試圖通過炒作來增加價值,實際上卻對這項技術一無所知。

圖片圖片

在被質疑 Reflection 70B 的基礎模型可能是 Llama 3 而非 Llama 3.1 70B 時,Matt Shumer 坐不住了,現身進行了澄清,并表示是 Hugging Face 權重出現了問題。

圖片圖片

就在幾個小時前,Matt Shumer 稱已經重新上傳了權重,但仍然存在問題。同時他們開始重新訓練模型并上傳,從而消除任何可能出現的問題,應該很快就會完成。

圖片圖片

當被問到為何需要重新訓練時,Matt Shumer 表示本不需要這樣做,但已經嘗試了所有方法。無論做什么,Hugging Face 上 Reflection 70B 模型都會出現問題,導致離預期中的性能差得遠。

圖片圖片

當然 Matt Shumer 還面臨更多質疑,比如對 GlaiveAI 的投資情況、為什么 Hugging Face 上的基礎模型為 Llama 3 而不是 Llama 3.1 以及基準中有關 LORAing 的問題。

圖片圖片

Matt Shumer 一一進行了解釋。(以下標引用)

  1. 我是一個超級小的投資者(1000 美元),只是一次支持性的投資,因為我認為 Sahil Chaudhary 很棒。
  2. 至于為什么基礎模型是 Llama 3,我們不知道。這就是為什么我們從頭開始再訓練,應該很快完成。
  3. 那些嘗試了 Playground 并擁有早期訪問權限的用戶獲得了與托管 API 截然不同的體驗,我們需要弄清楚這一點。
  4. 不確定什么是 LORAing,但我們檢查了污染,將在下周與 405B(或更早)一起發布數據集,到時候可以查看。

至于重新訓練后的 Reflection 70B 表現如何?我們拭目以待。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-05 08:33:29

2024-12-09 07:10:00

Llama 3.3GeminiGPT-4.5

2024-07-02 09:20:59

2024-04-09 13:21:00

AI開源

2024-05-30 12:50:05

2024-08-26 10:00:00

模型數據

2024-09-09 08:50:00

2024-04-19 10:32:08

2024-09-14 09:31:00

2024-04-26 07:48:45

DockerLLama3模型

2024-12-13 14:03:44

模型訓練AI

2024-11-13 15:00:42

2024-04-30 08:28:44

開源大模型Llama

2024-11-25 08:10:00

2025-03-31 09:46:00

2024-07-23 09:20:35

2024-04-29 12:14:03

模型數據開源

2024-01-31 09:38:23

AI模型

2024-05-29 14:11:00

點贊
收藏

51CTO技術棧公眾號

国产又黄又爽又无遮挡| 午夜免费一级片| 国产小视频在线观看| 蜜臀av亚洲一区中文字幕| 久久精品中文字幕电影| 日韩精品人妻中文字幕有码| 日本欧美不卡| 一区二区在线观看视频| 欧美精品一区在线发布| 99热这里是精品| 国产精品丝袜xxxxxxx| 色婷婷综合久久久久| 国产一精品一aⅴ一免费| videos性欧美另类高清| 《视频一区视频二区| 韩国成人av| 国产精品一区二区人人爽| 国产日本精品| 久久综合伊人77777蜜臀| 精品无码在线视频| 精品国模一区二区三区欧美| 色综合咪咪久久| www成人免费| 色的视频在线免费看| 99精品桃花视频在线观看| 亚洲aaa激情| 免费av中文字幕| 亚洲激情影院| 久久69精品久久久久久国产越南| 精品人妻中文无码av在线| 精品素人av| 日韩一区二区在线看片| 五月婷婷六月丁香激情| 美女的胸无遮挡在线观看| 亚洲免费在线播放| 致1999电视剧免费观看策驰影院| 日韩电影网址| av不卡在线观看| caoporn国产精品免费公开| 一区二区三区免费在线视频| 久久狠狠婷婷| 4p变态网欧美系列| 日韩av电影网址| 欧美日韩p片| 另类少妇人与禽zozz0性伦| 国产激情av在线| 国产一区二区三区探花| 精品亚洲aⅴ在线观看| www.美色吧.com| 日韩欧美激情电影| 日韩视频一区二区三区| 亚洲高清在线不卡| av在线播放一区二区| 欧美日韩国产色站一区二区三区| 成人在线观看黄| 成人黄色免费短视频| 欧美性猛交xxxx免费看久久久 | 欧美美女视频| 亚洲欧美日韩中文在线| 性欧美丰满熟妇xxxx性久久久| 第四色在线一区二区| 欧美精品一区视频| 深田咏美中文字幕| 日韩精品导航| 亚洲色图国产精品| 亚洲精品国产91| gogogo高清在线观看一区二区| 一区二区三区视频免费在线观看| 国产又粗又猛又爽视频| 久久要要av| 久久伊人精品天天| 久久免费视频播放| 99re国产精品| 国产精品av电影| 91午夜交换视频| 国产91精品久久久久久久网曝门 | 亚洲激情自拍视频| 妞干网在线观看视频| 亚洲优女在线| 欧美午夜电影在线播放| 亚洲黄色片免费看| 成人三级毛片| 亚洲美女精品久久| 国产又粗又长又黄的视频| 亚洲成人一区| 国语自产精品视频在免费| 亚洲成人第一网站| 狠狠狠色丁香婷婷综合久久五月| 亚洲aa中文字幕| 天堂av电影在线观看| 中文字幕欧美国产| 99er在线视频| 日韩三区免费| 欧美xxx久久| 白白色免费视频| 午夜久久99| 热门国产精品亚洲第一区在线| 中文字幕在线观看精品| 国产99久久久国产精品| 欧美xxxx黑人又粗又长密月| 黄色在线论坛| 欧美日韩美女视频| 亚洲精品国产久| 蜜桃a∨噜噜一区二区三区| 日韩中文理论片| 99热只有这里有精品| 精品中文字幕一区二区| 久久人人九九| 欧美黑人猛交的在线视频| 欧洲一区二区三区免费视频| 亚洲区 欧美区| 日本女优一区| 欧美亚洲国产日韩2020| 国产激情视频在线播放| 久久精品水蜜桃av综合天堂| 成人区一区二区| 羞羞视频在线观看一区二区| 日韩av在线免费看| 国产尤物在线播放| 日本成人在线视频网站| 九九九九精品九九九九| 永久免费网站在线| 欧美日韩一区三区| 亚洲成人网在线播放| 亚洲二区精品| 91久久精品一区二区别| 免费在线观看av网站| 欧洲中文字幕精品| 醉酒壮男gay强迫野外xx| 欧美精品日韩| 91精品啪aⅴ在线观看国产| 国产中文字幕在线| 日韩欧美精品中文字幕| 黄色网址在线视频| 亚洲视频狠狠| 99久久99久久精品国产片| 婷婷在线视频| 欧美三级在线看| 69精品无码成人久久久久久| 午夜亚洲福利在线老司机| 国产精华一区二区三区| 永久免费网站在线| 日韩欧美的一区| 欧美日韩国产精品综合| 国产精品69久久久久水密桃| 亚洲综合激情五月| 日韩成人在线一区| 日韩中文字幕av| 国产一区二区三区黄片| 国产精品麻豆久久久| wwwwwxxxx日本| 97精品视频在线看| 亚洲va电影大全| 成人看片免费| 精品免费视频一区二区| 日本一区二区欧美| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 久久99999| 久久亚洲成人| 91精品久久香蕉国产线看观看| 综合久久2019| 亚洲精品国产免费| 黄色一级视频免费看| 日本一区二区免费在线观看视频| 成人免费在线观看视频网站| 日韩av大片| 91美女片黄在线观看游戏| 成人看av片| 亚洲国产毛片完整版| 国产又大又黄又粗| 国产日产欧美一区二区三区| 久久久久久久久久久久久久久国产 | 欧美精品一区二区三区一线天视频| 国产精品二区一区二区aⅴ| 91麻豆.com| 日韩大片一区二区| 午夜精品999| 久久久久久久久久久一区 | 黄色av电影在线观看| 日韩一区二区影院| 九九热在线视频播放| 欧美激情综合五月色丁香小说| 亚洲天堂av一区二区| 樱桃成人精品视频在线播放| 久久久综合亚洲91久久98| 欧洲亚洲精品| 国模吧一区二区三区| 成人在线免费公开观看视频| 欧美一区二区不卡视频| 国产精品老女人| 中文字幕亚洲在| 亚洲天堂资源在线| 美国毛片一区二区| 欧美成人三级在线视频| 成人3d精品动漫精品一二三| 国产精品久久久久免费| 日本高清不卡一区二区三区视频| 操人视频在线观看欧美| 青青草视频在线观看| 欧美一区二视频| 丰满少妇xoxoxo视频| 亚洲日本在线观看| 可以直接看的无码av| 国产精品77777| 亚欧激情乱码久久久久久久久| 亚洲图片在线| 亚洲视频小说| 中国av一区| 国产精品国产精品国产专区蜜臀ah| 国产成人免费9x9x人网站视频 | 亚洲福利在线视频| 91女人18毛片水多国产| 欧美性猛交99久久久久99按摩| 在线免费看av网站| 欧美国产日韩在线观看| 成人午夜精品无码区| 韩国一区二区视频| 人人爽人人av| 国产精品免费看| www.国产在线播放| 亚洲深深色噜噜狠狠爱网站| 日韩精品欧美专区| 亚洲欧美日本伦理| 国产免费一区二区| 试看120秒一区二区三区| 国产玖玖精品视频| 欧美性片在线观看| 日本人成精品视频在线| freexxx性亚洲精品| 欧美精品在线网站| 黄色动漫在线观看| 久久精品国产欧美激情| 午夜免费福利在线观看| 国产亚洲日本欧美韩国| 精品99又大又爽又硬少妇毛片| 亚洲成人在线网| 高清一区二区三区四区| 日韩免费电影网站| 精品人妻无码一区二区色欲产成人 | 日本一区二区综合亚洲| 成人午夜剧场视频网站| 久久综合久久鬼色中文字| 国产精品麻豆入口| 不卡免费追剧大全电视剧网站| 涩视频在线观看| 成人毛片视频在线观看| 日韩aaaaa| 91欧美一区二区| 欧美亚一区二区三区| 久久众筹精品私拍模特| 日本黄色网址大全| 久久久综合网站| 2019男人天堂| 中文字幕在线观看不卡视频| 在线观看黄网址| 亚洲精品国产第一综合99久久| 黄色一级片中国| 亚洲高清三级视频| 影音先锋亚洲天堂| 日本精品一区二区三区高清 | 日韩女优av电影| 亚洲爱情岛论坛永久| 精品久久一二三区| 亚洲 国产 欧美 日韩| 亚洲精品一区二区在线| 国产区高清在线| 久久久91精品国产| 日本小视频在线免费观看| 欧美极品少妇xxxxⅹ免费视频| 美女在线视频免费| 国产精品日韩欧美大师| 成人噜噜噜噜| 国产日产精品一区二区三区四区| 天天久久夜夜| 一区二区三区四区五区视频| 亚洲一级淫片| 免费看的黄色大片| 毛片av中文字幕一区二区| 国产黑丝在线视频| 久久亚洲免费视频| 中文字幕美女视频| 亚洲成人第一页| 欧美在线视频精品| 日韩视频免费观看高清在线视频| 三级毛片在线免费看| 色妞一区二区三区| xxx.xxx欧美| 国产精品久久激情| 哺乳一区二区三区中文视频| 日韩欧美三级电影| 好看的av在线不卡观看| 免费观看成人在线视频| 国产成人午夜精品影院观看视频 | 国产精品一区二区无码对白| 国产亚洲短视频| 青青草手机在线视频| 日韩欧美极品在线观看| 99久久婷婷国产一区二区三区| 亚洲精品国精品久久99热| 欧美日本一道| 欧美在线视频网| 亚洲高清999| 日韩亚洲不卡在线| 亚洲日韩成人| 亚洲综合123| 亚洲国产精品v| 日本天堂网在线| 欧美成人免费网站| 91xxx在线观看| 欧美在线中文字幕| 亚洲超碰在线观看| 亚洲国产成人不卡| 亚洲少妇一区| 国产大学生视频| 亚洲免费av网站| 亚洲视频在线观看免费视频| 日韩大陆欧美高清视频区| 日韩精品卡一| 成人免费视频网| 成人久久综合| 国内外免费激情视频| 99精品一区二区| 五月天婷婷网站| 欧美成人a视频| 黄色精品免费看| 成人免费淫片视频软件| 日韩精品2区| 国产熟人av一二三区| www.av精品| 国产精品111| 亚洲精品一区二区三区香蕉| 乱人伦中文视频在线| 国产精品女视频| 欧美日韩水蜜桃| 日本激情视频在线| 久久久久久久综合色一本| 国产精品一区二区6| 精品国产一区二区三区四区四 | 波多野结衣三级视频| 亚洲乱码国产乱码精品精可以看| 在线观看免费高清视频| 中国china体内裑精亚洲片| 日韩高清不卡| 午夜一区二区三视频在线观看| 日韩精品一卡二卡三卡四卡无卡| 91l九色lporny| 欧美日韩一二三| 看黄网站在线观看| 成人在线视频福利| 欧美福利视频| 动漫美女无遮挡免费| 午夜日韩在线观看| 视频一区二区在线播放| 日本久久久久久| 成人激情免费视频| av中文字幕网址| 亚洲另类在线制服丝袜| 亚洲精品国产一区二| 久久全国免费视频| 亚欧洲精品视频在线观看| 亚洲综合在线网站| 国产精品免费视频网站| 91在线公开视频| 色综合久久88| 五月综合久久| 美女黄色片视频| 亚洲精品日韩一| 日韩一级片免费| 国产成人精品国内自产拍免费看 | 试看120秒一区二区三区| 99在线免费视频观看| 久久一区二区三区国产精品| 成人黄色激情视频| 久久综合伊人77777尤物| 红杏aⅴ成人免费视频| 成年人黄色片视频| 自拍偷在线精品自拍偷无码专区| 亚洲AV无码成人片在线观看 | 男人天堂手机在线视频| 久久亚洲一区二区三区四区| 一级黄色免费看| 九九精品在线观看| 亚州综合一区| 亚洲a级黄色片| 偷拍日韩校园综合在线| av影片在线看| 国产亚洲第一区| 蜜臀av一区二区三区| 国产无套内射又大又猛又粗又爽| 国产一区二区三区在线观看视频| 免费看日产一区二区三区| 免费日韩视频在线观看| 亚洲免费伊人电影| 黄色av网址在线免费观看| 3d动漫精品啪啪一区二区三区免费| 国产欧美一区二区色老头| 欧美爱爱免费视频| 亚洲视频综合网| 成人福利一区| 久久久久xxxx|