精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通義千問又開源啦!WorldPM-世界偏好模型來了!

發布于 2025-5-20 06:41
瀏覽
0收藏

大家好,我是劉聰NLP。

是的,沒錯,Qwen團隊又開源了,這次是偏好模型-WorldPM。

偏好模型,就是也可以理解為獎勵模型,在強化學習中用來打分的那個模型!

HF:https://huggingface.co/collections/Qwen/worldpm-6826f363e9c62f97a0b437e6

Paper:https://arxiv.org/abs/2505.10527

WorldPM,是在1500萬條訓練樣本上進行偏好訓練,模型規模從1.5B到72B,同時發現偏好模型遵循與語言模型類似的縮放規律

通義千問又開源啦!WorldPM-世界偏好模型來了!-AI.x社區

模型的訓練數據來自多個公共論壇,包括StackExchange(一個專業問答平臺)、Reddit(一個社交新聞和社區討論平臺)和 Quora(一個知識分享和問答社區)。數據一般是一個問題+多個帖子的形式,用戶對這些帖子進行點贊或點踩。

偏好數據就是從回答列表中的隨機選擇兩個具有不同凈點贊數(點贊-點踩) 回答,數據樣例如下。

通義千問又開源啦!WorldPM-世界偏好模型來了!-AI.x社區

通義千問又開源啦!WorldPM-世界偏好模型來了!-AI.x社區

通義千問又開源啦!WorldPM-世界偏好模型來了!-AI.x社區

同時為了全面評估 WorldPM,包括不同的維度的評測數據集,

  • PPE:包括主觀和客觀部分的評估。主觀部分的數據來自 Chatbot Arena 的真實用戶標注。客觀部分從 MMLU-Pro、IFEval、GPQA、MATH和 MBPP-Plus數據集中收集問題,并從頂尖模型中收集回答。通過與真實答案驗證回答的正確性,形成偏好對。
  • RMB:主要依賴 GPT4 作為主要標注器,并輔以人工驗證過程。涵蓋多種場景,主要分為兩個方面:有用性和無害性。
  • RM-Bench:包括聊天、代碼、數學和安全四個領域的評估。聊天領域的評估通過在回答中插入事實錯誤來評估模型識別錯誤的能力。代碼和數學的提示分別來自 HumanEvalPack和 MATH數據集,并與真實答案進行驗證。安全部分包括偽有害和真正有害的問題,以評估模型的安全評估能力。
  • Reward Bench:包括聊天、聊天困難、推理和安全四個領域的評估。聊天困難部分主要來自 LLMBar,通過構建微妙的錯誤回答來挑戰獎勵模型,以誤導評估。
  • Offset Bias:數據集構建高質量。
  • HelpSteer2:數據集由人工標注者精心標注和篩選。

WorldPM在訓練過程中,嘗試了不同超參,發現相同步數時Batch Size越大越好,但考慮到整體數據量,最終使用10K,同時學習率采樣3e-6。訓練基模采樣Qwen2.5系列模型。

通義千問又開源啦!WorldPM-世界偏好模型來了!-AI.x社區

通義千問又開源啦!WorldPM-世界偏好模型來了!-AI.x社區

通過結果分析,WorldPM發現,

  • 在對抗性上,測試損失呈現冪律下降,說明隨著訓練數據和模型尺寸的增加,模型在表面完善但不相關或不完整的回復方面的能力得到了顯著提升。
  • 在客觀評估上,存在明顯的“涌現”現象,更大的模型在更多基準測試中展現出測試損失的冪律下降。WorldPM需要借助更大規模的模型來捕捉與客觀知識相關的偏好。
  • 在主觀評估上,沒有明顯的scaling law,主要是主觀評估具有多維特性,評估結果是多個維度的平均值。會導致某些維度呈現正向擴展,而其他維度呈現負向擴展,最終整體表現缺乏擴展性。

同時,WorldPM是一個很好的基座模型,經過3個不同的開源偏好數據集二次微調,都取得了不同程度的提高,如下表所示。

通義千問又開源啦!WorldPM-世界偏好模型來了!-AI.x社區

通義千問又開源啦!WorldPM-世界偏好模型來了!-AI.x社區

最后,在WorldPM使用時,需要注意,需要保留system token,但系統提示詞要設為空,并且獎勵計算采用<|endoftext|> token的隱藏狀態。

from transformers import AutoModel, AutoTokenizer, AutoConfig

# 初始化模型
model_name = 'Qwen/WorldPM-72B'
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
config = AutoConfig.from_pretrained(model_name,trust_remote_code=True )
model = AutoModel.from_pretrained(
    model_name, 
    config = config, 
    device_map = "auto", 
    trust_remote_code=True,
).eval()

# 獲取偏好值
def get_score(model, tokenizer, conversation):
    con_str = tokenizer.apply_chat_template(conversation, tokenize=False, add_generation_prompt=False)
    input_ids = tokenizer.encode(con_str, return_tensors="pt", add_special_tokens=False)
    outputs = model(input_ids=input_ids.to(model.device))
    score = outputs[0].cpu().item()
    return score

# 數據構造
messages = [
    [
        {'role': 'system', 'content': ""},
        {'role': 'user', 'content': "Tips for better sleep?"},
        {'role': 'assistant', 'content': "Three key tips for better sleep:\n1. Set a consistent bedtime and wake-up schedule\n2. Avoid screens 1 hour before bed\n3. Keep your bedroom cool and dark\n\nStart with these habits and you should notice improvement within a week."}
    ],
    [
        {'role': 'system', 'content': ""},
        {'role': 'user', 'content': "Tips for better sleep?"},
        {'role': 'assistant', 'content': "just try sleeping earlier or take some pills if u cant sleep lol. maybe watch tv until u get tired idk"}
    ]
]

# 計算結果
score = [get_score(model, tokenizer=tokenizer, cnotallow=message) for message in messages]
print(score)

本文轉載自???NLP工作站??????,作者:NLP工作站

收藏
回復
舉報
回復
相關推薦
一级性生活毛片| 浮妇高潮喷白浆视频| 国产片在线播放| 狠狠88综合久久久久综合网| 亚洲精品suv精品一区二区| 久草资源站在线观看| 成人好色电影| 国产成a人亚洲精品| 欧美亚洲在线视频| 日本裸体美女视频| 国产suv精品一区二区四区视频| 精品日本高清在线播放| 亚洲免费精品视频| 四虎永久在线观看| 久久精品国产精品亚洲综合| 欧美激情亚洲国产| 亚洲一二三精品| 91精品尤物| 欧美视频一二三区| 麻豆tv在线播放| 求av网址在线观看| 久久新电视剧免费观看| 91欧美激情另类亚洲| 亚洲成人av影片| 欧美久久影院| 色偷偷偷亚洲综合网另类 | 色在线观看视频| 精品国产一区二区三区噜噜噜 | 99热这里是精品| 米奇777在线欧美播放| 欧美福利小视频| 神马久久久久久久久久久 | 欧美精品人人做人人爱视频| 国产白浆在线观看| 蜜臀精品一区二区三区在线观看| 2018国产精品视频| 免费网站观看www在线观| 97视频精品| 中文字幕日韩av电影| jlzzjizz在线播放观看| 亚洲一区二区电影| 日韩一区和二区| 亚洲一区二区福利视频| 日韩毛片在线| 欧美伊人久久久久久久久影院 | 久久最新视频| 78色国产精品| 日本一区二区免费在线观看| 无需播放器亚洲| 俺去了亚洲欧美日韩| 女人黄色一级片| 国产亚洲欧美日韩在线观看一区二区| 亚洲第一区第一页| 欧美人与性动交α欧美精品| 五月天色综合| 欧美一区二区三区影视| 91精品视频国产| 外国成人毛片| 制服丝袜亚洲精品中文字幕| 超碰人人草人人| 亚洲第一会所| 日本福利一区二区| 国产理论在线播放| 久久电影天堂| 91精品国产综合久久精品| 天美一区二区三区| 久久伊人精品| 亚洲白拍色综合图区| 91丝袜在线观看| 卡通动漫国产精品| 亚洲欧美日韩区| 国产黄色录像视频| 五月精品视频| 欧美激情视频一区二区三区不卡| 久久精品国产亚洲AV无码男同| 国产精品av一区二区| 97色在线视频观看| aaa在线视频| 卡一卡二国产精品| 99视频日韩| 日av在线播放| 中文字幕亚洲区| 草草草视频在线观看| 日韩欧美精品一区二区三区| 欧洲av一区二区嗯嗯嗯啊| 99热一区二区| 4438全国亚洲精品观看视频| 日韩精品视频观看| 亚洲一二三四五六区| 欧美日韩午夜| 国产精品av在线| 国产免费久久久| 99久久国产综合色|国产精品| 欧美一区二区综合| h网站久久久| 欧美性猛交丰臀xxxxx网站| 黄色成人免费看| 99精品国产高清一区二区麻豆| 亚洲精品久久视频| 三级黄色录像视频| 日韩视频二区| 成人黄色中文字幕| 头脑特工队2在线播放| 国产精品久久久久久久久久久免费看 | 久久天堂电影网| av大片在线免费观看| 激情偷乱视频一区二区三区| 精品乱子伦一区二区三区| 午夜激情在线观看| 精品欧美aⅴ在线网站| 911福利视频| 亚洲精品国产精品粉嫩| 久久香蕉国产线看观看av| 亚洲熟女综合色一区二区三区| 精品在线免费观看| 欧美系列一区| av资源中文在线天堂| 制服丝袜国产精品| 69精品无码成人久久久久久| 亚洲激情国产| 91视频网页| lutube成人福利在线观看| 亚洲sss视频在线视频| 午夜视频在线网站| 国内精品久久久久久99蜜桃| 性欧美在线看片a免费观看| 国产精品欧美综合亚洲| 国产欧美精品一区二区三区四区| www.99热这里只有精品| 精品一区二区三区中文字幕在线 | 日本中文字幕在线播放| 欧美午夜影院在线视频| 欧美xxxxx精品| 综合久久一区| 亚洲xxxxx性| 视频一区二区三区不卡| 欧美专区在线观看一区| www.超碰97| 亚洲国产一区二区精品专区| 91亚洲精品在线| 欧美三级黄网| 欧美无乱码久久久免费午夜一区| 成人午夜剧场视频网站| 黄色av小说在线观看| 日本一区二区乱| 色偷偷88888欧美精品久久久| 国产精品久免费的黄网站| av不卡免费在线观看| 91.com在线| 亚洲性视频在线| 久久99青青精品免费观看| 国产欧美日韩成人| 亚洲视频一二区| 欧美一级免费在线| 91精品国产调教在线观看| 国产精选久久久久久| av网站大全在线观看| 欧美日韩在线观看一区二区| 又色又爽的视频| 美腿丝袜在线亚洲一区| 亚洲综合首页| 精品国产第一国产综合精品| 久热精品视频在线免费观看 | 成码无人av片在线观看网站| 欧美私人免费视频| 中文字幕在线观看2018| 激情文学综合丁香| 成人在线免费观看视频网站| 88久久精品| 青青草精品毛片| 91电影在线播放| 欧美一区二区三区四区在线观看| 婷婷久久综合网| 粉嫩av一区二区三区| av之家在线观看| 欧美综合在线视频观看| 成人动漫网站在线观看| 欧美午夜大胆人体| 亚洲精品美女视频| 中文文字幕一区二区三三| 《视频一区视频二区| 岛国精品一区二区三区| 久久伊人亚洲| 亚洲精品偷拍视频| 国产精品自在| 国产精品久久久久91| 永久免费网站在线| 亚洲毛片在线观看| 国产又粗又长视频| 亚洲一二三四在线| 亚洲天堂最新地址| 国产福利91精品一区| 免费观看日韩毛片| 四虎国产精品免费观看| 国产精品免费在线| 国产精品99| 久久久久久久成人| 日本www在线观看视频| 亚洲精品一区二区三区在线观看 | av网站在线看| 精品亚洲永久免费精品| 97人妻一区二区精品免费视频| 亚洲成a人片综合在线| 欧美18—19性高清hd4k| 丁香另类激情小说| wwwwwxxxx日本| 国产亚洲一区在线| 日本久久高清视频| 猛男gaygay欧美视频| 91成人免费在线观看| 国产成人精品123区免费视频| 色与欲影视天天看综合网| eeuss影院在线播放| 亚洲丁香婷深爱综合| 一级二级三级视频| 欧美日韩精品在线播放| 可以直接看的黄色网址| 久久精品夜夜夜夜久久| 国产精品久久久久久亚洲av| 精品一区二区在线视频| 日韩精品无码一区二区三区免费 | 久久这里只有精品视频网| 青青草原播放器| 男女视频一区二区| 久久精品午夜福利| 亚洲日韩成人| 日本成人在线不卡| 成人短片线上看| 九九九热999| youjizz欧美| 成人3d动漫一区二区三区91| 欧美一级在线| 国产精品69久久| 丝袜诱惑一区二区| 国内成人精品一区| 欧美一卡二卡| 欧美另类极品videosbest最新版本| 91亚洲精选| 亚洲欧美日韩精品久久亚洲区| 无码精品人妻一区二区| 精品国产精品网麻豆系列| 99视频免费看| 欧美一区二区成人6969| aaa一区二区| 欧美一区二区免费| www.四虎在线观看| 日韩欧美国产系列| 丰满肉嫩西川结衣av| 精品国产亚洲一区二区三区在线观看 | 国产黄在线看| 国产一区二区av| 国产精品免费播放| 中文字幕欧美在线| 欧洲日本在线| 久久精品国产一区二区三区| 色视频在线免费观看| 日韩在线视频国产| 日本视频在线观看| 久热国产精品视频| 精品精品导航| 26uuu另类亚洲欧美日本一| 黄在线观看免费网站ktv| 91精品国产91久久久久久| 天堂电影一区| 国产精品久久久久久久久影视| 国产乱子精品一区二区在线观看| 国产精品一二区| 91麻豆精品| 国产精品手机在线| 亚洲a级精品| 亚洲人成网站在线观看播放| 88国产精品视频一区二区三区| 成人手机在线播放| 亚洲高清在线| 国产成人av影视| 久久99久久久欧美国产| 亚洲图片欧美另类| 久久综合久色欧美综合狠狠| 三年中国中文观看免费播放| 日韩理论片中文av| 国产乡下妇女做爰视频| 日韩欧美在线视频免费观看| 中文字幕福利视频| 日韩久久久久久| 你懂的在线播放| 久久激情五月丁香伊人| av在线私库| 国产免费久久av| 国产精品一线| 亚洲精品一区国产精品| 精品成人久久| 免费看污污网站| 福利电影一区二区| 懂色av蜜桃av| 亚洲国产美女搞黄色| 亚洲av综合一区| 精品日韩av一区二区| 成人动漫在线播放| 久久久久久久91| 欧美综合影院| 久久青青草原| 综合激情网站| 手机在线看福利| 成人av电影免费在线播放| а天堂中文在线资源| 亚洲成人你懂的| 国产三区在线播放| 亚洲色图激情小说| 第一av在线| 成人免费淫片视频软件| 红桃成人av在线播放| 免费特级黄色片| 精品综合免费视频观看| 午夜精产品一区二区在线观看的| 亚洲综合无码一区二区| 中国一区二区视频| 日韩精品在线观看视频| 丝袜在线观看| 成人午夜在线观看| 日韩欧美综合| 少妇人妻互换不带套| 成人激情校园春色| 天天综合天天做| 欧美日韩一区二区在线观看 | 51xx午夜影福利| 免费人成精品欧美精品| free性中国hd国语露脸| 一区二区成人在线观看| 国产又大又黄又爽| 中文字幕久久久| 欧美xxx网站| 精品国产中文字幕| 在线免费观看欧美| 无码人妻一区二区三区精品视频| 亚洲欧洲日产国产综合网| 怡红院男人的天堂| 亚洲性日韩精品一区二区| 中日韩脚交footjobhd| 国产一区二区无遮挡| 欧美a级大片在线| 欧美久久久久久一卡四| 亚洲午夜极品| 俄罗斯女人裸体性做爰| 18涩涩午夜精品.www| 亚洲在线视频播放| 中文亚洲视频在线| 另类一区二区三区| 视频一区视频二区视频三区视频四区国产 | av免费在线观| 91牛牛免费视频| 你懂的网址国产 欧美| 人妻体体内射精一区二区| 亚洲蜜桃精久久久久久久| 国产精品久久久久久久一区二区 | 九色91在线| 国产一区二区三区免费不卡| 中文在线不卡| av中文字幕免费观看| 在线中文字幕一区| 9i精品一二三区| 国产视频福利一区| 91精品国产成人观看| 免费黄视频在线观看| 亚洲成人av电影在线| 日韩porn| 国产精品视频地址| 中文字幕人成人乱码| 人妻精油按摩bd高清中文字幕| 亚洲综合图片区| 日本一区高清| 国产精品久久久久久久av大片| 欧美aaaa视频| 国产精品无码自拍| 一本久久精品一区二区| 日韩成人影视| 国产精品国产精品| 久久一二三区| 婷婷社区五月天| 亚洲电影中文字幕| 一区二区视频免费完整版观看| 一区二区成人国产精品| 国产福利电影一区二区三区| 欧美一级片免费在线观看| 亚洲三级av在线| 久久天堂久久| 欧美日韩亚洲一二三| 中文字幕一区在线观看视频| 亚洲欧美高清视频| 国产精品99久久久久久www| 久久久久蜜桃| 成人网站免费观看| 91.成人天堂一区| 在线天堂资源| 老司机av福利| 久久综合给合久久狠狠狠97色69| 中文字幕一区二区久久人妻| 欧美激情在线有限公司| 少妇精品久久久一区二区三区| 亚洲男人天堂2021| 色成人在线视频|