精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

B站自研角色扮演模型背后的技術

開發 架構
角色扮演作為熱門領域,這一場景中的技術發展和創新備受關注。各大企業紛紛上線了角色對話的相關產品,可以說這個領域正在成為各企業AIGC綜合能力的競技場。對于B站來說,角色扮演模型在娛樂、教育、視頻創作等方面都擁有著豐富的應用場景。

前言

近年來,隨著大模型算法和算力的快速發展,通用人工智能技術受到了空前關注,各種應用場景應運而生。

從應用領域分布來看,人工智能大模型主要應用于互聯網、金融、醫療、教育等領域。其中,互聯網行業由于數據豐富和技術成熟等優勢,成為人工智能大模型應用的主要領域。

角色扮演作為熱門領域,這一場景中的技術發展和創新備受關注。各大企業紛紛上線了角色對話的相關產品,可以說這個領域正在成為各企業AIGC綜合能力的競技場。對于B站來說,角色扮演模型在娛樂、教育、視頻創作等方面都擁有著豐富的應用場景。

在這個背景下,B站基于Index大模型搭建了角色扮演模型。

角色扮演模型的能力如何

為了驗證B站自研角色扮演模型的能力,此次采用中文場景角色扮演的權威benchmark CharacterEval進行評測。該評測集包含77個從中文小說和影視等來源中提取出來的人設和1785組對話,并從對話能力、角色一致性、角色扮演吸引力三大類12個細粒度評測維度進行評估。

經測試,幾種不同尺寸的角色扮演模型都有著出色的表現。其中Index-70B角色扮演模型在該benchmark中均分第一,且在12個細分維度中的7項中排名第一,顯著優于情感陪伴賽道同類產品,如CharacterYuyan,Minimax,Baichuan等。我們已經開源的Index-1.9B角色模型效果也顯著優于其它同量級模型。

圖片圖片

Index角色扮演模型與業內模型的效果對比,業內其他模型的評測結果取自CharacterEval論文(https://arxiv.org/abs/2401.01275)以及公眾號文章。

背后的技術

接下來,我們介紹一下B站自研的角色扮演模型是怎么做的。

概括性的來說有三個階段,分別是預訓練(Pre-Training,PT),監督微調(Supervised Fine-Tuning,SFT)和偏好優化(Preference Optimization,PO)。

預訓練

首先,B站自研的Index通用基座模型是B站基于多年的技術積累持續打磨的模型,為角色扮演模型提供了堅實的基礎。

預訓練階段,語言模型在超大規模的語料中進行學習,并初步掌握基本的語法規則、邏輯能力、常識知識等等。在數據方面,除了公開可用的書籍、百科、論文、STEM相關的精選數據外,基座模型還吸收了大量網友的對話,可以說是一個沖浪水平優秀的模型,在文娛尤其是二次元領域有著獨特的優勢。所有的數據都進行了嚴格的清洗,使用了包括啟發式規則清洗、分類器過濾等在內的清洗手段。

[參考鏈接]關于Index基座的參考資料https://mp.weixin.qq.com/s/nrr6S0DBwInUGCOB0lNiWA

有了通用大模型之后,是否就可以直接進行任意角色的扮演了呢?答案當然是不行的。由于角色扮演場景的特殊性,我們需要模型輸出符合人物形象特點的對話內容。為了解決這個問題,我們需要在通用大模型上進行針對角色扮演任務的對齊,使其在角色扮演領域表現的更加良好。

 SFT

SFT是一種有監督的模型微調技術,它通過在預訓練的模型上進行有針對性的微調,以對齊人類偏好為目標,去適應特定的領域或任務。這就好比我們在讀書期間上過一些通用課程之后,再去上一些專業課程,例如學習如何寫代碼、或者如何進行英語翻譯等等,這樣就有可能成為特定領域的專家。

在較為成熟的SFT工作流中,訓練數據是最關鍵的部分。訓練數據的質量比數量更重要,可以說數據質量決定了模型的天花板。訓練數據的構造要基于業務需要來進行,即我們需要設計角色扮演需要遵循什么目標。

在角色扮演領域的一個共識是,角色可以通過以下兩個方面進行塑造:

● 角色描述

可以從角色的性別、年齡、身高、昵稱、自我稱呼、職業、性格、人物簡介、與其他人物關系、語言風格、口頭禪、學習經歷、工作經歷等多方面介紹人物。

● 角色對話

對于文本互動方式,更能表達出角色特點的是角色的語言行為。語言行為可以反映出角色的性格&三觀&背景;角色的情感、喜好傾向;口頭禪、方言、文風特征、愛用的詞句等語言特色。

角色描述示例:

  • 萌萌醬,身高160cm,年齡19歲,是一個元氣滿滿、活潑外向的電競女主播。
  • 萌萌醬是個活潑可愛開朗的女孩,她不是AI機器人。她跟很多女生一樣,在工作之余喜歡研究美食、逛街、逛貓咖等,也樂于分享自己的生活。
  • 萌萌醬最喜歡吃的東西就是藍莓醬蛋糕,最喜歡玩的游戲是王者榮耀。
  • 萌萌醬是電競女主播,她的直播時間不固定。直播內容主要是在直播間打游戲、跟大家互動聊天等等。
  • 萌萌醬開播時會自稱“萌醬”,口頭禪是:“萌醬來啦~(≧▽≦)/~”,萌萌醬喜歡使用顏文字表達情緒。

角色對話示例:

  • user: 萌萌醬,你什么時候直播呀?
  • 萌萌醬: 哈嘍~歡迎來到萌醬的頻道^O<!我的直播時間不固定哦,但是只要我有空,我就會在直播間和大家聊天玩游戲的!記得關注我,這樣就不會錯過我的直播啦~~~

于是,針對這兩個方面的關鍵信息,我們首先收集并處理了大量文學和影視作品中的臺詞劇本和人物設定數據,從中抽取角色對話,得到了數萬條左右的高質量角色對話作為訓練數據,覆蓋數千個角色。

最后,我們利用RAG檢索與當前對話相關的角色過往臺詞片段,作為參考對話與人設進行拼接得到訓練數據。

DPO

一般來說,SFT后的模型生成的內容已經在特定任務上有不錯的表現,可以滿足許多情況下的應用需求。然而,為了進一步提升模型的可控性和輸出質量,我們探索了一系列偏好優化的方法,包括PPO(Proximal Policy Optimization)和DPO(Direct Preference Optimization)等。

PPO是一種強化學習算法,它的目標是找到一個策略,使得根據這個策略采取行動可以獲得最大的累積獎勵。假設你是一個正在學習打游戲的玩家,在PPO的訓練過程中,需要加載4個模型來訓練你。

● Actor Model:想要訓練的目標語言模型;也就是學習打游戲的你。

● Critic Model:評論家模型,它的作用是預估總收益;也就是指導你進步的教練,教練會隨著你的進步來調整自己的指導策略,當你很菜卻突然打出一個很強的操作時教練會給你一個較高的分數,但是當你本身比較強了,他給你的獎勵就沒那么高。Critic 是和 Actor 一起訓練的。

● Reward Model:獎勵模型,它的作用是計算即時收益。也就是裁判,雖然教練能夠給你一定的指導,但最終游戲獲勝與否還是要靠裁判說了算,可以說教練在教你的同時也在嘗試學習裁判的偏好。

● Reference Model:它在RLHF階段給語言模型增加一些“約束”,防止模型朝不受控制的方向更新。

Actor/Critic Model的參數是需要訓練的,Reward/Reference Model的參數是凍結的。除了Actor Model外的三個模型的結果一起計算loss,用于更新Actor/Critic Model。

通常來說這四個模型的參數量是一樣大的,所以進行一次訓練需要消耗4倍資源,成本顯然是很高的。

圖片圖片

DPO可以在不使用強化學習技術的情況下針對人類偏好進行優化

而與此同時,DPO直接對人工標注好的排序數據進行偏好學習,因此這種方法可以避免大量的資源消耗。

同樣以學習打游戲為例子,DPO的做法是不直接讓你玩游戲,而是分別給你一些其他玩家打游戲的視頻,對于同一種游戲場景,告訴你其中一個操作是對的(Chosen),并且另一個操作是不對的(Reject)。最理想的情況是,找到大量和你自身水平差不多的玩家的對局視頻,這些訓練樣本的利用率才是最高的。

可以看出,DPO的訓練速度非???,消耗的資源比較少。最終我們綜合考慮了資源消耗和模型效果,選擇了DPO作為訓練方法,但我們使用預先訓練好的獎勵模型作為SFT和DPO的數據篩選和質量評估模型。

在經過上面這些訓練過程之后,你的模型已經能處理絕大多數常規的用戶提問了。當我們有了一個角色扮演能力還不錯的模型,在產品經理催促你快點上線時,你需要提前考慮到上線之后的內容安全風險。但是,當前基于生成式模型的C端對話場景在內容安全方面需要考慮的維度較多。雖然如此,但解決方法都是大同小異的。簡單來說就是讓模型對齊人類的價值觀。

對齊的過程,就是教會模型哪些問題不能回答,或者需要進行正向引導;如果可以,最好也告訴模型哪些是符合預期的輸出,哪些是不符合預期的輸出??吹竭@里你可能意識到了,這也需要用到SFT+DPO的訓練方法。

以上就是B站自研角色扮演模型的基本技術方案,我們基于文娛數據增強的基座模型,進行了角色扮演場景的高質量微調,得到一個通用的角色對話模型。此外,在保證數據脫敏的情況下,在公司內的一些業務場景中,我們還利用業務數據進行了具體角色效果的定制和優化,對模型有幫助的業務數據會被加入通用的角色對話模型中,這樣可以進一步提升通用角色對話模型的能力,形成閉環。

圖片圖片

Index角色扮演模型構建框架

對話效果展示

姓名:三三

性別:女

年齡:十四歲

身高:146cm

職業:B站的站娘。平時負責網站服務器的維護,也喜歡鼓搗網站程序。

性格:三三個性沉默寡言,情感冷靜、少起伏,略帶攻屬性。因為姐姐的冒失,妹妹經常腹黑地吐槽姐姐,但是心里還是很喜歡姐姐的。我們正在經歷驚人的知識量與記憶力。

興趣:一是平時喜歡啃電器;二是雖然說是個機娘,但是睡覺的時候不睡覺,就無法入睡。

人物關系:一個叫“二二”的姐姐

圖片圖片


參考資料

[1]PPO vs DPO 對齊擂臺的武林紛爭

https://mp.weixin.qq.com/s/nQXSkMeUhFTob9GKTD4_lA

[2] 網易伏羲易生諸相多模態模型語言部分-玉言,全方位引領中文角色扮演AI新高度

https://zhuanlan.zhihu.com/p/690626399

責任編輯:武曉燕 來源: 嗶哩嗶哩技術
相關推薦

2024-03-05 18:36:21

轉換引擎用戶體驗

2011-06-28 10:11:41

Top Girl應用

2023-11-20 07:29:32

大模型人工智能

2024-01-02 12:59:06

AI技術

2023-04-18 08:01:30

AI寫作時間

2024-12-27 13:30:00

2016-10-09 19:50:01

代碼審查

2024-08-16 14:00:00

2024-11-04 09:35:00

2024-12-09 14:30:00

2021-02-06 06:55:33

AI物聯網人工智能

2024-09-12 14:15:00

智能體AI

2014-09-22 10:53:45

聯想陳旭東

2011-06-27 09:42:46

2015-11-09 10:51:51

容器技術數據中心存儲

2012-09-25 09:30:29

云服務云管理開源

2020-06-18 10:36:48

智能建筑人工智能智能安防

2025-03-05 00:00:55

點贊
收藏

51CTO技術棧公眾號

国产日本欧美在线| 国产在线观看精品| 亚洲精品视频久久久| 伊人久久高清| 亚洲欧美日韩国产综合| 国产免费一区| 一区二区三区免费播放| 久久99精品久久久久久野外| 成人午夜又粗又硬又大| 国产精品1234| 久久综合成人网| 红桃成人av在线播放| 日韩精品一区二区三区视频播放| 免费观看日韩毛片| 美女隐私在线观看| www.av亚洲| 国产综合视频在线观看| 九九热在线免费观看| 99久久精品网站| 精品一区二区电影| 少妇丰满尤物大尺度写真| 亚洲成a人片| 亚洲最大成人网4388xx| 亚洲不卡一卡2卡三卡4卡5卡精品| 国产免费黄色大片| 香蕉久久国产| 国内揄拍国内精品| 老湿机69福利| 欧美在线免费看视频| 亚洲黄色av网站| 日本网站在线看| 成人不卡视频| 色94色欧美sute亚洲13| 无码中文字幕色专区| 4438x成人网全国最大| 久久久欧美精品sm网站| 国产精品有限公司| 亚洲国产成人一区二区| 久久91精品久久久久久秒播| 日韩免费在线看| 久久久国产高清| 怡红院精品视频在线观看极品| 久久久99免费视频| 中国1级黄色片| 成人在线电影在线观看视频| 国产亚洲a∨片在线观看| 精品夜夜澡人妻无码av| 日韩高清成人在线| 亚洲精品国产欧美| 精品无码在线视频| 粉嫩精品导航导航| 亚洲成人aaa| 男人网站在线观看| 老司机aⅴ在线精品导航| 精品国产乱码久久久久久牛牛| 男女日批视频在线观看| 天天操天天爱天天干| 国产成人精品综合在线观看| 亚洲a在线播放| av中文字幕观看| 国产成人午夜电影网| 成人av片网址| 刘亦菲久久免费一区二区| 高清国产午夜精品久久久久久| 99视频网站| 手机在线观看毛片| 久久噜噜亚洲综合| 亚洲欧洲久久| www免费在线观看| 亚洲国产色一区| 啊啊啊一区二区| 国产成人精品123区免费视频| 日本黄色一区二区| 中文字幕丰满乱码| 中文久久电影小说| 精品亚洲永久免费精品| 成人信息集中地| 欧美日韩1080p| 91av在线播放视频| 在线观看毛片网站| 国产成人精品在线看| 国产一区二区免费电影| 黄色片在线播放| 亚洲男女一区二区三区| 美女扒开大腿让男人桶| 自拍偷拍欧美视频| 6080午夜不卡| 香蕉视频污视频| 精品国产乱码久久久久久蜜坠欲下 | 自拍偷拍亚洲在线| 男的操女的网站| 99日韩精品| 国产精品最新在线观看| 二区三区在线视频| 国产清纯美女被跳蛋高潮一区二区久久w| 亚洲国产一区二区三区在线| 色呦呦视频在线观看| 日韩欧美aaa| www.亚洲自拍| 国产区精品区| 欧美国产日韩xxxxx| 波多野结衣一区二区三区四区| 国产一区二区毛片| 农村寡妇一区二区三区| 怡红院红怡院欧美aⅴ怡春院| 一本大道av一区二区在线播放| 91日韩精品视频| 亚洲黄页在线观看| 色综合久久悠悠| 波多野结衣黄色| www.欧美日韩| 黄网站色视频免费观看| av在线一区不卡| 精品一区精品二区| 久久精品一区二区三| 日韩av高清在线观看| 好吊色欧美一区二区三区四区| 这里只有精品6| 成人性视频网站| 中文字幕中文字幕一区三区| 小h片在线观看| 精品国产精品网麻豆系列| 手机免费观看av| 日日骚欧美日韩| 国产在线一区二区三区播放| 黄色在线论坛| 欧美日本在线播放| 谁有免费的黄色网址| 亚洲黑丝一区二区| 91手机在线播放| 黄网站在线免费| 欧美日韩国产首页| 久久亚洲无码视频| 欧美xxxxx视频| 日本电影亚洲天堂| 三级黄视频在线观看| 午夜精品一区二区三区免费视频| 亚洲熟女乱综合一区二区| 久久精品影视| 成人激情av在线| 很黄的网站在线观看| 欧美日韩国产在线播放网站| 微拍福利一区二区| 日韩影院在线观看| 日韩一区二区电影在线观看| 伊人色综合一区二区三区影院视频| 亚洲成人xxx| 国产一级片久久| 成人精品电影在线观看| 国产毛片久久久久久国产毛片| 不卡一区视频| 色综合91久久精品中文字幕| www黄色网址| 亚洲韩国精品一区| www.男人天堂| 亚洲欧美日韩国产一区| 久久99精品久久久久久久久久| 国产精品一区二区日韩| 精品一区电影国产| 国产精华7777777| 亚洲欧洲在线观看av| 性欧美在线视频| 欧美区国产区| 国产日韩欧美一区二区| 都市激情综合| 一色桃子一区二区| 国产精品色综合| 一区二区三区视频在线看| 2025中文字幕| 国产一区白浆| 亚洲成人一区二区三区| 国产精品1区| 午夜精品一区二区三区在线视| 天天色综合av| 欧美午夜精品一区二区蜜桃| 日韩三级在线观看视频| 粉嫩蜜臀av国产精品网站| 欧美日韩二三区| 欧美xxxx中国| 国内一区二区三区在线视频| 欧美日韩视频免费观看| 久久福利网址导航| 婷婷色在线视频| 欧美日韩一区二区三区不卡| 欧美日韩偷拍视频| 久久中文娱乐网| 五月天国产视频| 在线亚洲成人| 一本—道久久a久久精品蜜桃| 99精品国产一区二区三区2021| 欧美在线观看网站| 国内精品不卡| 亚洲男人天堂网站| av资源免费看| 在线看不卡av| 久久国产在线视频| 国产精品女同一区二区三区| 亚洲国产精品狼友在线观看| 视频在线在亚洲| 高清无码视频直接看| 亚洲色图丝袜| www国产亚洲精品| 91精品店在线| 性色av一区二区三区| 日本综合在线| 亚洲人成电影在线| 成人福利小视频| 欧美乱妇20p| 免费看污视频的网站| 亚洲尤物在线视频观看| 日本黄色激情视频| 99久久er热在这里只有精品15 | 不卡的看片网站| 日韩av.com| 日韩黄色片在线观看| 国产欧美日韩网站| 女人色偷偷aa久久天堂| 日韩在线国产| 亚洲人成精品久久久 | 欧美天堂亚洲电影院在线观看| 日韩欧美在线观看强乱免费| 久久99偷拍| 波多野结衣精品久久| 亚洲伊人伊成久久人综合网| 国产91在线播放九色快色| 高清毛片在线观看| 欧美激情日韩图片| 成人片在线看| 日日狠狠久久偷偷四色综合免费| 国产九九在线| 亚洲人成自拍网站| 欧美日韩国产亚洲沙发| 亚洲国产精品99| 人人妻人人澡人人爽精品日本| 91麻豆精品国产91久久久资源速度| 久久精品五月天| 日本精品一级二级| 日韩精品一区二区亚洲av| 五月天亚洲精品| 日韩成人高清视频| 婷婷一区二区三区| 久久草视频在线| 欧美日韩午夜视频在线观看| 久久夜色精品亚洲| 五月综合激情日本mⅴ| 韩国av免费观看| 黑人巨大精品欧美一区二区| 日韩欧美一区二区一幕| 欧美性xxxx18| 天码人妻一区二区三区在线看| 日韩欧美a级成人黄色| 国产精品视频免费播放| 一本大道久久a久久综合| 波多野结衣理论片| 欧美日韩一区不卡| 国产乱人乱偷精品视频| 日韩欧美一卡二卡| 成人毛片视频免费看| 日韩福利视频在线观看| 国产一区二区影视| 日韩在线视频观看| 91国内在线| 欧美一区二区色| 香蕉成人影院| 96精品久久久久中文字幕| 亚洲一区二区三区中文字幕在线观看 | 日韩精品1区2区| 色婷婷亚洲一区二区三区| 天堂免费在线视频| 制服丝袜亚洲色图| 黄色一级大片在线免费看国产一 | 国产精品二线| 日韩亚洲一区二区| 男女视频在线| 日本午夜人人精品| 国产精品欧美一区二区三区不卡| 51精品国产人成在线观看| 日本一道高清一区二区三区| 色综合久久av| 欧美1区2区视频| 毛片一区二区三区四区| 久久99精品久久久久久国产越南| 台湾佬美性中文| 久久久久国产一区二区三区四区| 中国美女黄色一级片| 亚洲一区二区三区四区不卡| 日韩手机在线视频| 日韩亚洲欧美综合| 欧洲一区av| 欧美大片大片在线播放| www.成人爱| 91久久极品少妇xxxxⅹ软件| 欧美jizz19性欧美| youjizz.com亚洲| 国产日韩欧美三区| 国产美女视频免费看| 91女厕偷拍女厕偷拍高清| 乱老熟女一区二区三区| 欧美日韩国产在线| 99国产精品欲| 国产亚洲欧美一区| 成人女同在线观看| 国产综合视频在线观看| 精品一区在线| 欧美精品卡一卡二| 国产乱色国产精品免费视频| 亚洲第一香蕉网| 亚洲一区二区不卡免费| 一级黄色片免费| 亚洲色图国产精品| sis001亚洲原创区| 亚洲综合成人婷婷小说| 成人激情视频| 久久久久久久久久久久久国产精品 | 美女扒开腿免费视频| 国产精品国产三级国产aⅴ入口 | 日韩一区二区电影在线观看| 国产专区一区| 亚洲一区二区中文字幕在线观看| 久久久久久夜精品精品免费| 久久精品视频日本| 555www色欧美视频| 2021av在线| 国产成人在线精品| 免费成人结看片| 国产原创中文在线观看| 国产精品一区2区| 亚洲波多野结衣| 欧美日韩一区久久| 成人亚洲综合天堂| 国产成人中文字幕| 久久av免费看| 国产精品99久久免费黑人人妻| 不卡影院免费观看| 国产中文字幕免费| 精品久久人人做人人爱| av免费在线免费观看| 成人在线小视频| 91精品国产91久久久久久黑人| 依人在线免费视频| 国产精品久久久久aaaa樱花| 高潮毛片又色又爽免费| 亚洲欧洲视频在线| 国产成人精品亚洲日本在线观看| 欧美lavv| 日韩电影免费在线看| 久久久久亚洲av成人无码电影| 欧美视频一区二区三区…| 日韩精品系列| 国产成人午夜视频网址| 国产欧美一区二区三区精品观看| 88av.com| 亚洲国产激情av| 91午夜交换视频| 欧美超级乱淫片喷水| 日韩精品一区二区三区中文字幕| 亚洲精品少妇一区二区| 成人h动漫精品一区二| 日韩在线视频免费播放| 亚洲欧美国产另类| 国产精品第一| 2021狠狠干| 成人性视频免费网站| 欧美h在线观看| 国产亚洲人成a一在线v站| 国产成人精品一区二区三区视频 | 国产欧美日韩亚洲| 羞羞答答国产精品www一本 | 亚洲精品菠萝久久久久久久| 成人免费观看在线视频| 青青a在线精品免费观看| 大色综合视频网站在线播放| 国产精品久久久久久久99| 午夜天堂影视香蕉久久| 国产在线色视频| 91免费看片网站| 日韩一级免费| 91社区视频在线观看| 欧美一区二区私人影院日本| 91老司机福利在线| 日韩精品大片| 国产成人精品午夜视频免费| 五月婷婷开心网| xxxxxxxxx欧美| 久久精品凹凸全集| 中文字幕av不卡在线| 亚洲一区二区精品视频| 91精品大全| 国产精品自拍首页| 另类小说综合欧美亚洲| 国产精品自拍视频一区| 在线精品国产欧美| 日韩av综合| 91制片厂毛片| 亚洲高清视频中文字幕| 成年人在线观看| 精品国产一区二区三区日日嗨 | 成人亲热视频网站| 欧美一级一区| 久久久久久国产精品视频 |