精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

告別復(fù)雜提示詞!螞蟻新方式讓AI自動理解你的個性化需求

人工智能 新聞
如何實現(xiàn)高情商AI?螞蟻通用人工智能研究中心自然語言處理實驗室提出了一個叫AlignXplore的方法。

相信大家都有這樣一個體驗。

跟AI無論什么對話,感覺都是說空話套話。

圖片圖片

有時候為了讓AI懂自己,許多用戶甚至不得不學(xué)習(xí)復(fù)雜的“提示詞技巧”,手動編寫長長的指令,像是在給AI做“崗前培訓(xùn)”。

圖片

那么如何實現(xiàn)高情商AI?螞蟻通用人工智能研究中心自然語言處理實驗室提出了一個叫AlignXplore的方法——

通過強(qiáng)化學(xué)習(xí),AlignXplore能夠通過深度思考從用戶行為中歸納出他/她的偏好,并且這種對人類偏好的洞察可以隨著用戶行為的變化而動態(tài)更新。

更有趣的是,當(dāng)把歸納好的偏好描述遷移到一個下游對齊模型時,能夠讓這個模型的個性化對齊能力得到顯著提升。

圖片

如何讓AI真正懂你?

如何讓AI真正“懂”你?我們需要讓AI從一個“規(guī)則執(zhí)行者”進(jìn)化成一個“模式發(fā)現(xiàn)者”。

這意味著,它要掌握一種被認(rèn)為是人類智慧核心的能力——歸納推理(Inductive Reasoning)。

圖片

△“千人一面”的對齊方式無法滿足用戶多樣的個性化需求,紅字藍(lán)字是對應(yīng)用戶的偏好描述

事實上,AI早已對演繹推理(Deductive Reasoning)駕輕就熟,具備令人驚嘆的數(shù)學(xué)解題和代碼編寫能力。

你給它一個確定的前提(如“求解二次方程 ax2+bx+c=0”)和一套不變的規(guī)則(求根公式),它就能通過一步步嚴(yán)密的邏輯推演,給出一個唯一、可驗證的正確答案。這是一個典型的“自上而下”(Top-Down)的過程:從普適的公理或規(guī)則出發(fā),推導(dǎo)出一個具體的、必然的結(jié)論。 在這個世界里,沒有模糊地帶,只有對與錯。

而歸納推理則完全相反,它是一個自下而上(Bottom-Up)的過程:它沒有預(yù)設(shè)的“個人說明書”。它的“線索”就是你的每一個行為: 你追問了什么問題,說明你關(guān)心什么;你跳過了哪個回答,說明你不喜歡什么風(fēng)格;你對哪個笑話點了贊,暴露了你的幽默感。它的“任務(wù)”就是從這些海量的、碎片化的行為數(shù)據(jù)中,提煉出專屬于你的互動模式與偏好規(guī)律。通過歸納推理,AI有潛力成為你的“知心姐姐”,主動拼湊出一個完整的你。

舉個例子,讓我們來扮演一次AI知心姐姐,看看它是如何通過兩次看似無關(guān)的對話,就精準(zhǔn)捕捉到你的“潛臺詞”的:

  • 第一次交互:你問“什么是人工智能?它在商業(yè)和生活中是怎么用的?”。AI會立刻開始在幕后推理你的偏好:“你可能對AI技術(shù)有特別的興趣,但似乎更關(guān)心實際應(yīng)用,也許是商業(yè)導(dǎo)向”。
  • 第二次交互:你想學(xué)習(xí)冥想,在兩個候選回答中,你選擇了提供具體步驟的那個,而不是闡述冥想哲學(xué)的回答。AI會立刻更新它對你偏好的理解:“你的偏好是獲取能解決眼前需求的、務(wù)實的指導(dǎo),而不是理論探討。”

這種漸進(jìn)式的學(xué)習(xí)和優(yōu)化,讓AI的“記憶”不再短暫。隨著一次次的交互,它會不斷收集新的線索,驗證并修正之前的假設(shè),對你的“人物畫像”進(jìn)行一次又一次的精修。最終,它不再是被動回答問題的機(jī)器,而是在主動地、持續(xù)地學(xué)習(xí)和理解你是誰。

這,就是我們通向真正個性化AI的第一步。

AlignXplore

AlignXplore的訓(xùn)練包括兩個階段。

圖片

第一階段:冷啟動訓(xùn)練(Cold-start Training)——拜師學(xué)藝

研究團(tuán)隊首先引入一個更強(qiáng)大的AI作為“導(dǎo)師模型”圖片。這個導(dǎo)師會生成大量高質(zhì)量的“教學(xué)案例”。對于每個用戶的行為信號集合圖片圖片會生成多組候選的推理鏈r和相應(yīng)的偏好描述d利用獎勵函數(shù)R(r,d)進(jìn)行篩選來獲取高質(zhì)量數(shù)據(jù)圖片。通過在圖片上進(jìn)行SFT,實現(xiàn)偏好歸納模型的冷啟動。

圖片

其中圖片代表可能存在的歷史偏好,而G是為每個實例生成的候選樣本數(shù)量。這里獎勵函數(shù)定義為:

圖片

其中,圖片是下游大語言模型R對回復(fù)的偏好打分函數(shù)。這個通用的獎勵框架可以被實例化為兩種具體的獎勵函數(shù),用于模型的訓(xùn)練與評估:

1、圖片(基于偏好判斷的獎勵)

R作為一個偏好判斷模型,直接評估在給定推斷出的偏好d后“圖片圖片更好”的概率,最大化與用戶真實偏好的一致性:

圖片

圖片提供了更穩(wěn)定和有效的訓(xùn)練信號,是AlignXplore在訓(xùn)練和評估中采用的核心獎勵函數(shù)。

2、圖片(基于生成概率的獎勵)

R作為一個回復(fù)生成模型,衡量在加入偏好描述d前后,模型生成較優(yōu)回復(fù)圖片與生成較差回復(fù)圖片間的對數(shù)概率差值是否有提升:

圖片

第二階段:強(qiáng)化學(xué)習(xí)(Reinforcement Learning)——實戰(zhàn)修行

在這一階段,采用GRPO算法訓(xùn)練,模型會針對用戶的行為,嘗試生成多種不同的推理路徑和偏好結(jié)論圖片。隨后,系統(tǒng)會根據(jù)這些結(jié)論的準(zhǔn)確性給予“獎勵”或“懲罰”。通過這種不斷的試錯和優(yōu)化,模型學(xué)會了如何將初步的分析提煉成更精準(zhǔn)、更具指導(dǎo)性的判斷。

優(yōu)化策略定義如下:

圖片

流式偏好推斷機(jī)制

AlignXplore模型支持流式偏好推斷機(jī)制,即不再需要反復(fù)回看用戶冗長的歷史記錄,而是像處理一條源源不斷的數(shù)據(jù)流一樣,實時、增量地更新對用戶的理解——就像它在之前的例子中發(fā)現(xiàn)用戶“務(wù)實導(dǎo)向”的風(fēng)格一樣。

這種“流式”設(shè)計帶來的好處是顯而易見的:

首先,它大大提高了生成效率;

其次,它極為靈活,當(dāng)用戶從休閑模式切換到工作狀態(tài)時,它能迅速迭代出一個新的“工作版”偏好,而不是固執(zhí)地用舊眼光看用戶。這才是真正能跟上用戶節(jié)奏的動態(tài)進(jìn)化系統(tǒng)。

實驗結(jié)果

在域內(nèi)測試集AlignX_test和域外測試集P-Soups上,AlignXplore模型在個性化對齊任務(wù)上取得了顯著的成功,相較于基座模型DeepSeek-R1-Distill-Qwen-7B平均提升了15.49%。

圖片

△AlignXplore與各種推理/非推理模型在域內(nèi)外數(shù)據(jù)集上的表現(xiàn)

更重要的是,它展現(xiàn)了強(qiáng)大的綜合能力:

高效性: 即使互動歷史變得非常長,流式推理機(jī)制也能保持穩(wěn)定的響應(yīng)速度和準(zhǔn)確率,不會像傳統(tǒng)方法那樣需要每次編碼所有行為信號致使越來越慢。

圖片

△隨著互動的進(jìn)行,流式推理機(jī)制下的響應(yīng)速度和準(zhǔn)確率都保持穩(wěn)定

泛化能力:它不僅能處理特定的反饋數(shù)據(jù),還能從用戶發(fā)布的帖子user-generated content (UGC)等不同形式的內(nèi)容中學(xué)習(xí),并且其推斷出的偏好也能成功地應(yīng)用于與訓(xùn)練時不同的下游模型,包括QwQ-32B、DeepSeek-R1-671B等。

圖片

△泛化性實驗

魯棒性:即使用戶的偏好發(fā)生改變甚至反轉(zhuǎn),AlignXplore也能靈活適應(yīng),不會產(chǎn)生劇烈的效果波動。

圖片

△即便反轉(zhuǎn)初始行為信號的偏好,流式推理機(jī)制也能讓模型靈活調(diào)整偏好推斷

總結(jié)

該工作第一作者為人大高瓴一年級博士生李嘉楠,目前在螞蟻實習(xí);螞蟻通用人工智能研究中心自然語言處理實驗室關(guān)健、武威為共同第一作者、通訊作者。

AlignXplore是大模型個性化路上的一個全新的嘗試。在SOTA結(jié)果的背后,這項研究其實有很多思考:

  • 在智力上限被一波又一波推高的當(dāng)下,如何規(guī)模化訓(xùn)練大模型“情商”是一個沒有得到足夠關(guān)注卻又十分重要的問題。畢竟誰會拒絕一個既聰明又有溫度的AI呢?
  • 深度思考下的長思維鏈?zhǔn)谴竽P椭悄苣芰Φ闹饕苿恿ΑI疃人伎急旧硐木薮螅敲慈绻挥脕硭⒎郑遣皇怯悬c浪費呢?相比于結(jié)果,推理過程中產(chǎn)生的知識是不是更有價值呢?AlignXplore可以看作是推理知識在用戶理解領(lǐng)域進(jìn)行遷移應(yīng)用的一個嘗試。畢竟相對于艱深的數(shù)學(xué)知識,用戶理解知識更容易被看懂,也更容易落地。
  • 如果客觀問題都很快會被AI解決,那么主觀問題該怎么辦呢?這個世界上到底是客觀問題多還是主觀問題多呢?無論如何,研究團(tuán)隊認(rèn)為個性化是通往主觀世界的一條重要通道,而AlignXplore是在這條通道上的一次大膽嘗試。期待未來有更多相關(guān)研究能夠涌現(xiàn)。
責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2015-01-14 14:43:31

豌豆莢移動搜索應(yīng)用內(nèi)搜索

2020-12-04 05:56:19

Vscode 代碼 編輯器

2024-08-15 13:22:17

2015-11-09 10:12:08

大數(shù)據(jù)個性化推薦

2020-06-28 07:00:00

推薦系統(tǒng)智能商務(wù)服務(wù)平臺

2010-09-08 21:45:52

企業(yè)郵箱網(wǎng)絡(luò)通信263郵箱

2022-11-01 07:19:45

推薦系統(tǒng)非個性化

2023-03-05 21:11:44

微軟Windows 1

2023-10-17 08:42:13

ChatGPT定制指令

2023-03-21 12:46:30

智慧城市人工智能大數(shù)據(jù)

2020-08-04 08:10:47

人工智能

2018-08-20 19:35:28

AI教育個性化教育

2021-11-19 22:45:14

Windows系統(tǒng)數(shù)據(jù)

2011-01-20 10:19:21

PowerShell個性化

2025-03-24 10:37:15

2025-08-04 07:53:59

2025-08-07 09:27:17

CursorAI編程

2025-07-23 07:57:53

2017-11-22 09:24:00

點贊
收藏

51CTO技術(shù)棧公眾號

51国偷自产一区二区三区| 亚洲人成网站免费播放| 欧美高清中文字幕| 日韩在线一区二区三区四区| 国产亚洲永久域名| 少妇高潮久久77777| 中文写幕一区二区三区免费观成熟| 毛片在线看片| 972aa.com艺术欧美| 国产精品揄拍500视频| 欧美黑人精品一区二区不卡| 欧美人与牛zoz0性行为| 欧美一区二区三区在线| 日本久久久精品视频| aa在线视频| 国产日韩欧美一区二区三区乱码| 亚洲va欧美va在线观看| 国产亚洲欧美日韩高清| 激情综合自拍| 麻豆成人在线看| 久久国产柳州莫菁门| 国内精品国产成人国产三级粉色 | 欧美一二三区视频| 亚洲精品成人| 中文字幕亚洲综合久久筱田步美| 在线免费观看污视频| 999久久久国产999久久久| 精品日韩中文字幕| 菠萝蜜视频在线观看入口| 福利在线视频导航| 91香蕉视频黄| 高清国产一区| 国产婷婷在线视频| 美女视频黄免费的久久 | 国产精品美女久久久久av爽| 91精品一区二区三区综合在线爱| 亚洲精品中文字| 美女伦理水蜜桃4| www欧美在线观看| 欧美亚洲国产怡红院影院| 亚洲人精品午夜射精日韩| av免费网站在线| 国产精品激情偷乱一区二区∴| 久久久免费看| 香蕉av在线播放| 成人黄色国产精品网站大全在线免费观看| 成人国内精品久久久久一区| 免费一级a毛片| 久久黄色网页| 欧美在线视频网| 日本高清www免费视频| 亚洲国产裸拍裸体视频在线观看乱了中文 | 久久久久av| 久久精品国产一区二区三区| 男人的天堂av网| 青青草国产免费一区二区下载 | 日本xxx在线播放| 日韩精选在线| 精品一区二区三区电影| 狠狠人妻久久久久久综合蜜桃| www.神马久久| 亚洲电影免费观看高清| 国产大尺度视频| 国产ts一区| 亚洲成人a**站| 7788色淫网站小说| 国产精品亚洲二区| 中文国产成人精品| 午夜激情视频在线播放| 亚洲成av人电影| 欧美高清自拍一区| 国产极品在线播放| 天堂资源在线中文精品| 国产精品色悠悠| 国产露脸91国语对白| 韩国av一区二区三区| 亚洲精品欧美一区二区三区| www.97av.com| 99热99精品| 日产精品久久久一区二区| 午夜激情视频在线| 亚洲精品国产视频| 91好吊色国产欧美日韩在线| 亚洲成人短视频| 欧美日韩成人综合| 日本成人在线免费| 一本色道久久综合狠狠躁的番外| 亚洲午夜小视频| 天堂网avav| 99精品国产在热久久下载| 日韩av电影免费观看高清| 一级淫片免费看| www.欧美.com| 亚洲一二区在线| caoprom在线| 91国产丝袜在线播放| 伊人成人免费视频| 免费欧美一区| 欧美成aaa人片在线观看蜜臀| 国产手机在线视频| 久久精品二区亚洲w码| 成人黄视频免费| av片在线看| 亚洲高清一区二区三区| 亚洲精品高清无码视频| 亚洲精品在线播放| 中文字幕av一区二区三区谷原希美| 人妻人人澡人人添人人爽| 国产情侣一区| 亚洲a级在线播放观看| 黄色在线网站| 香蕉加勒比综合久久| mm131国产精品| 日本久久成人网| 欧美老女人xx| 国语对白做受69按摩| 成人福利视频在线| 在线观看亚洲视频啊啊啊啊| 亚洲欧美一区二区三区| 欧美一级黄色片| 午夜黄色福利视频| 鲁大师影院一区二区三区| 国产精品推荐精品| 国产激情在线观看| 欧美天堂亚洲电影院在线播放| 日韩综合第一页| 91精品国产成人观看| 国产精品v片在线观看不卡| 亚洲产国偷v产偷v自拍涩爱| 国产精品国产三级国产| 污污视频网站免费观看| 天美av一区二区三区久久| 精品中文字幕在线观看| 91精品视频免费在线观看| 国产午夜精品一区二区三区视频 | 第一福利在线视频| 日韩欧美综合在线| 91人妻一区二区三区蜜臀| 人人狠狠综合久久亚洲| 欧美连裤袜在线视频| yellow字幕网在线| 精品久久久久av影院| 午夜少妇久久久久久久久| 美女视频黄免费的久久| 亚洲国产一区二区三区在线| 韩国精品主播一区二区在线观看 | 午夜亚洲福利在线老司机| 国产精品国色综合久久| 欧美78videosex性欧美| 欧美一区二区三区喷汁尤物| 777777国产7777777| 蜜臂av日日欢夜夜爽一区| 亚洲欧美日韩精品久久久| 怡红院成人在线| 在线精品高清中文字幕| 中文字幕在线观看国产| 中文字幕免费一区| 污版视频在线观看| 999国产精品永久免费视频app| 国产精品无av码在线观看| av在线播放av| 777xxx欧美| 日日骚一区二区三区| 国产v综合v亚洲欧| 极品粉嫩国产18尤物| 欧美挤奶吃奶水xxxxx| 国产91在线播放精品91| 在线免费看黄网站| 日韩一本二本av| 日本一级淫片色费放| 久久综合久久久久88| 亚洲一区二区三区四区五区xx| 日韩精品诱惑一区?区三区| 91精品国产自产在线老师啪| 日本色护士高潮视频在线观看| 精品国产伦理网| 国产suv精品一区二区33| 国产精品久久三区| 日本精品一二三区| 久久成人亚洲| 一本色道久久综合亚洲精品婷婷 | 性色av无码久久一区二区三区| 国产成人亚洲综合色影视| 男女激情无遮挡| av中字幕久久| 91免费看网站| 在线视频超级| 久久久精品日本| 特黄aaaaaaaaa真人毛片| 日本韩国欧美一区二区三区| 亚洲怡红院在线观看| 成a人片国产精品| 中文字幕永久视频| 亚洲夜间福利| 无遮挡亚洲一区| 成人高潮a毛片免费观看网站| 青青久久av北条麻妃海外网| 国产1区在线| 亚洲精品色婷婷福利天堂| 91黄色在线视频| 欧美丝袜美女中出在线| 91嫩草丨国产丨精品| 99视频在线精品| 国产性生活一级片| 免费看的黄色欧美网站| 天堂av免费看| 国产一区二区三区网| 国产91精品一区二区绿帽| 麻豆精品蜜桃| 午夜精品一区二区三区在线| 国产乱色在线观看| 亚洲视频第一页| 亚洲男女视频在线观看| 欧美日韩另类国产亚洲欧美一级| 日韩精品――中文字幕| 亚洲色图在线视频| 国产精品20p| 91在线精品一区二区| 国产chinesehd精品露脸| 日本sm残虐另类| 无码精品a∨在线观看中文| 午夜精品久久99蜜桃的功能介绍| 日韩欧美视频一区二区| 日韩免费电影在线观看| 成人91视频| 国产精品一区免费在线| 国产女人精品视频| 成人涩涩视频| 国产精品96久久久久久| 国产v日韩v欧美v| 久久69精品久久久久久久电影好 | 岛国av在线免费| 视频一区二区三区在线| 无码aⅴ精品一区二区三区浪潮| 精品91视频| 国产在线xxxx| 欧美日韩1区2区3区| 免费看av软件| 天天影视欧美综合在线观看| 一区二区三区的久久的视频| 成人羞羞在线观看网站| 欧美综合激情| 首页亚洲中字| 欧美精品123| 精品一区免费| 欧美日韩精品免费看| 日韩有码中文字幕在线| 久久人人九九| 在线日韩一区| 日产国产精品精品a∨| 欧洲福利电影| 一区二区三区我不卡| 91亚洲一区| 四虎精品欧美一区二区免费| 亚洲欧美亚洲| 僵尸世界大战2 在线播放| 亚洲国产清纯| 欧美 日韩精品| 秋霞电影网一区二区| 亚洲欧美国产日韩综合| 激情欧美日韩一区二区| 在线免费黄色小视频| 丰满岳乱妇一区二区三区| 日本国产在线视频| 2020国产精品自拍| 亚洲а∨天堂久久精品2021| 国产精品久久毛片| 波多野结衣家庭教师| 亚洲国产精品久久人人爱| 日韩精品在线免费视频| 日本道免费精品一区二区三区| 国产99久久久久久免费看| 欧美日韩国产一级二级| 亚洲av色香蕉一区二区三区| 亚洲国产91精品在线观看| 免费福利在线视频| 久久精品91久久香蕉加勒比| 人人超在线公开视频| 欧美一区二区三区免费视| 国产精品蜜月aⅴ在线| 亚洲a级在线播放观看| 视频福利一区| www.亚洲一区二区| 国产亚洲精品自拍| 亚洲欧美日韩综合网| 成人一区二区三区视频在线观看 | 伊人色综合久久天天| 国产精品第一页在线观看| 一本到一区二区三区| 国产免费黄色片| 日韩成人中文字幕在线观看| 天天在线视频色| 午夜精品久久久久久99热软件| 色豆豆成人网| eeuss一区二区三区| 国产欧美日韩在线观看视频| 欧美一级特黄aaaaaa在线看片| 国产精品视区| 日韩 国产 一区| 久久先锋影音av| 午夜激情视频在线播放| 欧美天天综合色影久久精品| 一级淫片免费看| 日韩精品免费在线视频| 很黄的网站在线观看| 欧美最猛性xxxxx免费| 欧美经典影片视频网站| 日韩啊v在线| 亚洲美女91| 日本中文字幕在线不卡| 中文字幕高清一区| 成年人视频在线免费看| 日韩午夜激情av| 777电影在线观看| 欧美亚洲视频在线看网址| 日韩在线精品强乱中文字幕| 日韩中文字幕一区二区| 一本色道久久精品| 午夜影院免费版| 亚洲欧洲韩国日本视频| 99re热视频| 亚洲美女在线观看| 国产精品论坛| 国产精品yjizz| 亚洲综合色网| 色婷婷一区二区三区av免费看| 久久久久久久国产精品影院| 国产一级久久久| 日韩一级免费观看| 麻豆传媒免费在线观看| 国产精品久久久久久亚洲调教 | 亚洲色图激情小说| 日韩脚交footjobhd| 国产精品区一区二区三含羞草| 91精品精品| 久久6免费视频| 亚洲色图都市小说| 国产毛片毛片毛片毛片毛片| 日韩中文字幕免费| 91福利精品在线观看| 日韩精品欧美一区二区三区| 久久久久国产精品午夜一区| 朝桐光av一区二区三区| 天天色图综合网| 无码国产精品一区二区免费16| 欧美国产欧美亚洲国产日韩mv天天看完整 | 国产精品普通话| 成人精品视频| 天堂av在线网站| 国产精品天天看| 中文字幕一区二区三区四区免费看| 国产亚洲欧美一区| 日本欧美一区| 亚洲图片欧洲图片日韩av| 久久国产精品99久久久久久老狼| 萌白酱视频在线| 欧美一区二区视频在线观看2022| www免费在线观看| 97人人干人人| 亚洲福利久久| a毛片毛片av永久免费| 色婷婷激情久久| 日本中文字幕伦在线观看| 51国偷自产一区二区三区的来源| 黄色另类av| 成人影视免费观看| 欧美中文字幕一区二区三区亚洲 | 久久久爽爽爽美女图片| 久久av国产紧身裤| 国产a级片免费观看| 国产精品久久久久三级| va视频在线观看| 97视频免费在线观看| 国产亚洲一区二区三区啪| 天天干天天av| 亚洲国产精品久久人人爱蜜臀| 亚洲欧美综合在线观看| 国产在线视频不卡| 国产在线成人| 伊人网伊人影院| 91精品国产91久久久久久最新毛片 | 日韩手机在线观看视频| 国产精品久久久久久久久免费丝袜 | 国产乱码精品1区2区3区| 国产精品成人网站| 伊人男人综合视频网| 一区视频网站| 日韩免费高清在线| 夜夜亚洲天天久久| 精品乱码一区二区三四区视频 | 国产精品成人国产乱一区| 五月婷婷亚洲| 成人免费av片| 日韩一级片网址| 97精品国产综合久久久动漫日韩| 亚洲精品天堂成人片av在线播放 | 亚洲天堂av图片| 99久久人爽人人添人人澡| 成人免费毛片播放| 亚洲一区二区av电影|