精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

激發(fā)大語言模型空間推理能力:思維可視化提示 原創(chuàng)

發(fā)布于 2024-4-11 11:31
瀏覽
0收藏

大語言模型(LLMs)在語言理解和各種推理任務(wù)中展現(xiàn)出令人印象深刻的性能。然而,它們?cè)谌祟愓J(rèn)知的關(guān)鍵一面——空間推理上,仍然未被充分研究。人類具有通過一種被稱為 心靈之眼 的過程創(chuàng)造看不見的物體和行為的心智圖像的能力,從而使得對(duì)未見世界的想象成為可能。受到這種認(rèn)知能力的啟發(fā),研究人員提出了 “思維可視化”(Visualization of Thought,VoT)。VoT旨在通過可視化其推理跡象來引導(dǎo)LLMs的空間推理,從而引導(dǎo)后續(xù)的推理步驟。研究人員將VoT應(yīng)用于多跳空間推理任務(wù),包括自然語言導(dǎo)航、視覺導(dǎo)航以及二維網(wǎng)格世界中的視覺鋪設(shè)。實(shí)驗(yàn)結(jié)果表明,VoT顯著增強(qiáng)了LLMs的空間推理能力。值得注意的是,VoT在這些任務(wù)中表現(xiàn)優(yōu)于現(xiàn)有的多模態(tài)大型語言模型(MLLMs)

引言

最近,大語言模型(LLMs)在各種與語言相關(guān)的任務(wù)上取得了顯著的表現(xiàn)。然而,盡管它們?cè)跀?shù)學(xué)推理、常識(shí)推理以及其他推理任務(wù),如符號(hào)推理或邏輯推理等方面取得了成功,但它們?cè)诳臻g推理方面的能力仍然未被充分探索。

空間推理是人類認(rèn)知的基本功能,使我們能夠與環(huán)境互動(dòng)。它促進(jìn)了需要理解和推理物體及其運(yùn)動(dòng)之間空間關(guān)系的任務(wù)。語言模型的空間推理在很大程度上依賴于語言來推理空間信息,而人類的認(rèn)知能力遠(yuǎn)遠(yuǎn)超出了語言推理。人類不僅可以從視覺感知中創(chuàng)建與任務(wù)相關(guān)的抽象表示,還可以通過心靈之眼想象看不見的場(chǎng)景。這在神經(jīng)科學(xué)、心靈哲學(xué)和認(rèn)知科學(xué)領(lǐng)域被稱為心智圖像的研究課題。建立在這一認(rèn)知功能之上,人類通過心智圖像的操作來促進(jìn)空間推理,比如導(dǎo)航、心理旋轉(zhuǎn)、心理紙張折疊和心理模擬。圖1說明了在導(dǎo)航任務(wù)中涉及的人類過程。人類通過創(chuàng)建路徑的心智圖像來增強(qiáng)其空間意識(shí)并指導(dǎo)其決策,利用各種感官輸入,如導(dǎo)航指令或地圖圖像。隨后,他們通過心靈之眼模擬路徑規(guī)劃。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

圖1:人類可以通過在空間推理過程中創(chuàng)建心智圖像來增強(qiáng)他們的空間意識(shí)并指導(dǎo)決策。同樣地,大語言模型(LLMs)可以創(chuàng)建內(nèi)部心智圖像。研究人員提出了VoT,通過可視化它們?cè)诿總€(gè)中間步驟的思維,來引發(fā)LLMs的“心靈之眼”,從而促進(jìn)空間推理。

受到這一認(rèn)知機(jī)制的啟發(fā),研究人員推測(cè)LLMs具有在心靈之眼中創(chuàng)建和操作心智圖像的能力來進(jìn)行空間推理。正如圖1所示,LLMs可能潛在地處理和理解各種格式的空間信息。它們可能能夠可視化內(nèi)部狀態(tài),并通過心靈之眼操作這些心智圖像,從而引導(dǎo)后續(xù)推理步驟以增強(qiáng)空間推理。因此,研究人員提出了 “思維可視化”(VoT) 提示來引發(fā)這種能力。該方法通過為L(zhǎng)LMs增加一個(gè)視覺空間素描板來可視化其推理步驟并指導(dǎo)后續(xù)步驟。VoT采用零示范提示,而不是依賴于少量示范或使用CLIP進(jìn)行文本到圖像的可視化。這個(gè)選擇源自LLMs從基于文本的視覺藝術(shù)中獲得各種心智圖像的能力。

為了評(píng)估VoT在空間推理中的有效性,研究人員選擇了三個(gè)需要LLMs空間意識(shí)的任務(wù),包括自然語言導(dǎo)航、視覺導(dǎo)航和視覺鋪設(shè)。這些任務(wù)需要理解空間、方向和幾何形狀推理。為了模擬人類般的多感官感知,研究人員設(shè)計(jì)了使用特殊字符作為L(zhǎng)LMs視覺導(dǎo)航和視覺鋪設(shè)任務(wù)中豐富輸入格式的2D網(wǎng)格世界。在這三個(gè)任務(wù)中比較了不同的模型(GPT-4、GPT-4V)和提示技術(shù)。研究結(jié)果顯示,VoT提示始終促使LLMs可視化其推理步驟并指導(dǎo)后續(xù)步驟。因此,這種方法在相應(yīng)任務(wù)上取得了顯著的性能提升。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

圖2:不同設(shè)置下的導(dǎo)航地圖示例,房子的表情符號(hào)表示起點(diǎn),辦公室的表情符號(hào)表示目的地。

空間推理

空間推理指的是理解和推理物體之間的空間關(guān)系、它們的移動(dòng)和互動(dòng)的能力。這種技能對(duì)于廣泛的現(xiàn)實(shí)世界應(yīng)用非常重要,如導(dǎo)航、機(jī)器人技術(shù)和自動(dòng)駕駛。這些領(lǐng)域需要基于視覺感知和對(duì)空間維度的具體理解進(jìn)行行動(dòng)規(guī)劃。盡管已經(jīng)開發(fā)了幾項(xiàng)任務(wù)和數(shù)據(jù)集來探究嵌入在文本中的空間語義,研究工作通常集中在空間術(shù)語如何在語言上結(jié)構(gòu)化上。最近,通過將空間術(shù)語轉(zhuǎn)換為邏輯形式并采用邏輯編程,在這些基準(zhǔn)測(cè)試中取得了顯著的成就和令人印象深刻的結(jié)果。這意味著在這些任務(wù)中取得優(yōu)異成績(jī)并不一定意味著大型語言模型(LLMs)真正理解了空間信息,也不提供它們空間意識(shí)的準(zhǔn)確衡量標(biāo)準(zhǔn)。空間意識(shí)涉及理解空間關(guān)系、方向、距離和幾何形狀,這些都對(duì)于在物理世界中進(jìn)行行動(dòng)規(guī)劃至關(guān)重要。為了評(píng)估LLMs的空間意識(shí)和空間推理能力,研究人員選擇了一些測(cè)試導(dǎo)航和幾何推理技能的任務(wù),包括自然語言導(dǎo)航、視覺導(dǎo)航和視覺鋪設(shè)。

自然語言導(dǎo)航

自然語言導(dǎo)航涉及通過隨機(jī)漫步瀏覽底層空間結(jié)構(gòu),旨在識(shí)別先前訪問過的位置。這個(gè)概念受到先前關(guān)于人類認(rèn)知的研究的啟發(fā),其采用了類似于沿著圖結(jié)構(gòu)進(jìn)行隨機(jī)漫步的方法。這個(gè)過程需要理解循環(huán)閉合,這對(duì)于空間導(dǎo)航至關(guān)重要。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

視覺導(dǎo)航

視覺導(dǎo)航任務(wù)向LLMs展示了一個(gè)合成的二維網(wǎng)格世界,挑戰(zhàn)其利用視覺線索進(jìn)行導(dǎo)航。模型必須生成導(dǎo)航指令,以四個(gè)方向(左、右、上、下)移動(dòng),從起點(diǎn)到達(dá)目的地,同時(shí)避開障礙物。這涉及到兩個(gè)子任務(wù):路線規(guī)劃和下一步預(yù)測(cè),需要進(jìn)行多跳空間推理,其中前者更為復(fù)雜。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

視覺鋪設(shè)

視覺鋪設(shè)是一個(gè)經(jīng)典的空間推理挑戰(zhàn)。將這個(gè)概念擴(kuò)展到測(cè)試LLMs在有限區(qū)域內(nèi)理解、組織和推理形狀的能力,從而增強(qiáng)了空間推理技能的評(píng)估。任務(wù)涉及一個(gè)帶有未填充單元格和各種多米諾塊的矩形,比如由四個(gè)對(duì)齊的方塊組成的I-多米諾塊。模型必須選擇適當(dāng)?shù)亩嗝字Z塊變體,例如選擇I-多米諾塊的方向,以解決問答謎題。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

圖3:帶有掩碼多米諾塊的視覺鋪設(shè)示例。該圖未顯示多米諾塊的旋轉(zhuǎn)和鏡像變體。

思維可視化提示

考慮到人類在導(dǎo)航等任務(wù)中處理空間信息的方式,常常會(huì)創(chuàng)建心智圖像,如地圖,以增強(qiáng)空間意識(shí)或模擬移動(dòng)以指導(dǎo)決策。研究目標(biāo)是喚起LLMs的空間意識(shí),并通過可視化它們的中間推理步驟來基于實(shí)際情況進(jìn)行推理。

研究人員引入了“思維可視化”(VoT)提示: "在每個(gè)推理步驟之后可視化狀態(tài)"。這種新的空間推理范式旨在以交錯(cuò)的方式生成推理跡象和可視化結(jié)果。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

圖4:三個(gè)任務(wù)中VoT提示的示例,LLM以交錯(cuò)方式生成推理跡象和可視化來跟蹤隨時(shí)間變化的狀態(tài)。

激發(fā)大語言模型空間推理能力:思維可視化提示-AI.x社區(qū)

論文:https://arxiv.org/pdf/2404.03622.pdf


本文轉(zhuǎn)載自公眾號(hào)AIGC最前線 

原文鏈接:??https://mp.weixin.qq.com/s/d38VknDQtM-UEFsf--fxQQ??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
已于2024-4-16 10:15:48修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产精品美女免费视频| xnxx国产精品| 有码中文亚洲精品| 你真棒插曲来救救我在线观看| 免费观看日批视频| 成人做爰免费视频免费看| 综合自拍亚洲综合图不卡区| 91精品一区二区| 懂色av粉嫩av浪潮av| 在线精品视频一区| 在线一区二区三区| 日本精品免费观看| 久久综合福利| 成人免费一级片| 欧美三级黄美女| 在线视频日韩精品| 成人在线视频免费播放| 国产91欧美| 五月婷婷色综合| 制服诱惑一区| 男操女在线观看| 国产很黄免费观看久久| 国产精品18久久久久久麻辣| 欧美精品xxxxx| 日韩欧美高清在线播放| 亚洲韩国青草视频| 日本55丰满熟妇厨房伦| 欧洲成人一区| 欧美视频精品一区| 天天想你在线观看完整版电影免费| 免费毛片在线| av在线一区二区| 成人亚洲激情网| 久久久久久久亚洲| 国产视频一区欧美| 久久久久久国产精品美女| 成人小视频免费看| 免费电影一区二区三区| 欧美精品一区二区三区蜜桃| 四虎成人在线播放| 欧美一级免费| 欧美揉bbbbb揉bbbbb| 91淫黄看大片| 成人免费看黄| 一本一本久久a久久精品综合麻豆| 欧美一级片免费播放| 四虎影院观看视频在线观看| 中文字幕亚洲综合久久菠萝蜜| 日韩精品电影网站| 欧美女同网站| 久久精品欧美日韩| 日本成人黄色| 国产免费a∨片在线观看不卡| 26uuu精品一区二区在线观看| 国产精品免费一区二区三区在线观看 | 一区二区三区四区精品视频| 欧美日韩一级视频| 一道本在线免费视频| 亚洲成av在线| 欧美日韩日日摸| 黄色一级片免费的| 小说区图片区亚洲| 欧美一级日韩一级| 波多野结衣免费观看| 日韩精品视频一区二区三区| 日韩精品一区二区三区在线播放| 中文字幕制服丝袜| 超碰97成人| 亚洲女同性videos| 久久久精品成人| 91影院成人| 久国内精品在线| 久青草视频在线观看| 亚洲大胆在线| 国产aⅴ夜夜欢一区二区三区| 91麻豆精品在线| 九九视频精品免费| 成人黄动漫网站免费| 日韩有码第一页| 久久久久国产精品厨房| 一本色道久久综合亚洲精品婷婷| 久草免费在线观看| 亚洲永久精品大片| 国产男女在线观看| 黄色欧美视频| 精品免费视频一区二区| 毛茸茸多毛bbb毛多视频| 精品久久综合| 欧美肥婆姓交大片| 精品国产午夜福利| 精品亚洲aⅴ乱码一区二区三区| 爱情岛论坛亚洲入口| 亚洲三区在线播放| 国产精品对白交换视频| 九九热只有这里有精品| 99亚洲伊人久久精品影院| 日韩视频永久免费| 日韩在线免费观看av| 国产精品91一区二区三区| 久久久久在线观看| 免费看av在线| 成人精品在线视频观看| 日韩国产美国| av色在线观看| 欧美高清视频在线高清观看mv色露露十八 | 成人日韩在线观看| 日韩欧美一级特黄在线播放| 性少妇bbw张开| 欧美一区视频| 日韩女优在线播放| 人妻少妇精品无码专区久久| 国产精品成人免费在线| 91免费视频网站在线观看| 精品久久久久久久久久岛国gif| 日韩福利视频在线观看| 欧美大片xxxx| 翔田千里一区二区| 国产高清一区二区三区| 北岛玲日韩精品一区二区三区| 亚洲高清久久久| 天天操,天天操| 日本成人7777| 国内精品久久久久| 国产精品伦一区二区三区| 久久久久国产精品人| 国产精品成人久久电影| 高清在线一区二区| 国产一区二区成人| www.国产色| 99久久精品国产毛片| 国产精品videossex国产高清 | 欧美日韩综合在线| 在线免费观看麻豆| 国产日韩高清一区二区三区在线| 51精品国产人成在线观看| 色的视频在线免费看| 色婷婷精品大在线视频| 国产夫妻性爱视频| 亚洲久久一区| 国产精品亚洲综合| 天天干在线视频论坛| 日韩一区二区精品在线观看| 亚洲国产123| 人人狠狠综合久久亚洲| 欧美综合激情| 日本一区二区三区视频在线| 国产视频久久久| 国产精品黄色大片| 99精品视频在线播放观看| 日韩av高清在线看片| 国产成人澳门| 97国产精品视频| 黄色aaa毛片| 亚洲18女电影在线观看| 欧美xxxxx精品| 一区二区高清| 奇米视频888战线精品播放| 美女100%一区| 中文字幕日本精品| 国产精品伦理一区| 夜夜精品视频一区二区| 国产高潮视频在线观看| 一本一本久久| 欧美一区二区综合| 黄色日韩网站| 欧美人成在线视频| 污污视频在线观看网站| 日韩欧美在线免费观看| av免费播放网站| 国内精品自线一区二区三区视频| 亚洲综合网中心| 亚洲大奶少妇| 69久久夜色精品国产69乱青草| 亚洲人妻一区二区三区| 91国产免费观看| 综合五月激情网| 成人美女视频在线观看18| 黄色片视频在线播放| 精品国产乱码久久久久久果冻传媒 | 欧美日韩电影免费看| 日韩中文字幕在线| www.四虎在线观看| 欧美日韩在线另类| 91禁男男在线观看| 国产成a人亚洲精品| avav在线看| 天天射综合网视频| 国产久一道中文一区| 日韩精品免费观看视频| 久久91精品国产91久久跳| 日韩a在线看| 91精品国产免费久久综合| 日韩女优在线观看| 国产精品婷婷午夜在线观看| 女王人厕视频2ⅴk| 老**午夜毛片一区二区三区| 中文字幕一区二区中文字幕| 国产精品自在| 国产一区香蕉久久| 碰碰在线视频| 久久手机免费视频| 蝌蚪视频在线播放| 欧美刺激脚交jootjob| 亚洲精品久久久久久久蜜桃| 一区二区三区日韩精品| 欧美三级视频网站| 成人午夜私人影院| 欧美女同在线观看| 久久不射网站| 国产午夜精品视频一区二区三区| 精品国产精品| 精品亚洲一区二区三区四区五区高| 欧美黄色a视频| 日产国产高清一区二区三区| 韩国一区二区三区| 玉米视频成人免费看| 91精品国产综合久久婷婷香蕉 | 天天躁日日躁狠狠躁欧美| 国产精品久久久久国产a级| 快射av在线播放一区| 精品亚洲aⅴ在线观看| 国产三级自拍视频| 欧美性猛片aaaaaaa做受| 91午夜视频在线观看| 亚洲美女屁股眼交| 貂蝉被到爽流白浆在线观看| 91亚洲国产成人精品一区二区三| 1314成人网| 男女男精品视频| 男人透女人免费视频| 一本色道久久| 国产高清av在线播放| 欧美日韩一区二区三区四区在线观看| 视频三区二区一区| 尤物tv在线精品| 狠狠综合久久av| 成人激情自拍| 99在线影院| 国内精品视频| 91亚洲永久免费精品| 国产一区二区精品调教| 国产成人综合精品| 欧美成人免费电影| 日本精品视频在线观看| 中文字幕在线视频网站| 午夜精品理论片| 丁香花在线高清完整版视频| 欧美黄色三级网站| 色爱综合区网| 国内精品免费午夜毛片| 91九色美女在线视频| 欧美激情精品久久久久久久变态| 超碰个人在线| 九九精品在线视频| 丝袜美腿av在线| 欧美激情精品久久久久久黑人| 免费在线看污片| 久久久久久久一| 草美女在线观看| 91国内在线视频| 色在线中文字幕| 国产成人精品国内自产拍免费看 | 成人在线观看一区| 一本一本久久a久久精品综合小说| 国产一级片在线| 中文字幕欧美国内| 美女免费久久| 九九九热精品免费视频观看网站| 免费毛片在线看片免费丝瓜视频| 欧美极品欧美精品欧美视频 | 国产自摸综合网| 日韩欧美高清一区二区三区| 国产精品传媒毛片三区| 老牛精品亚洲成av人片| 久久影院理伦片| 欧美3p在线观看| 国产尤物av一区二区三区| 亚洲激情婷婷| 91最新在线观看| 国产一区91精品张津瑜| 在线精品视频播放| 久久久久久日产精品| 小嫩苞一区二区三区| 亚洲一区二区三区四区在线| 天天操天天摸天天干| 欧美视频一区在线| japanese国产| 亚洲欧美一区二区三区久久| 欧美激情黑人| 午夜精品免费视频| 农村妇女一区二区| 国产精品一区二区免费| 欧美亚洲激情| 中文精品无码中文字幕无码专区| 久久国产毛片| 人妻换人妻仑乱| 久久久久久综合| 九九视频在线观看| 欧美亚洲国产怡红院影院| www.黄色片| 欲色天天网综合久久| 6699嫩草久久久精品影院| 国产精品网红福利| 国产精品一线| 少妇高潮流白浆| 丝袜诱惑制服诱惑色一区在线观看| 特级西西444www| 国产亚洲一区字幕| 国产在线欧美在线| 欧美美女bb生活片| 日韩av视屏| 欧美激情一区二区三区在线视频观看 | 国产精品区一区二区三区| 日韩精品一区二区三区国语自制 | 欧美 日韩 中文字幕| 日韩日本欧美亚洲| 范冰冰一级做a爰片久久毛片| 亚洲综合精品伊人久久| 日韩精品一卡| 日日碰狠狠躁久久躁婷婷| 国产成人日日夜夜| 亚洲精品一区二区三区在线播放| 黑人与娇小精品av专区| 亚洲国产精品久久人人爱潘金莲 | 日韩av激情| 91精品视频观看| 久久国产成人精品| 免费男同深夜夜行网站| 成人网在线免费视频| 久草视频手机在线| 欧美视频中文一区二区三区在线观看| 日本大片在线观看| 国语自产在线不卡| 亚洲精品a区| 九九久久九九久久| 国产在线播精品第三| jizz日本在线播放| 欧美性猛交一区二区三区精品| 免费在线观看一级毛片| 992tv成人免费视频| silk一区二区三区精品视频| 国产成人免费高清视频| 国产最新精品精品你懂的| 成人信息集中地| 欧美二区三区的天堂| 麻豆视频在线播放| 91欧美视频网站| 中文在线日韩| 色哟哟免费视频| 亚洲在线一区二区三区| 性一交一乱一精一晶| 欧美激情精品久久久久久蜜臀 | 久久se精品一区二区| 呻吟揉丰满对白91乃国产区| 欧美日韩久久久| 欧美边添边摸边做边爱免费| 成人黄色在线观看| 亚洲欧美综合久久久| 三日本三级少妇三级99| 亚洲另类色综合网站| 精品人妻av一区二区三区| 欧美激情精品久久久久久蜜臀| 国产精品任我爽爆在线播放| 久久综合色视频| 国产亚洲精品资源在线26u| 这里只有精品9| 欧美xxxx做受欧美| heyzo欧美激情| 黄www在线观看| 中文子幕无线码一区tr| 国产乱码精品一区二区三区精东| 另类色图亚洲色图| 久久综合社区| 国产a级片免费观看| 国产精品久久久久久久久搜平片| 国产毛片一区二区三区va在线| 久久久久久综合网天天| 亚洲婷婷影院| 欧美成年人视频在线观看| 洋洋成人永久网站入口| 青青草免费在线| 国产日本欧美在线观看| 黑人一区二区三区四区五区| 播金莲一级淫片aaaaaaa| 欧美精品久久久久久久多人混战 | 欧美一级视频在线观看| 精品美女在线视频| 日韩久久久久久久久久久| 欧美日韩黄色大片| 日本免费视频在线观看| 亚洲综合精品一区二区| 久久精品人人| 深夜福利影院在线观看| 精品呦交小u女在线| 99热这里有精品| 欧美a在线视频| 一区二区三区在线观看动漫| 久草在现在线| av在线不卡观看| 老司机免费视频一区二区|