精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

激發(fā)大語(yǔ)言模型空間推理能力:思維可視化提示

人工智能
人類不僅可以從視覺感知中創(chuàng)建與任務(wù)相關(guān)的抽象表示,還可以通過(guò)心靈之眼想象看不見的場(chǎng)景。這在神經(jīng)科學(xué)、心靈哲學(xué)和認(rèn)知科學(xué)領(lǐng)域被稱為心智圖像的研究課題。建立在這一認(rèn)知功能之上,人類通過(guò)心智圖像的操作來(lái)促進(jìn)空間推理,比如導(dǎo)航、心理旋轉(zhuǎn)、心理紙張折疊和心理模擬。

大語(yǔ)言模型(LLMs)在語(yǔ)言理解和各種推理任務(wù)中展現(xiàn)出令人印象深刻的性能。然而,它們?cè)谌祟愓J(rèn)知的關(guān)鍵一面——空間推理上,仍然未被充分研究。人類具有通過(guò)一種被稱為 心靈之眼 的過(guò)程創(chuàng)造看不見的物體和行為的心智圖像的能力,從而使得對(duì)未見世界的想象成為可能。受到這種認(rèn)知能力的啟發(fā),研究人員提出了 “思維可視化”(Visualization of Thought,VoT)。VoT旨在通過(guò)可視化其推理跡象來(lái)引導(dǎo)LLMs的空間推理,從而引導(dǎo)后續(xù)的推理步驟。研究人員將VoT應(yīng)用于多跳空間推理任務(wù),包括自然語(yǔ)言導(dǎo)航、視覺導(dǎo)航以及二維網(wǎng)格世界中的視覺鋪設(shè)。實(shí)驗(yàn)結(jié)果表明,VoT顯著增強(qiáng)了LLMs的空間推理能力。值得注意的是,VoT在這些任務(wù)中表現(xiàn)優(yōu)于現(xiàn)有的多模態(tài)大型語(yǔ)言模型(MLLMs)

引言

最近,大語(yǔ)言模型(LLMs)在各種與語(yǔ)言相關(guān)的任務(wù)上取得了顯著的表現(xiàn)。然而,盡管它們?cè)跀?shù)學(xué)推理、常識(shí)推理以及其他推理任務(wù),如符號(hào)推理或邏輯推理等方面取得了成功,但它們?cè)诳臻g推理方面的能力仍然未被充分探索。

空間推理是人類認(rèn)知的基本功能,使我們能夠與環(huán)境互動(dòng)。它促進(jìn)了需要理解和推理物體及其運(yùn)動(dòng)之間空間關(guān)系的任務(wù)。語(yǔ)言模型的空間推理在很大程度上依賴于語(yǔ)言來(lái)推理空間信息,而人類的認(rèn)知能力遠(yuǎn)遠(yuǎn)超出了語(yǔ)言推理。人類不僅可以從視覺感知中創(chuàng)建與任務(wù)相關(guān)的抽象表示,還可以通過(guò)心靈之眼想象看不見的場(chǎng)景。這在神經(jīng)科學(xué)、心靈哲學(xué)和認(rèn)知科學(xué)領(lǐng)域被稱為心智圖像的研究課題。建立在這一認(rèn)知功能之上,人類通過(guò)心智圖像的操作來(lái)促進(jìn)空間推理,比如導(dǎo)航、心理旋轉(zhuǎn)、心理紙張折疊和心理模擬。圖1說(shuō)明了在導(dǎo)航任務(wù)中涉及的人類過(guò)程。人類通過(guò)創(chuàng)建路徑的心智圖像來(lái)增強(qiáng)其空間意識(shí)并指導(dǎo)其決策,利用各種感官輸入,如導(dǎo)航指令或地圖圖像。隨后,他們通過(guò)心靈之眼模擬路徑規(guī)劃。

圖片

圖1:人類可以通過(guò)在空間推理過(guò)程中創(chuàng)建心智圖像來(lái)增強(qiáng)他們的空間意識(shí)并指導(dǎo)決策。同樣地,大語(yǔ)言模型(LLMs)可以創(chuàng)建內(nèi)部心智圖像。研究人員提出了VoT,通過(guò)可視化它們?cè)诿總€(gè)中間步驟的思維,來(lái)引發(fā)LLMs的“心靈之眼”,從而促進(jìn)空間推理。

受到這一認(rèn)知機(jī)制的啟發(fā),研究人員推測(cè)LLMs具有在心靈之眼中創(chuàng)建和操作心智圖像的能力來(lái)進(jìn)行空間推理。正如圖1所示,LLMs可能潛在地處理和理解各種格式的空間信息。它們可能能夠可視化內(nèi)部狀態(tài),并通過(guò)心靈之眼操作這些心智圖像,從而引導(dǎo)后續(xù)推理步驟以增強(qiáng)空間推理。因此,研究人員提出了 “思維可視化”(VoT) 提示來(lái)引發(fā)這種能力。該方法通過(guò)為L(zhǎng)LMs增加一個(gè)視覺空間素描板來(lái)可視化其推理步驟并指導(dǎo)后續(xù)步驟。VoT采用零示范提示,而不是依賴于少量示范或使用CLIP進(jìn)行文本到圖像的可視化。這個(gè)選擇源自LLMs從基于文本的視覺藝術(shù)中獲得各種心智圖像的能力。

為了評(píng)估VoT在空間推理中的有效性,研究人員選擇了三個(gè)需要LLMs空間意識(shí)的任務(wù),包括自然語(yǔ)言導(dǎo)航、視覺導(dǎo)航和視覺鋪設(shè)。這些任務(wù)需要理解空間、方向和幾何形狀推理。為了模擬人類般的多感官感知,研究人員設(shè)計(jì)了使用特殊字符作為L(zhǎng)LMs視覺導(dǎo)航和視覺鋪設(shè)任務(wù)中豐富輸入格式的2D網(wǎng)格世界。在這三個(gè)任務(wù)中比較了不同的模型(GPT-4、GPT-4V)和提示技術(shù)。研究結(jié)果顯示,VoT提示始終促使LLMs可視化其推理步驟并指導(dǎo)后續(xù)步驟。因此,這種方法在相應(yīng)任務(wù)上取得了顯著的性能提升。

圖片

圖2:不同設(shè)置下的導(dǎo)航地圖示例,房子的表情符號(hào)表示起點(diǎn),辦公室的表情符號(hào)表示目的地。

空間推理

空間推理指的是理解和推理物體之間的空間關(guān)系、它們的移動(dòng)和互動(dòng)的能力。這種技能對(duì)于廣泛的現(xiàn)實(shí)世界應(yīng)用非常重要,如導(dǎo)航、機(jī)器人技術(shù)和自動(dòng)駕駛。這些領(lǐng)域需要基于視覺感知和對(duì)空間維度的具體理解進(jìn)行行動(dòng)規(guī)劃。盡管已經(jīng)開發(fā)了幾項(xiàng)任務(wù)和數(shù)據(jù)集來(lái)探究嵌入在文本中的空間語(yǔ)義,研究工作通常集中在空間術(shù)語(yǔ)如何在語(yǔ)言上結(jié)構(gòu)化上。最近,通過(guò)將空間術(shù)語(yǔ)轉(zhuǎn)換為邏輯形式并采用邏輯編程,在這些基準(zhǔn)測(cè)試中取得了顯著的成就和令人印象深刻的結(jié)果。這意味著在這些任務(wù)中取得優(yōu)異成績(jī)并不一定意味著大型語(yǔ)言模型(LLMs)真正理解了空間信息,也不提供它們空間意識(shí)的準(zhǔn)確衡量標(biāo)準(zhǔn)。空間意識(shí)涉及理解空間關(guān)系、方向、距離和幾何形狀,這些都對(duì)于在物理世界中進(jìn)行行動(dòng)規(guī)劃至關(guān)重要。為了評(píng)估LLMs的空間意識(shí)和空間推理能力,研究人員選擇了一些測(cè)試導(dǎo)航和幾何推理技能的任務(wù),包括自然語(yǔ)言導(dǎo)航、視覺導(dǎo)航和視覺鋪設(shè)。

自然語(yǔ)言導(dǎo)航

自然語(yǔ)言導(dǎo)航涉及通過(guò)隨機(jī)漫步瀏覽底層空間結(jié)構(gòu),旨在識(shí)別先前訪問(wèn)過(guò)的位置。這個(gè)概念受到先前關(guān)于人類認(rèn)知的研究的啟發(fā),其采用了類似于沿著圖結(jié)構(gòu)進(jìn)行隨機(jī)漫步的方法。這個(gè)過(guò)程需要理解循環(huán)閉合,這對(duì)于空間導(dǎo)航至關(guān)重要。

視覺導(dǎo)航

視覺導(dǎo)航任務(wù)向LLMs展示了一個(gè)合成的二維網(wǎng)格世界,挑戰(zhàn)其利用視覺線索進(jìn)行導(dǎo)航。模型必須生成導(dǎo)航指令,以四個(gè)方向(左、右、上、下)移動(dòng),從起點(diǎn)到達(dá)目的地,同時(shí)避開障礙物。這涉及到兩個(gè)子任務(wù):路線規(guī)劃和下一步預(yù)測(cè),需要進(jìn)行多跳空間推理,其中前者更為復(fù)雜。

視覺鋪設(shè)

視覺鋪設(shè)是一個(gè)經(jīng)典的空間推理挑戰(zhàn)。將這個(gè)概念擴(kuò)展到測(cè)試LLMs在有限區(qū)域內(nèi)理解、組織和推理形狀的能力,從而增強(qiáng)了空間推理技能的評(píng)估。任務(wù)涉及一個(gè)帶有未填充單元格和各種多米諾塊的矩形,比如由四個(gè)對(duì)齊的方塊組成的I-多米諾塊。模型必須選擇適當(dāng)?shù)亩嗝字Z塊變體,例如選擇I-多米諾塊的方向,以解決問(wèn)答謎題。

圖片

圖3:帶有掩碼多米諾塊的視覺鋪設(shè)示例。該圖未顯示多米諾塊的旋轉(zhuǎn)和鏡像變體。

思維可視化提示

考慮到人類在導(dǎo)航等任務(wù)中處理空間信息的方式,常常會(huì)創(chuàng)建心智圖像,如地圖,以增強(qiáng)空間意識(shí)或模擬移動(dòng)以指導(dǎo)決策。研究目標(biāo)是喚起LLMs的空間意識(shí),并通過(guò)可視化它們的中間推理步驟來(lái)基于實(shí)際情況進(jìn)行推理。

研究人員引入了“思維可視化”(VoT)提示: "在每個(gè)推理步驟之后可視化狀態(tài)"。這種新的空間推理范式旨在以交錯(cuò)的方式生成推理跡象和可視化結(jié)果。

圖片

圖4:三個(gè)任務(wù)中VoT提示的示例,LLM以交錯(cuò)方式生成推理跡象和可視化來(lái)跟蹤隨時(shí)間變化的狀態(tài)。

論文:https://arxiv.org/pdf/2404.03622.pdf

責(zé)任編輯:龐桂玉 來(lái)源: AIGC社區(qū)
相關(guān)推薦

2014-04-23 09:21:38

大數(shù)據(jù)

2023-10-11 12:32:53

AI模型

2023-05-05 13:29:04

模型推理

2023-06-05 10:01:18

模型測(cè)評(píng)

2025-02-17 14:43:51

2025-02-25 09:49:12

2023-11-15 14:17:23

微軟語(yǔ)言模型AI 模型

2020-03-11 14:39:26

數(shù)據(jù)可視化地圖可視化地理信息

2023-09-15 14:39:09

2023-06-05 13:02:19

OlaGPT語(yǔ)言模型

2017-10-18 16:08:15

可視化交叉驗(yàn)證代碼

2023-06-27 10:09:44

模型AI

2025-05-26 08:40:00

2023-11-27 15:06:24

2023-12-27 10:47:45

Flask數(shù)據(jù)可視化開發(fā)

2017-10-17 11:58:54

R語(yǔ)言UpSetR可視化

2018-05-31 08:25:13

誤區(qū)工具可視化

2024-06-24 12:22:34

2010-09-07 16:28:58

DB2 空間數(shù)據(jù)

2024-09-09 08:31:15

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

y111111国产精品久久久| 亚洲xxxx天美| 国产影视一区| 欧美妇女性影城| 警花观音坐莲激情销魂小说| 亚洲精品久久久蜜桃动漫| 夜夜嗨av一区二区三区网站四季av| 亚洲精品视频在线观看视频| 国产视频1区2区3区| 丝袜美腿av在线| 久久亚洲二区三区| 国产在线拍揄自揄视频不卡99| 久操视频免费在线观看| 亚洲第一福利社区| 91麻豆精品国产91久久久资源速度| 男同互操gay射视频在线看| 日夜干在线视频| 狠狠色狠狠色合久久伊人| 国内精品中文字幕| 日本一卡二卡在线播放| 超碰精品在线| 欧美精品在线一区二区三区| 亚洲自偷自拍熟女另类| 精品欧美色视频网站在线观看| 波多野洁衣一区| 成人中心免费视频| 亚洲不卡在线视频| 精品999日本| 久久精品久久久久| 免费人成又黄又爽又色| 粉嫩精品导航导航| 7777精品伊人久久久大香线蕉 | 国产成人一区二区三区小说| 久久久久香蕉视频| 我不卡神马影院| 亚洲午夜性刺激影院| 欲求不满的岳中文字幕| 久久精品一级| 欧美乱熟臀69xxxxxx| 欧美 国产 小说 另类| 91资源在线观看| 一区二区三区加勒比av| 亚洲乱码一区二区三区三上悠亚| 涩爱av在线播放一区二区| 国产精品一区二区久久精品爱涩 | 免费超爽大片黄| av中文字幕在线观看| 一区免费观看视频| 一本一道久久a久久综合精品| 韩国中文免费在线视频| 91天堂素人约啪| 狠狠色综合色区| 高h调教冰块play男男双性文| 国产麻豆精品久久一二三| 成人激情av在线| 国产精品无码在线播放| 曰本三级在线| 91年精品国产| 久久久综合香蕉尹人综合网| 欧美熟妇另类久久久久久不卡| 国产麻豆成人精品| 91免费在线观看网站| 国产视频在线观看免费| 国产综合色在线| 成人在线一区二区| 国产高清第一页| 高清不卡一区二区| 国产伦精品一区二区三区在线| 黄色片一区二区| av成人老司机| 欧美精品v日韩精品v国产精品| 精华区一区二区三区| 色999久久久精品人人澡69 | 日韩视频在线你懂得| 97国产精品视频| 国产一级做a爰片在线看免费| 欧美日韩午夜| 久久久在线视频| 久久午夜免费视频| youjizzjizz亚洲| 亚洲欧洲精品一区二区三区| 在线精品日韩| 在线你懂的视频| 亚洲福利视频三区| 国产午夜福利视频在线观看| 日本黄色一区| 91精品国产综合久久福利软件| 亚洲在线观看网站| 成人激情自拍| 亚洲人成在线电影| 欧美性生给视频| 狠狠色狠狠色综合日日tαg | 久草在线视频网站| 黄色成人av网| 国产又大又黄又猛| 亚洲天堂av资源在线观看| 亚洲精品国产精品乱码不99按摩 | 国产精品毛片无遮挡高清| 亚洲小视频在线播放| 韩日成人影院| 欧美一区日韩一区| 久久亚洲AV成人无码国产野外| 日韩精品午夜| 午夜精品美女自拍福到在线| 中文在线最新版天堂| 国产sm精品调教视频网站| 日本在线视频不卡| 免费在线你懂的| 色综合久久久久久久久| 91人妻一区二区三区| 免费成人网www| 欧美高清视频免费观看| 日韩电影在线观看一区二区| 国产福利一区二区三区视频在线| 茄子视频成人在线观看| 污片视频在线免费观看| 在线免费一区三区| 欧美xxxxx少妇| 91麻豆国产自产在线观看亚洲| 7m第一福利500精品视频| 国产精品人人妻人人爽| 国产无一区二区| 五十路熟女丰满大屁股| 精品视频在线播放一区二区三区| 亚洲色图日韩av| 天海翼一区二区| 国产精品18久久久久久久久| 午夜久久资源| 在线成人av观看| 亚洲福利在线视频| 欧美黄片一区二区三区| 久久99久久99精品免视看婷婷 | 国产精品露脸自拍| 亚洲色欧美另类| 亚洲福利一区二区三区| 无码人妻一区二区三区一| 亚欧美无遮挡hd高清在线视频| 国产精品福利观看| 色香蕉在线视频| 一个色在线综合| 国产亚洲色婷婷久久| 婷婷综合激情| 91精品国产自产在线老师啪| yw193.com尤物在线| 色94色欧美sute亚洲线路一ni| 粉嫩av懂色av蜜臀av分享| 精品96久久久久久中文字幕无| 91视频最新| 丝袜中文在线| 亚洲第一精品电影| 日韩精品国产一区二区| www.欧美色图| 日本网站免费在线观看| 欧美18免费视频| 欧美性受xxxx白人性爽| 天天插天天干天天操| 香蕉乱码成人久久天堂爱免费| 丰满少妇xbxb毛片日本| 一区福利视频| 久久久久久高清| 欧美日韩免费看片| 亚洲人精品午夜在线观看| 波多野结衣黄色| 欧美国产日韩精品免费观看| 免费一级特黄录像| 91亚洲自偷观看高清| 91免费的视频在线播放| 日本一本在线免费福利| 亚洲国产精品小视频| 91精品国产乱码久久久张津瑜| 91蝌蚪porny| 中文字幕欧美人妻精品一区| 99精品一区| 99久久一区三区四区免费| xxxcom在线观看| 亚洲另类图片色| 综合久久中文字幕| 亚洲另类色综合网站| 亚洲天堂美女视频| 日韩综合一区二区| av资源站久久亚洲| 秋霞精品一区二区三区| 久久久国产午夜精品| 欧美日韩大尺度| 欧美xxav| 国产福利久久精品| 伊人久久综合一区二区| 最好看的2019年中文视频| 国产精品高潮呻吟av| 亚洲一区在线视频| 欧美色图亚洲激情| 久久99久久久久久久久久久| 欧美成人精品免费| 久久99青青| 91精品国产一区二区三区动漫| 亚洲欧洲自拍| 精品国产一区二区三区四区在线观看 | 日本一区二区在线视频| 六九午夜精品视频| 久久久欧美一区二区| 欧美色图另类| 3d动漫精品啪啪一区二区竹菊| 国产精品美女毛片真酒店| 中文字幕乱码亚洲精品一区| 人妻互换一二三区激情视频| 日韩精品一区第一页| 老司机午夜网站| 国产一区二区三区天码| 国产精品福利视频| www.一区| 2019中文字幕在线观看| sm国产在线调教视频| 亚洲女同精品视频| 免费观看a视频| 欧美精品国产精品| 999视频在线| 亚洲成人1区2区| 日韩国产第一页| 久久久久高清精品| 88av在线播放| 国产黄色精品网站| 少妇一级淫免费播放| 久久久精品午夜少妇| 欧美无砖专区免费| 91超碰成人| 亚洲三区四区| 国产精品片aa在线观看| 国产成人av一区二区三区| 青青在线精品| 国产精品av在线播放| 17videosex性欧美| 欧美国产欧美亚洲国产日韩mv天天看完整| av大片在线播放| 亚洲摸下面视频| 少妇人妻精品一区二区三区| 日韩精品一区二区三区视频播放| 国产一区二区三区中文字幕| 欧美影院精品一区| 午夜久久久久久久久久影院| 欧美日韩亚洲精品内裤| 日本中文字幕网| 亚洲一区二区3| 欧美日韩在线国产| 亚洲欧美电影一区二区| 中日韩一级黄色片| 国产精品久久久一本精品| www.日本高清视频| 国产欧美视频在线观看| 在线播放精品一区二区三区| 中文字幕久久网| 欧美综合亚洲图片综合区| 日韩久久中文字幕| 欧美日韩精品二区| www.com国产| 色综合一区二区三区| 国产精品视频123| 色哟哟一区二区三区| 无码人妻精品一区二区三区9厂| 日韩欧美精品免费在线| 国产嫩bbwbbw高潮| 色偷偷久久一区二区三区| 日本成人一级片| 欧美丝袜丝交足nylons| 亚洲视频在线观看免费视频| 欧美喷潮久久久xxxxx| 亚洲中文字幕在线观看| 7777精品伊人久久久大香线蕉最新版 | 你懂的免费在线观看| 亚洲性生活视频| 77777影视视频在线观看| 精品国产一区二区三区久久久狼| 91蜜桃在线视频| 久久免费高清视频| 最近在线中文字幕| 国产精品视频在线观看| 国产一区二区| 国产伦精品一区二区三区在线| 亚洲老女人视频免费| 日本欧美精品久久久| 9999国产精品| 无码人妻少妇伦在线电影| 国产亚洲网站| 三上悠亚av一区二区三区| 国产精品888| 国产激情在线免费观看| 国产精品嫩草99a| 久久免费视频6| 91国产视频在线观看| 国产女同91疯狂高潮互磨| 亚洲成人a级网| 二人午夜免费观看在线视频| 美女扒开尿口让男人操亚洲视频网站| 超黄网站在线观看| 国产精品jvid在线观看蜜臀| 国产一区二区三区国产精品| 久久久久欧美| 亚洲精品小说| 欧美成人xxxxx| 精品伊人久久久久7777人| 亚洲欧美高清在线| 中文字幕国产精品一区二区| 久久久久成人网站| 欧美亚洲高清一区二区三区不卡| www.黄色一片| 国产一区二区动漫| 国产盗摄在线视频网站| 国产精品第七十二页| 一区二区三区亚洲变态调教大结局| 国产午夜精品一区| 国产精品99一区二区三| 黄色动漫在线免费看| 国产一区91精品张津瑜| 黄色aaa视频| 亚洲一区二区三区在线看| 一区二区视频免费| 国产视频精品xxxx| 羞羞污视频在线观看| 国产精品青草久久久久福利99| 伦理一区二区| japanese在线播放| 免费看日韩精品| 国产三级视频网站| 亚洲午夜久久久久中文字幕久| 91九色蝌蚪91por成人| 国产偷亚洲偷欧美偷精品| 青春草视频在线| 91在线视频九色| 日韩欧美自拍| 欧美日韩大尺度| 26uuuu精品一区二区| 18精品爽视频在线观看| 欧美一级理论性理论a| 午夜视频成人| 国产精品久久久久久久久免费看| 青青一区二区| 高清欧美精品xxxxx| 国产91精品一区二区麻豆亚洲| 亚洲综合久久av一区二区三区| 欧美主播一区二区三区| 黄色影院在线播放| 欧美最顶级丰满的aⅴ艳星| 好吊妞国产欧美日韩免费观看网站 | 日韩欧美亚洲另类| 中文字幕一区二区三区乱码在线| 伊人成年综合网| 国产一区二区三区在线| 自拍偷自拍亚洲精品被多人伦好爽| 久久九九视频| 亚洲影音先锋| www.中文字幕av| 色综合 综合色| 久草福利在线| 国产成人精品电影久久久| 精品在线观看入口| 中文字幕国产传媒| 中文字幕一区三区| 国产精品久久久久久久久毛片| 蜜臀久久99精品久久久无需会员 | 欧美一区二区成人| wwwav在线| 国产伦精品一区二区三区免费视频| 韩国一区二区三区在线观看| 黄色国产在线视频| 丰满岳妇乱一区二区三区| 免费在线黄色电影| 国产精品色午夜在线观看| 天天久久综合| 日本美女久久久| 亚洲成人av免费| 欧美zzoo| 国产欧美最新羞羞视频在线观看| 99热国内精品永久免费观看| 久久人人爽人人片| 午夜精品久久久久久久99樱桃| 亚州视频一区二区三区| 国产福利成人在线| 99久久婷婷| 波多野结衣一二三区| 色94色欧美sute亚洲13| 黄a在线观看| 国产精品一区免费观看| 久久男女视频| 午夜激情福利网| 欧美精品一区二区三区在线| 中文字幕资源网在线观看免费 | 欧美日韩国产欧| 在线黄色免费网站| 欧美亚洲自拍偷拍| 在线网址91| 欧洲一区二区日韩在线视频观看免费 | 国产麻豆精品久久| 欧美视频亚洲图片| 午夜精品福利久久久| 中文字幕在线播放| 成人免费视频网站入口| 久久激情久久| 欧美极品视频在线观看| 亚洲人成人99网站| 综合中文字幕| 国产色视频在线播放|