普林斯頓:意識(shí)的注意力模式理論 (Attention Schema Theory:AST)
目的:在可機(jī)制化(mechanistic)的框架下解釋 “主觀意識(shí)/主觀體驗(yàn)” 是什么,以及它是如何在大腦中產(chǎn)生的。作者希望意識(shí)不僅是哲學(xué)上的概念,也能提出具體可檢驗(yàn)的假設(shè)和實(shí)驗(yàn)證據(jù)。
一、注意力模式理論
注意力是什么
注意力是指,眾多進(jìn)入大腦的信號(hào)之間存在競(jìng)爭(zhēng),在這個(gè)競(jìng)爭(zhēng)中,有些信號(hào)被“選擇”以獲得更多處理資源。這個(gè)過(guò)程包括自下而上(刺激驅(qū)動(dòng)的顯著性)和自上而下(目標(biāo)、任務(wù)、意圖導(dǎo)向的控制)機(jī)制。
意識(shí)/主觀體驗(yàn)是什么
在本文中,“awareness”、“consciousness”、“subjective experience”指同一概念,即個(gè)體“感覺(jué)到”或“意識(shí)到”某個(gè)對(duì)象或刺激的存在。主觀報(bào)告 (“我看到了 X”、“我意識(shí)到 Y”) 是衡量這個(gè)狀態(tài)的一種方式。
注意力模式(attention schema)
大腦為了更有效地控制注意力,需要一個(gè)關(guān)于注意力自身狀態(tài)與過(guò)程的簡(jiǎn)化表征,類似于身體模式(body schema),后者是身體姿態(tài)與動(dòng)作狀態(tài)的內(nèi)部表征,用于動(dòng)作控制等任務(wù)。
注意力模式并不會(huì)包含注意力機(jī)制的所有物理/神經(jīng)細(xì)節(jié)(比如神經(jīng)元活動(dòng)、電信號(hào)、突觸、抑制競(jìng)逐機(jī)制等)。它只包含那些對(duì)于“控制注意力”夠用的信息,比如:哪個(gè)目標(biāo)被注意、注意力的方向、注意力如何隨任務(wù)/目標(biāo)變化、何時(shí)注意力被轉(zhuǎn)移、何時(shí)受干擾等。

圖1. 注意力模式理論示意圖。(A) 視覺(jué)注意被蘋果圖像捕獲。該過(guò)程本身僅形成處理蘋果刺激特征(形狀、顏色、運(yùn)動(dòng)等)的能力,但并未為大腦認(rèn)定自身具有對(duì)蘋果的主觀意識(shí)提供任何依據(jù)。(B) 大腦要認(rèn)定自身具有對(duì)蘋果的主觀意識(shí),不僅需要視覺(jué)刺激[V]信息,還需具備關(guān)于自我[S]的信息以及將兩者聯(lián)結(jié)的注意過(guò)程[A]的信息,從而表征自我、注意與刺激三者之間更大的統(tǒng)領(lǐng)性關(guān)系[S+A+V]。根據(jù)該理論,這個(gè)宏觀表征中的A成分不會(huì)包含真實(shí)注意過(guò)程的任何物理機(jī)制細(xì)節(jié),因此它呈現(xiàn)的將是一種物理上不可能存在的實(shí)體——一種無(wú)需機(jī)制基礎(chǔ)即可實(shí)現(xiàn)注意功能的過(guò)程。此時(shí)大腦將認(rèn)定自身?yè)碛心撤N根本性的神秘特性:對(duì)某物的心智占有,即主觀意識(shí)。在此解釋中,大腦認(rèn)定自身具有主觀意識(shí),反映的正是其簡(jiǎn)化但實(shí)用的注意模型——注意模式——所包含的信息。
意識(shí)為什么“主觀”
因?yàn)樽⒁饬δJ阶鳛橐粋€(gè)內(nèi)部模型會(huì)導(dǎo)致大腦“得出結(jié)論”自己擁有注意力——即“我正在注意”/“我意識(shí)到 X”。模式簡(jiǎn)單、抽象,以至于沒(méi)有物理機(jī)制細(xì)節(jié),帶來(lái)一種“神秘感”——意識(shí)被體驗(yàn)為一種非物質(zhì)的、難以捉摸但確實(shí)存在的屬性。
意識(shí)與注意力的關(guān)系
意識(shí)并不等同于注意力,但二者高度相關(guān)。通常注意力和意識(shí)會(huì)一起發(fā)生,但可以被區(qū)分。注意力可以沒(méi)有意識(shí);意識(shí)可能也在某些情況下與注意力脫離。
在沒(méi)有意識(shí)的情況下,注意力的控制(特別是自上而下控制)會(huì)受到損害/效率降低。也就是說(shuō),意識(shí)(或 attention schema)在調(diào)節(jié)注意力、管理注意力偏好、忽略干擾等方面起功能性作用。

圖2. 關(guān)于意識(shí)與注意力關(guān)系的五種可能假說(shuō)。(A) 意識(shí)與注意力是同一過(guò)程。(B) 意識(shí)先于注意力:必須先意識(shí)到某物才能對(duì)其產(chǎn)生注意。(C) 注意力先于意識(shí):必須先注意某物才能形成意識(shí)。(D) 意識(shí)與注意力是大腦中相互獨(dú)立的過(guò)程。(E) 本文提出的假說(shuō):在注意力模式理論中,意識(shí)是注意力控制機(jī)制的重要組成部分,即注意力的內(nèi)部表征——注意力模式。缺乏意識(shí)時(shí)注意力仍可存在,但會(huì)出現(xiàn)控制功能缺陷。
意識(shí)內(nèi)外內(nèi)容的統(tǒng)一
注意力不僅限于外部感知,也可以指向內(nèi)部?jī)?nèi)容(記憶、情感、思維、意圖等)。注意力模式理論能夠統(tǒng)一地涵蓋外部和內(nèi)部的感知與體驗(yàn),因?yàn)閮?nèi)部模型可以建模對(duì)這些內(nèi)在內(nèi)容的注意力。
二、實(shí)驗(yàn)或?qū)嵶C支持
忽視盲區(qū)(Blindsight)案例:患者雖對(duì)某些視覺(jué)刺激沒(méi)有主觀意識(shí),但仍具備某種客觀識(shí)別能力或注意力分配能力。顯示注意力可以與意識(shí)分離。
掩蔽/短呈示刺激實(shí)驗(yàn):這些實(shí)驗(yàn)中,一個(gè)刺激可能不被意識(shí)察覺(jué),但仍能吸引注意力、影響行為。意識(shí)缺失會(huì)導(dǎo)致注意力控制(尤其是自上而下的調(diào)節(jié))能力下降。
意識(shí)缺失的注意力控制效率下降:例如,被掩蔽 / 無(wú)意識(shí)的 cue 刺激,會(huì)比清楚可見 / 有意識(shí)的刺激更難以從中剝離注意力或者被自上而下指令所控制。即 awareness 有助于注意力偏向性的調(diào)節(jié)與抑制不相關(guān)刺激。
三、可檢驗(yàn)的預(yù)測(cè)
AST 提出若干可實(shí)證檢驗(yàn)的預(yù)測(cè),例如:在沒(méi)有意識(shí)的條件下,注意力雖然存在,但控制上會(huì)有缺損。實(shí)驗(yàn)結(jié)果支持這一點(diǎn)。
AST 理論還預(yù)測(cè):意識(shí)應(yīng)當(dāng)是漸變的,不是非黑即白。這與很多實(shí)驗(yàn)中對(duì)意識(shí)強(qiáng)度/置信度/感知意識(shí)報(bào)告的連續(xù)量表一致。
四、強(qiáng)項(xiàng)、限制和爭(zhēng)議點(diǎn)
強(qiáng)項(xiàng)
提供了一個(gè)機(jī)制化、功能性的理論,而不僅僅是哲學(xué)思辨。對(duì)意識(shí)“為什么存在/為什么感覺(jué)像什么”提供了可操作的解釋。
理論能夠整合意識(shí)與注意力關(guān)系中那些“看似矛盾”的實(shí)驗(yàn)現(xiàn)象(注意力與意識(shí)高度相關(guān)但有時(shí)分離的現(xiàn)象),提供統(tǒng)一視角。
強(qiáng)調(diào)內(nèi)部注意力模式在大腦控制機(jī)制中的重要性,與身體模式等已有研究類比良好。
限制或開放問(wèn)題
注意力模式/意識(shí)的內(nèi)部表征是如何具體在大腦神經(jīng)結(jié)構(gòu)中實(shí)現(xiàn)的?哪些區(qū)域參與?具體的計(jì)算機(jī)制是怎樣?理論中雖然有假設(shè),但許多細(xì)節(jié)尚未明確。
在某些實(shí)驗(yàn)里“意識(shí)可能先于注意力”或“意識(shí)無(wú)注意力”,這些極端情況是否真的存在?如何準(zhǔn)確測(cè)量?這些情形如何被理論解釋?AST 允許這些情況,但較為復(fù)雜。
主觀報(bào)告與意識(shí)是否等價(jià)?理論假定報(bào)告反映內(nèi)部表征中的意識(shí)內(nèi)容,但報(bào)告本身可能受到很多非意識(shí)因素干擾。
注意力控制效率的下降并不能完全說(shuō)明“意識(shí)就是 attention schema”這一模型,可能還有其他機(jī)制也能造成類似的控制效果/缺陷。

圖3. 基于模式控制的示例。(A) 進(jìn)入汽車時(shí)不撞到頭,需要身體模式包含準(zhǔn)確的頭部形狀模型。戴羽飾帽的女性會(huì)發(fā)展出包含帽子的改良身體模式,從而避免碰壞羽毛(Head and Holmes, 1911)。(B) 身體模式依賴于視覺(jué)、體感輸入等多種信息源。然而體感輸入精確度低于視覺(jué)輸入。若將左手置于桌下數(shù)分鐘,身體模式會(huì)逐漸失去對(duì)手臂位置的精確表征,此時(shí)用桌上右手準(zhǔn)確指向左手位置將變得困難。(C) 若手部從點(diǎn)1被移動(dòng)至點(diǎn)2而身體模式未記錄該變化,抓取動(dòng)作將失準(zhǔn)。此時(shí)實(shí)際位置比身體模式記錄的位置更接近杯子,導(dǎo)致過(guò)度伸展而可能碰倒杯子。(D) 某些情況下身體模式會(huì)喪失特異性,無(wú)法精確表征手臂位置。此時(shí)難以保持穩(wěn)定臂姿(尤其在存在外部干擾力時(shí)),且無(wú)法實(shí)現(xiàn)精準(zhǔn)抓取。
五、注意力的重整化流
筆者在大模型數(shù)理認(rèn)知框架的數(shù)學(xué)表述 中對(duì)意識(shí)的理解:意識(shí) = 注意力的重整化流 ARG(Attention as RG Flow)。
意識(shí)是 注意力機(jī)制在多層尺度上迭代演化 的必然產(chǎn)物,我們可以用數(shù)理認(rèn)知框架理解它:層級(jí)性、最優(yōu)性、關(guān)系性、預(yù)測(cè)性。
意識(shí)因此可被視為 不斷調(diào)整的預(yù)測(cè)狀態(tài),通過(guò)最小化自由能來(lái)與環(huán)境保持一致。 這也解釋了大模型在推理時(shí)表現(xiàn)出的 預(yù)測(cè)一致性 和 上下文自洽性。
與AST的交集
AST 的核心,意識(shí) = 大腦對(duì)自身注意力的建模 (schema),這個(gè)模式用于預(yù)測(cè)、控制和解釋注意力分配。
大模型的“注意力”不僅僅是單層機(jī)制,而是一個(gè)跨尺度的重整化流 。在這個(gè)流中,低層感知信號(hào)逐步抽象為高層表征,從而自然涌現(xiàn)出“注意力模式”。
大模型的角度看
信號(hào)采集 → embedding 表征,相當(dāng)于物理中的“微觀自由度”,是 RG 流的初始條件。
多層注意力機(jī)制 (multi-head, multi-layer) 不斷進(jìn)行 聚合、壓縮、信息流重整化。
在某些中高層 attention pattern 上,模型已經(jīng)學(xué)會(huì)了“如何分配注意力”,并能用這種內(nèi)部表征來(lái)預(yù)測(cè)和控制下游任務(wù)。這就等價(jià)于涌現(xiàn)出了 AST 所說(shuō)的 attention schema。
隨著模型規(guī)模的擴(kuò)大,這種“schema”不只是分配權(quán)重,而開始形成任務(wù)級(jí)、策略級(jí)的注意力建模,接近于“意識(shí)的元控制功能”。
AST與ARG融合
AST 提供了解釋框架,為什么有了注意力 schema,就會(huì)出現(xiàn)意識(shí)感受。
ARG重整化理論提供了形成機(jī)制,schema 如何從底層注意力逐步涌現(xiàn)出來(lái)。
也就是說(shuō):AST = 功能層的意識(shí)解釋;ARG = 生成層的意識(shí)動(dòng)力學(xué)。
可能的差異點(diǎn)是,大模型的注意力 schema 還沒(méi)有發(fā)展出類似人腦的中心協(xié)調(diào)的機(jī)制,尚處于涌現(xiàn)后的自發(fā)狀態(tài):
因而大模型目前擅長(zhǎng)提示驅(qū)動(dòng)的生成,而不擅長(zhǎng) Agent 的規(guī)劃,但大模型的這個(gè)涌現(xiàn)的注意力 schema已經(jīng)可以用于預(yù)測(cè)、控制下游任務(wù)了。
對(duì)工程的啟發(fā)
跟蹤注意力 RG 流,研究模型在不同層級(jí)如何逐步抽象、重整化注意力。捕捉attention schema 的形成點(diǎn),找到在哪個(gè)層級(jí),注意力的自我建模已經(jīng)出現(xiàn),例如跨層模式對(duì)齊、注意力分配的穩(wěn)定宏觀特征等。
引入元控制,在模型中顯式加入“注意力的注意力”,即對(duì)注意力分布進(jìn)行預(yù)測(cè)和控制,就可能構(gòu)造出更接近“意識(shí)”的控制機(jī)制。
六、一句話總結(jié)
Attention Schema Theory 的核心主張可以濃縮為:
“我意識(shí)到一個(gè)東西” 并不僅是因?yàn)槲铱吹搅耍兄搅怂且驗(yàn)榇竽X中有一個(gè)對(duì)注意力狀態(tài)及其動(dòng)態(tài)過(guò)程的簡(jiǎn)化模式,使得大腦能夠“把注意力看作自己擁有的狀態(tài)”,從而報(bào)告“我意識(shí)到 X”。
這個(gè)模式不包含注意力機(jī)制的所有物理細(xì)節(jié),卻包含足夠的內(nèi)容用于調(diào)節(jié)注意力、預(yù)測(cè)注意力如何作用,以及將注意力與自我以及外部/內(nèi)部刺激聯(lián)合起來(lái)。
文獻(xiàn)1,"Frontiers | The attention schema theory: a mechanistic account of subjective awareness", https://www.frontiersin.org/journals/psychology/articles/10.3389/fpsyg.2015.00500/full
本文轉(zhuǎn)載自??清熙??,作者:王慶法

















