AI 時代可計算的情緒流動與傳染,WELD 數(shù)據(jù)集揭示的群體動力學(xué)
情感計算(Affective Computing)這個名字聽起來有點浪漫,但它的野心卻很務(wù)實,讓機(jī)器不僅能“看懂”人類的表情,還能理解背后的情緒邏輯。
過去二十年,研究者們在實驗室里訓(xùn)練模型識別“笑臉”“皺眉”,準(zhǔn)確率節(jié)節(jié)攀升。可是實驗室的笑容往往是“擺拍”的,憤怒也多半是“演技派”的。現(xiàn)實世界的情緒可沒那么配合,它們更像是股市行情,瞬息萬變,受環(huán)境、關(guān)系、甚至天氣影響。于是情感計算正經(jīng)歷一場轉(zhuǎn)向,從實驗室走向真實世界。
問題是真實世界的數(shù)據(jù)難得得很,大多數(shù)現(xiàn)有數(shù)據(jù)集要么是短視頻,要么是靜態(tài)圖片,捕捉的是“瞬間”,而不是“過程”。這就像你想研究氣候,卻只有幾張晴天和雨天的照片,根本無法推演季節(jié)變化。
尤其在職場這種小群體環(huán)境里,情緒的流動更復(fù)雜,同事間的合作、領(lǐng)導(dǎo)的決策、項目的壓力,都會在表情里留下痕跡。缺乏長期、自然場景下的情緒數(shù)據(jù),成了情感計算應(yīng)用落地的一大痛點。
職場場景的重要性不言而喻。情緒不僅影響個人的績效,還會左右團(tuán)隊的協(xié)作氛圍,甚至決定一個組織的創(chuàng)新力和凝聚力。一個總是愁眉苦臉的團(tuán)隊領(lǐng)導(dǎo),可能比 KPI 下滑更快地摧毀士氣。反之,積極的情緒氛圍能讓團(tuán)隊更有韌性。換句話說,職場情緒是企業(yè)健康的“隱形指標(biāo)”。
更巧的是,COVID-19 疫情給了研究者一個前所未有的“自然實驗”。封城、遠(yuǎn)程辦公、政策反復(fù),這些突發(fā)事件像一場場“情緒沖擊波”,讓研究者得以觀察人們在極端環(huán)境下的情緒動態(tài)。WELD 數(shù)據(jù)集正是在這樣的背景下誕生,它跨越了疫情前后,完整記錄了職場情緒的起伏。
這項研究的專家 Xiao Sun 是 IEEE 高級會員,長期深耕情感計算與人工智能。他所在的合肥工業(yè)大學(xué)情緒計算與智能機(jī)器實驗室,正是國內(nèi)在這一領(lǐng)域的前沿力量。換句話說,這不是一時興起的“副業(yè)”,而是有扎實積累的系統(tǒng)性研究。
1.現(xiàn)有數(shù)據(jù)集的局限
要理解 WELD 的價值,得先看看它的“前輩們”。
實驗室數(shù)據(jù)集是情感計算的“啟蒙老師”。FER2013、CK+、MMI 這些名字在學(xué)術(shù)圈如雷貫耳,但它們的問題也顯而易見,表情往往是演員擺出來的,憤怒就得瞪眼、悲傷就得掉淚,夸張得像舞臺劇。更糟糕的是,數(shù)據(jù)時長極短,幾秒鐘的片段根本無法反映情緒的自然流動。
視頻數(shù)據(jù)集看似更進(jìn)一步,比如 AFEW、DFEW,它們提供了帶時間維度的片段。但別忘了,這些片段大多來自電影或電視劇,依舊是“演出來的情緒”。演員的哭笑,和你在工位上因為代碼報錯而皺眉,完全不是一個語境。
生理信號數(shù)據(jù)集則走了另一條路。AMIGOS、MAHNOB-HCI 等集合了 EEG、心電、皮膚電等多模態(tài)信號,科學(xué)味兒十足。但問題是,實驗時長通常只有一兩個小時,參與者坐在實驗室里戴著傳感器,情緒狀態(tài)很難自然。你能想象戴著一堆電極線還要表現(xiàn)“輕松愉快”嗎?
職場研究也不是沒人做過。問卷調(diào)查、體驗采樣(ESM)這些方法常見,但它們依賴自我報告,容易受回憶偏差影響。更別提頻繁填寫問卷會讓參與者疲憊,數(shù)據(jù)質(zhì)量自然打折扣。
最關(guān)鍵的缺口在于縱向研究。現(xiàn)有數(shù)據(jù)集幾乎沒有跨月甚至跨年的情緒追蹤。換句話說,我們知道人們在某個下午可能會開心,但不知道他們在一年內(nèi)的情緒曲線如何起伏。沒有這樣的數(shù)據(jù),就很難回答“情緒慣性”“情緒傳染”這些更深層的問題。
2.WELD 數(shù)據(jù)集的核心貢獻(xiàn)
如果說情感計算的前輩們大多停留在“實驗室里的小劇場”,那么 WELD 就像一部“超長紀(jì)錄片”,把真實職場的情緒波動拍了個底朝天。它的貢獻(xiàn)不僅在于數(shù)據(jù)量大,更在于它捕捉到了情緒的“時間維度”和“社會背景”,讓研究者第一次能像研究氣候一樣研究情緒。
首先是規(guī)模與時長的突破。 WELD 收錄了 733,651 條面部表情記錄,覆蓋 30.5 個月,追蹤了 38 名員工的日常情緒。這意味著研究者不再是看幾秒鐘的“表情片段”,而是能觀察到長達(dá)兩年半的情緒曲線。就像從“快照”升級到“延時攝影”,我們終于能看到情緒如何在日復(fù)一日的工作節(jié)奏中起伏。
其次是疫情覆蓋的獨(dú)特價值。 這套數(shù)據(jù)橫跨了 COVID-19 的關(guān)鍵時期,完整記錄了上海封城、政策反復(fù)等社會事件下的職場情緒波動。比如,封城期間效價顯著下降,解封當(dāng)天情緒則出現(xiàn)“報復(fù)性反彈”。這讓 WELD 成為研究“社會沖擊如何塑造職場情緒”的天然實驗場。
再來看豐富的元數(shù)據(jù)。 WELD 不只是“表情概率”的堆砌,它還附帶了崗位類別、員工離職情況,以及基于管理者評估的大五人格特質(zhì)。換句話說,研究者可以把情緒數(shù)據(jù)和組織行為學(xué)結(jié)合起來,探索“開發(fā)人員和銷售人員的情緒曲線有何不同”“高神經(jīng)質(zhì)員工是否更容易情緒波動”這樣的深層問題。
更令人興奮的是擴(kuò)展情緒指標(biāo)。 研究員基于情感科學(xué)框架,衍生出了 32 項動力學(xué)特征,包括效價、喚醒度、波動性、慣性、可預(yù)測性,甚至還有“情緒傳染強(qiáng)度”。這就像給情緒加上了“物理學(xué)的刻度尺”,讓我們能量化地研究“誰是團(tuán)隊里的情緒放大器”“誰的情緒像鐘擺一樣穩(wěn)定”。
技術(shù)驗證環(huán)節(jié)同樣亮眼。 WELD 成功復(fù)現(xiàn)了經(jīng)典心理學(xué)現(xiàn)象,周末效應(yīng)(效價提升 192%)、晝夜節(jié)律(上午低落、午后回升、傍晚再度下降)。更驚人的是,它在員工離職預(yù)測上達(dá)到了 AUC=1.0 的“滿分表現(xiàn)”,意味著僅憑情緒數(shù)據(jù)就能提前數(shù)月預(yù)測誰可能要走人。對于 HR 來說,這簡直是“情緒版預(yù)警雷達(dá)”。
最后是研究應(yīng)用的廣闊潛力。 WELD 不僅能作為情緒識別的基準(zhǔn)數(shù)據(jù)集,還能推動情緒動力學(xué)研究,幫助理解情緒慣性與傳染機(jī)制;它還能服務(wù)于組織行為預(yù)測,比如團(tuán)隊氛圍監(jiān)測、離職風(fēng)險評估;更進(jìn)一步,它為情緒感知系統(tǒng)設(shè)計提供了真實世界的訓(xùn)練素材,讓未來的人機(jī)交互更懂“人情味”。
3.數(shù)據(jù)采集與處理方法
WELD 的數(shù)據(jù)收集方式,可以說是“無感監(jiān)測”的典范。研究員沒有在員工臉上貼電極,也沒有讓他們每天填幾十份問卷,而是利用辦公室里早已存在的安防攝像頭,悄無聲息地完成了長達(dá) 30.5 個月的情緒追蹤。

圖1。數(shù)據(jù)集概述。(A)顯示30.5個月數(shù)據(jù)收集密度的時間覆蓋率,突出顯示了關(guān)鍵的新冠肺炎事件。(B)按就業(yè)狀況區(qū)分的每位參與者的記錄數(shù)分布(藍(lán)色:在職,紅色:離職)。(C)七種基本情緒的情緒分布。(D) 跨越六個工作類別的角色分布。
參與者來自一家軟件公司,共 38 名員工,涵蓋開發(fā)、管理、QA、產(chǎn)品、銷售和支持等崗位。場景是典型的開放式辦公室,工位成排,經(jīng)理有獨(dú)立桌位,大家在同一個空間里協(xié)作。這樣的環(huán)境天然適合觀察“情緒傳染”,因為一個人的表情很容易被周圍人捕捉到。
采樣機(jī)制也頗為精巧。系統(tǒng)在工作時段(9 點到 18 點)持續(xù)運(yùn)行,每 10 秒對檢測到的人臉采樣一次。換句話說,如果你整天坐在工位上,可能一天就會留下幾百條情緒記錄。相比問卷的“日更”,這簡直是“秒更”。
表情識別系統(tǒng)則是技術(shù)的核心。研究員采用了基于 ResNet-50 的卷積神經(jīng)網(wǎng)絡(luò),并加入注意力機(jī)制來增強(qiáng)對細(xì)微表情的捕捉。更重要的是,他們對模型進(jìn)行了針對亞洲人臉的微調(diào),避免了常見的“跨文化識別偏差”。系統(tǒng)輸出七類情緒的概率分布,中性、開心、悲傷、驚訝、恐懼、厭惡和憤怒。
當(dāng)然,機(jī)器也不是完美的。研究員對 1000 幀圖像進(jìn)行了人工標(biāo)注,結(jié)果顯示模型與人工一致率達(dá)到 88.2%(Cohen’s k=0.84),表現(xiàn)相當(dāng)可靠。誤差主要集中在幾類“難兄難弟”,中性和悲傷容易混淆,恐懼和驚訝也常常傻傻分不清。這些問題其實也反映了人類表情本身的模糊性。
4.元數(shù)據(jù)與擴(kuò)展指標(biāo)
WELD 的另一大亮點是它不僅有“表情”,還有豐富的“背景故事”。
在崗位與層級方面,研究員將 38 名員工分為六大類崗位,細(xì)分為 21 個具體職位,從前端開發(fā)到產(chǎn)品經(jīng)理,從銷售到支持人員一應(yīng)俱全。層級上也有區(qū)分,高管、中層、團(tuán)隊負(fù)責(zé)人、專員和初級員工。這樣的分類讓研究者可以比較不同崗位的情緒特征,比如開發(fā)人員是否比銷售更“面無表情”。
就業(yè)狀態(tài)同樣被記錄下來。38 人中,有 16 人在研究結(jié)束時仍在職,20 人離職,2 人完成實習(xí)。這些信息為“情緒與離職預(yù)測”提供了天然的標(biāo)簽。

圖2:擴(kuò)展的情緒指標(biāo)。(A)波動性與可預(yù)測性的散點圖呈負(fù)相關(guān)(r=-0.58)。(B)情緒慣性的分布中位數(shù)為0.42。(C)基線效價與波動性之間的關(guān)系,表明基線效價為負(fù)的個體波動性更高。(D)在職員工和離職員工的情緒比率比較,揭示了離職員工的恐懼和憤怒情緒升高。
人格特質(zhì)則通過管理者的長期觀察來評估,并映射到大五人格模型(神經(jīng)質(zhì)、外向性、開放性、宜人性、盡責(zé)性)。雖然這種評估帶有一定主觀性,但結(jié)合情緒數(shù)據(jù),能幫助研究者探索“人格與情緒模式”的對應(yīng)關(guān)系。
更令人興奮的是擴(kuò)展的情緒動力學(xué)指標(biāo)。研究員不僅停留在“某一刻的表情”,而是把情緒當(dāng)作時間序列來分析,
效價與喚醒度,通過公式將七類情緒概率映射到二維情緒空間,效價代表愉快程度,喚醒度代表激活水平。
波動性,衡量情緒曲線的起伏幅度,波動大的人可能更情緒化。
慣性,反映情緒的持續(xù)性,數(shù)值高說明一個人的情緒容易“賴著不走”。
可預(yù)測性,通過自回歸模型計算,情緒越穩(wěn)定,未來越容易預(yù)測。
情緒傳染網(wǎng)絡(luò),利用 Granger 因果分析,研究誰的情緒會影響誰。比如,某個經(jīng)理的憤怒可能在幾小時內(nèi)“傳染”給整個團(tuán)隊。
這些指標(biāo)讓 WELD 不再只是一個“表情數(shù)據(jù)庫”,而是一個能揭示情緒動力學(xué)規(guī)律的“社會實驗場”。
5.技術(shù)驗證與實驗結(jié)果
一個數(shù)據(jù)集能不能站得住腳,關(guān)鍵要看它能否經(jīng)得起驗證。WELD 在這方面的表現(xiàn),可以說是“既有科學(xué)味兒,又有驚喜感”。

圖3:情緒模式和技術(shù)驗證。(A)表現(xiàn)出工作場所壓力典型負(fù)偏斜的價格分布。(B)日節(jié)律,工作開始時(上午9-10點)效價最低,午餐時(下午12-1點)達(dá)到峰值。(C)周末效應(yīng)顯示,周末的化合價增加了192%(p<0.001)。(D) 情緒相關(guān)矩陣揭示了預(yù)期關(guān)系(快樂-悲傷反相關(guān):r=-0.62)。
首先,它成功復(fù)現(xiàn)了經(jīng)典心理學(xué)現(xiàn)象。比如,周末效應(yīng),員工在周末的效價(情緒愉快度)比工作日高出整整192%,這幾乎是“科學(xué)版的周末真香定律”。再比如,晝夜節(jié)律,早晨情緒低迷,中午稍有回升,下午再度下滑,傍晚略微恢復(fù),這和我們?nèi)粘5摹霸缟喜幌肷习唷⑽顼埡蠡杌栌⑾掳嗲芭瓮夥拧备叨绕鹾稀8幸馑嫉氖牵咔闆_擊也被清晰捕捉,上海封城期間,員工整體效價顯著下降,解封當(dāng)天則出現(xiàn)了“報復(fù)性反彈”。這些結(jié)果不僅驗證了數(shù)據(jù)的可靠性,也讓人直觀感受到社會事件如何在職場情緒中留下烙印。
其次,WELD 在員工流失預(yù)測上交出了一份堪稱“滿分”的答卷。研究員利用情緒動力學(xué)特征,提前 3 個月就能預(yù)測誰可能離職,預(yù)測性能達(dá)到AUC=1.0。這意味著模型幾乎沒有出錯,堪稱“情緒版預(yù)警雷達(dá)”。對企業(yè)管理者來說,這種能力無疑是夢寐以求的。
再來看人格一致性。研究員將員工的情緒模式與管理者評估的大五人格特質(zhì)進(jìn)行比對,結(jié)果匹配度達(dá)到k=0.72。這說明,一個人的情緒軌跡確實能反映出其人格傾向,比如高神經(jīng)質(zhì)的人更容易情緒波動,外向的人則更常表現(xiàn)積極情緒。
最后是基線模型的表現(xiàn)。研究員用多種模型進(jìn)行了實驗,
在情緒分類任務(wù)上,LSTM 模型的準(zhǔn)確率達(dá)到 91.2%,表現(xiàn)優(yōu)于隨機(jī)森林和 SVM。
在效價預(yù)測上,LSTM 的 R2=0.84,說明它能很好地擬合情緒的連續(xù)變化。
在離職預(yù)測上,模型實現(xiàn)了“完美分類”,再次印證了情緒數(shù)據(jù)的預(yù)測力。
這些結(jié)果不僅展示了 WELD 的科學(xué)價值,也為后續(xù)研究提供了堅實的基準(zhǔn)。
6.應(yīng)用前景
WELD 的潛力遠(yuǎn)不止于“一個大數(shù)據(jù)集”,它更像是一塊“情緒計算的試驗田”,為多個領(lǐng)域打開了新的可能性。
在學(xué)術(shù)研究方面,WELD 可以作為情緒識別的基準(zhǔn)數(shù)據(jù)集,幫助研究者檢驗?zāi)P驮谡鎸崍鼍跋碌聂敯粜浴M瑫r,它還為情緒動力學(xué)建模提供了前所未有的素材,讓學(xué)者們能夠探索情緒慣性、波動性和傳染效應(yīng)等深層機(jī)制。
在組織管理層面,WELD 的價值更是直擊痛點。企業(yè)可以利用類似的數(shù)據(jù)監(jiān)測員工幸福感,及時發(fā)現(xiàn)團(tuán)隊情緒低谷,甚至提前預(yù)警離職風(fēng)險。相比傳統(tǒng)的滿意度調(diào)查,這種基于情緒軌跡的分析更客觀、更實時。
在人機(jī)交互領(lǐng)域,WELD 為設(shè)計“懂你”的系統(tǒng)提供了真實世界的訓(xùn)練素材。未來的智能界面不再是冷冰冰的工具,而是能根據(jù)用戶情緒自適應(yīng)調(diào)整,比如在你焦躁時降低信息密度,在你愉快時推送更多互動。
更廣闊的前景在于跨學(xué)科探索。心理學(xué)家可以用它研究情緒與人格的關(guān)系,社會學(xué)家可以分析情緒在小群體中的傳播模式,而 AI 研究者則能借此推動情緒感知算法的進(jìn)化。換句話說,WELD 不僅是計算機(jī)科學(xué)的成果,更是心理學(xué)、社會學(xué)與人工智能的交匯點。
參考資料:???https://arxiv.org/pdf/2510.15221??
本文轉(zhuǎn)載自???波動智能???,作者:FlerkenS?

















