AI正在偷走白領(lǐng)工作!OpenAI狂砸10億教AI上班,你的完美繼任者即將上崗
AI正在接管白領(lǐng)工作嗎?
今年5月,Anthropic CEO Dario Amodei曾表示:AI有可能在未來1—5年內(nèi)消滅一半的入門級白領(lǐng)職位,并使美國失業(yè)率上漲到10—20%。
這場史無前例的崗位大替代,引發(fā)了普遍擔(dān)憂。
有網(wǎng)友認為,白領(lǐng)職業(yè),在未來3年內(nèi)可能會大規(guī)模消失。

還有網(wǎng)友認為,受到AI沖擊的,不只是底層或者入門級崗位,也包括管理職位。

Anthropic、OpenAI,以及全球頂尖AI實驗室正在加速這場「AI風(fēng)暴」的到來。
他們把大模型帶進辦公室,讓其學(xué)習(xí)各種應(yīng)用,比如:
Salesforce的客戶關(guān)系管理軟件;Zendesk的客戶支持軟件;Cerner的健康記錄應(yīng)用等。
目標是教會AI處理白領(lǐng)工作中一些繁瑣、復(fù)雜的任務(wù)。
他們?yōu)檫@場AI訓(xùn)練,準備了數(shù)十億美元級別的投入。
一年投入10億美元 教AI像人類一樣工作
據(jù)透露,Anthropic、OpenAI等大廠,已經(jīng)為AI準備了每年10億美元的「專項資金」,用于教會AI像人類一樣工作:
Anthropic領(lǐng)導(dǎo)層計劃在未來一年,為克隆版企業(yè)應(yīng)用投入10億美元,它們被稱為強化學(xué)習(xí)環(huán)境(RL環(huán)境)。
OpenAI也計劃今年在數(shù)據(jù)相關(guān)方面投入10億美元,包括向人類專家支付的報酬以及RL環(huán)境費用,并預(yù)測到2030年這一數(shù)字將增至80億美元。
這些AI「教育費用」,還在不斷上升。
如果這些方法成功,不久將有望幫助OpenAI、Anthropic突破近期在采用傳統(tǒng)訓(xùn)練技術(shù)時遇到的一些瓶頸。
而且,還可以為它們開辟新的變現(xiàn)路徑,比如銷售職場軟件,接管人類電腦并代其操作應(yīng)用的AI智能體(agent),利用AI開發(fā)熱門企業(yè)應(yīng)用的新版本等。
Anthropic CEO Dario Amodei曾將這類產(chǎn)品稱為「虛擬協(xié)作伙伴」,稱它們可以與人類并肩工作,并使用與人類相同的應(yīng)用。
但要實現(xiàn)起來,仍然是困難重重。
Turing的前沿數(shù)據(jù)項目負責(zé)人Anshul Bhagi指出了其中的諸多繁雜細節(jié)。
比如,要教會AI處理客戶關(guān)系管理,不僅要教會它在Salesforce上搜索潛在客戶,找出最有潛力的線索/客戶并發(fā)送跟進郵件預(yù)約初次會面,還要教會它如何使用LinkedIn、Calendly、Gmail等應(yīng)用。

為了驗證任務(wù)完成情況,Turing還會把整體任務(wù)拆分為更小的步驟,并創(chuàng)建一套評估標準(rubric),來檢查AI模型是否正確地執(zhí)行了每一步。
以Salesforce應(yīng)用為例,這套評估標準可能包括的檢查點有:
模型是否已按上次聯(lián)系日期篩選了Salesforce數(shù)據(jù)庫;
是否發(fā)送了帶有Calendly鏈接的電子郵件;
是否將潛在客戶的線索狀態(tài)更新為「重新接洽」(re-engaged)等。
雖然以上工作仍處于早期,但各個AI實驗室似乎準備為此投入大量資金。
據(jù)專業(yè)人員分析,目前,Anthropic在后訓(xùn)練階段(在初始訓(xùn)練之后,用于改進模型的后期微調(diào)、優(yōu)化等)的預(yù)算中,用于RL環(huán)境的比例不到10%。
有投資人表示,按照目前趨勢,最早到明年,在后訓(xùn)練預(yù)算中對RL環(huán)境的投入可能會提高到更高的比例。
其中一個因素是雇用人類專家的成本越來越高。
為OpenAI等公司提供專家服務(wù)的Labelbox,曾在7月份表示,其大約20%的專家合同工時薪超過90美元,近10%的時薪超過120美元。
Labelbox預(yù)計,在接下來的一年半時間里,這兩類專家的報酬將上升到每小時150—250美元。
「RL環(huán)境」構(gòu)建讓AI學(xué)習(xí)的「真實世界」
據(jù)Turing CEO Jonathan Siddharth稱,他們已經(jīng)構(gòu)建了超過1,000個RL環(huán)境,包括Airbnb、Zendesk和Microsoft Excel的復(fù)制版。
Turing計劃將這些RL環(huán)境出售給客戶,并配套提供100—500個示例任務(wù),供AI模型在模擬應(yīng)用中嘗試,以及用于驗證模型是否正確完成任務(wù)的方法。
近幾個月來,在RL環(huán)境服務(wù)領(lǐng)域,Turing的競爭對手,如Scale、Surge、Mercor和Invisible Technologies都加入了進來,還有一些新創(chuàng)公司專門向大型AI開發(fā)者銷售RL環(huán)境。
Surge創(chuàng)始人兼CEO Edwin Chen認為,OpenAI、Anthropic改進模型的方法「映照了人類的學(xué)習(xí)方式」。
對于模型來說,RL環(huán)境就好比讓模型「置身真實世界」。

除了RL環(huán)境,AI開發(fā)者在強化學(xué)習(xí)過程中,還會通過讓模型學(xué)習(xí)精心整理的難題答案示例,比如競賽編程問題或博士級生物學(xué)問題,來向模型教授該領(lǐng)域的新技能或知識。
AI訓(xùn)練正在「偷師」各領(lǐng)域?qū)<?/span>
隨著AI模型能力的提升,數(shù)據(jù)標注公司雇傭的人群,已經(jīng)從攻讀碩士和博士的學(xué)生,轉(zhuǎn)向在細分領(lǐng)域擁有多年經(jīng)驗的在職專業(yè)人士。
看看近期Turing的一份雇傭?qū)<仪鍐危?/span>
一名NASA的數(shù)據(jù)科學(xué)家
一名為能源部項目工作的化學(xué)家
一名放射科住院醫(yī)師
一名在私募股權(quán)工作的副總裁
他們的職責(zé)是使用特定應(yīng)用完成真實世界任務(wù),以供AI觀摩學(xué)習(xí)。
Bhagi舉例說,某家AI公司可能想教模型了解,在一個Excel文件中,稅率假設(shè)的變化,會如何影響折現(xiàn)現(xiàn)金流(DCF)分析的其余部分。
為了教會AI這一點,首先,Turing會要求其合同工解決這道DCF問題,并得到一個可用于核對準確性的單一答案,例如一個股價。
隨后,開發(fā)者可讓模型對同一DCF任務(wù)嘗試數(shù)十次,篩選出其與人類專家得出相同股價的實例,用作正確示例來訓(xùn)練模型。
這樣,模型開發(fā)者就能快速拿到更多該任務(wù)的正確示例用來訓(xùn)練AI。
如今,OpenAI等頂尖AI公司,都在積極從各行各業(yè)收集類似的示例,無論是醫(yī)學(xué),還是法律,均在此列。
隨著AI對于各領(lǐng)域?qū)I(yè)知識的學(xué)習(xí),OpenAI的一位高級管理人員曾私下表示,他們預(yù)計未來「整個經(jīng)濟」,將在某種程度上變成一臺「RL機器」。
AI可能會基于這些記錄來訓(xùn)練,而這些記錄呈現(xiàn)了各領(lǐng)域?qū)I(yè)人士如何在其設(shè)備上處理日常工作。
當AI學(xué)習(xí)到了各領(lǐng)域的專業(yè)知識以及如何使用職場應(yīng)用,下一步可能就是逐步接管各行各業(yè)的人類工作崗位。
你做好準備了嗎?






























