DeepSeek V3“報(bào)錯(cuò)家門(mén)”:我是ChatGPT
要說(shuō)這兩天大模型圈的頂流話(huà)題,那絕對(duì)是非DeepSeek V3莫屬了。
不過(guò)在網(wǎng)友們紛紛測(cè)試之際,有個(gè)bug也成了熱議的焦點(diǎn)——
只是少了一個(gè)問(wèn)號(hào),DeepSeek V3竟然稱(chēng)自己是ChatGPT。

甚至讓它講個(gè)笑話(huà),生成的結(jié)果也是跟ChatGPT一樣:

加之DeepSeek V3這次爆火的一個(gè)亮點(diǎn),就是訓(xùn)練只花了557.6萬(wàn)美元的成本。
于是乎,有人就開(kāi)始懷疑了:它不會(huì)是在ChatGPT的輸出基礎(chǔ)上訓(xùn)練的吧?
好巧不巧,Altman也發(fā)了一個(gè)狀態(tài),似乎在暗諷著什么……

不過(guò)DeepSeek V3并非是第一個(gè)出現(xiàn)“報(bào)錯(cuò)家門(mén)”的大模型。
例如Gemini就曾說(shuō)過(guò)自己是百度的文心一言……

那么這到底是怎么一回事?
為什么DeepSeek V3報(bào)錯(cuò)家門(mén)?
首先需要強(qiáng)調(diào)的一點(diǎn)是,從目前網(wǎng)友們整體討論的觀點(diǎn)來(lái)看,說(shuō)DeepSeek V3是在ChatGPT輸出上訓(xùn)練的可能性不大。

之所以這么說(shuō),正如網(wǎng)友Riley Goodside所總結(jié)的那樣——因?yàn)镃hatGPT的影子無(wú)處不在。
即便DeepSeek V3故意用ChatGPT的輸出做了訓(xùn)練,但這并不重要。所有在ChatGPT之后出現(xiàn)的大模型,幾乎都見(jiàn)過(guò)它。
例如ShareGPT,一個(gè)并不新鮮的ChatGPT對(duì)話(huà)數(shù)據(jù)集,許多人已經(jīng)嘗試在它和其它ChatGPT數(shù)據(jù)源上進(jìn)行調(diào)整。但即便如此,也沒(méi)能出現(xiàn)DeepSeek V3級(jí)別的大模型。

緊接著,Riley Goodside又拿出了DeepSeek V3報(bào)告中的一些證據(jù):
而且要是用了ChatGPT數(shù)據(jù)的話(huà),有些關(guān)于DeepSeek V3質(zhì)量的問(wèn)題是解釋不通的。
例如Pile測(cè)試(基礎(chǔ)模型壓縮Pile的效果),DeepSeek V3得分幾乎與Llama 3.1 405B相當(dāng),這跟它接沒(méi)接觸ChatGPT數(shù)據(jù)無(wú)關(guān)。
而且報(bào)告稱(chēng)95%的GPU-hours用于預(yù)訓(xùn)練基礎(chǔ)模型,即便是跟ChatGPT數(shù)據(jù)有關(guān),那這部分也會(huì)在post-training階段發(fā)生(后5%)。

而比起用沒(méi)用ChatGPT數(shù)據(jù),或許我們應(yīng)當(dāng)更加關(guān)注的是為什么大模型會(huì)頻繁出現(xiàn)“報(bào)錯(cuò)家門(mén)”的問(wèn)題。
TechCrunch針對(duì)這個(gè)問(wèn)題給出了一句犀利的點(diǎn)評(píng):
因?yàn)锳I公司們獲取數(shù)據(jù)的地方——網(wǎng)絡(luò),正在充斥著AI垃圾。
畢竟歐盟的一份報(bào)告曾預(yù)測(cè),到2026年,90%的在線(xiàn)內(nèi)容可能是AI生成的。
這種“AI污染”就會(huì)讓“訓(xùn)練數(shù)據(jù)徹底過(guò)濾AI的輸出”變得困難。

AI Now Institute的首席科學(xué)家Heidy Khlaaf則表示:
盡管存在風(fēng)險(xiǎn),開(kāi)發(fā)者依然被從現(xiàn)有AI模型中“蒸餾”知識(shí)所帶來(lái)的成本節(jié)約所吸引。
意外地在ChatGPT或GPT-4輸出上進(jìn)行訓(xùn)練的模型,也不一定會(huì)展示出讓人想起OpenAI定制消息的輸出。
那么現(xiàn)在對(duì)于網(wǎng)友們熱議的問(wèn)題,量子位進(jìn)行了一波實(shí)測(cè),DeepSeek V3目前還沒(méi)有解決這個(gè)bug。
依舊是少了個(gè)問(wèn)號(hào),回答結(jié)果會(huì)不一樣:

DeepSeek V3更多玩法
不過(guò)有一說(shuō)一,絕大部分網(wǎng)友對(duì)于DeepSeek V3的能力是給予了大大的肯定。
從各路AI大佬們集體直呼“優(yōu)雅”中就能印證這一點(diǎn)。
而就在這兩天,網(wǎng)友們陸續(xù)曬出了更多DeepSeek V3加持的實(shí)用玩法。
例如有網(wǎng)友拿DeepSeek V3和Claude Sonnet 3.5一決高下,在Scroll Hub中分別用它倆創(chuàng)建網(wǎng)站:

博主在測(cè)試之后,認(rèn)為DeepSeek V3完全勝出!
還有網(wǎng)友分享了用DeepSeek V3在AI視頻編輯器中的體驗(yàn)。
他表示以后不用再在FFMPEG命令上浪費(fèi)時(shí)間了,DeepSeek V3不僅免費(fèi),還能改變你的工作流程:

AI編程神器Cursor也能跟DeepSeek V3結(jié)合,來(lái)看一個(gè)做貪吃蛇的案例:

嗯,DeepSeek V3是有點(diǎn)好用在身上的。
One More Thing
對(duì)于此前公布的53頁(yè)論文,也有網(wǎng)友關(guān)注到了一個(gè)非技術(shù)性的細(xì)節(jié)——
貢獻(xiàn)列表中,不僅展示了技術(shù)人員,還有數(shù)據(jù)注釋和商務(wù)等工作人員:

網(wǎng)友認(rèn)為這種做法非常符合DeepSeek的調(diào)性:
































