對想從事大模型領域的技術開發(fā)者的建議或看法 原創(chuàng)
?“ 學習技術之前,我們首先要搞明白的是我們想要什么,想做什么,而不是稀里糊涂的去學習技術”
大模型技術作為目前比較火的技術之一,有很多技術人員想從事大模型方面的開發(fā),但又不知道該怎么入手,應該學點什么。今天我們就根據作者個人的感受來提供一些建議或者說看法。
對想從事大模型領域開發(fā)者的建議
首先,作為一個技術人員來說我們首先要明白一件事,大模型領域的開發(fā)主要分為兩個部分;一個是基于大模型的應用開發(fā),二是大模型技術本身的開發(fā),這兩者是完全不同的開發(fā)路線,也是完全不同的技術路線。
下面我們就從這兩點展開來說一下其中的異同點和所需要的技術基礎。
大模型應用開發(fā)
嚴格來說大模型應用開發(fā)和傳統(tǒng)的業(yè)務開發(fā)沒什么區(qū)別,技術棧也基本相同,都是通過調用接口的方式來實現功能;唯一不同的地方就是,傳統(tǒng)的開發(fā)是調用的一些其它的功能接口,而大模型應用調用的是大模型開放的接口;而從技術的角度來說這個沒什么區(qū)別,基本上都是通過http/s或socket等網絡協(xié)議實現的接口調用。
所以傳統(tǒng)的技術開發(fā)者轉大模型應用開發(fā),基本上沒有什么門檻,哪怕你對大模型技術一竅不通,也可以直接轉;只不過如果你有人工智能或機器學習的基礎,會讓你更容易理解大模型的運作機制,但從應用的角度來說這個并沒有特別大的作用。

因此,對從事大模型應用開發(fā)的技術人員來說,需要的是和傳統(tǒng)開發(fā)幾乎一樣的能力,那就是你的架構能力,代碼開發(fā)能力,設計能力,中間件的使用和解決問題的能力。
總之一句話,大模型應用開發(fā)就是在功能模塊中多增加了一個大模型功能的接口,其它的和傳統(tǒng)的開發(fā)模式一模一樣,沒有任何區(qū)別。
哪怕是基于你們自己公司的大模型做上層應用的開發(fā),你們公司也會選擇組建兩個團隊,一個是開發(fā)業(yè)務功能,另一個開發(fā)和維護大模型的功能,而這也是第二種大模型領域開發(fā)人員需要做的事情,那就是大模型技術的開發(fā)。
對于大模型應用開發(fā)者來說,所需要的技術基本上還是屬于之前的那一套,比如java , 微服務,接口開發(fā),數據加解密,數據庫,緩存,消息隊列等。
大模型技術開發(fā)
如果說上一種基于大模型的應用開發(fā)是考慮怎么把大模型的功能應用的更好,那么大模型技術開發(fā)就是怎么把大模型做的更好。
為什么這么說?首先雖然我們覺得大模型的功能已經很強大,但從技術的角度來說大模型技術還處于初級階段,其作用范圍有限,其能力也有限,更重要的是其不穩(wěn)定,直接應用到工作中會有很大的安全性問題。
因此,這也是為什么大模型技術目前主要的應用場景都是以一些邊緣化的業(yè)務為主,還無法把大模型技術應用到企業(yè)的核心生產體系中;這也是之前馬斯克在一次采訪中說目前還沒有把人工智能技術應用到自動駕駛中,原因就在于此。
而對大模型技術開發(fā)者來說,需要的主要能力包括,編程語言主要以python為主,原因就在于python是大模型開發(fā)的主流語言;其次,包括大數據處理,算法,神經網絡,自然語言處理,計算機視覺等。

因為大模型主要特點就是規(guī)模巨大,涉及到大量的算法和計算問題,而python 在大數據處理方面具有天然的優(yōu)勢;因為對于之前從事大數據開發(fā)的技術人員來說,轉戰(zhàn)大模型技術開發(fā)具有一定的技術優(yōu)勢,但也不是絕對的;畢竟數據處理只是大模型技術開發(fā)中的一個環(huán)節(jié)。
其次,大模型由于需要模仿人類大腦的神經網絡模型,并且需要根據不同的場景完成不同的復雜任務,而這就需要很多強大的算法來完成;因此算法工程師是大模型技術中不可或缺的一環(huán)。
之后,由于大模型龐大的參數和神經網絡體系;因此傳統(tǒng)的系統(tǒng)架構很難滿足大模型訓練和運行的需求,因此分布式計算技術,比如并行計算就成了大模型運行的基礎,所以分布式計算也是其不可或缺的一環(huán)。
最后就是,大模型技術與不同應用場景的結合部分;比如基于大模型的自然語言處理,就需要你對自然語言處理有一定的理解;而對于圖像和視頻的處理就需要你具備基本的計算機視覺技術的基礎。

當然,大模型技術棧遠不僅這一點,其中還涉及到很多其它的技術,比如說向量計算,大批量數據的存儲與加載,基于鏈式結構等實現的邏輯推理能力等。
總之,對大部分開發(fā)者來說,大模型應用開發(fā)相對比較簡單,當然競爭也更加激烈;其次就是大模型技術本身的開發(fā),對技術要求相對較高;對于后者來說,單純的計算機技術可能已經無法滿足這種需求,更多需要的是數學,物理,生物等其它學科的佼佼者參與進來。就拿算法來說,在算法領域成就較高的人基本上都是數學出身的,而不是計算機出身的。
最后,每個人可以根據自己的喜好以及能力去選擇適合自己的發(fā)展方向;而不是稀里糊涂的不知道自己在干什么。
?
本文轉載自公眾號AI探索時代 作者:DFires


















