什么時(shí)候需要訓(xùn)練和微調(diào)屬于自己的大模型——小微企業(yè)必須要明白的問題 原創(chuàng)
“ 從問題出發(fā),先有需求再有解決方案 ”
老板和員工在思維方式上有一個(gè)很大的差別就是,作為老板他們喜歡尋找現(xiàn)有的解決方案,如果現(xiàn)有的解決方案無(wú)法滿足的情況下,才會(huì)自己設(shè)計(jì)一個(gè)解決方案。
而作為員工來(lái)說(shuō)特別是技術(shù)人員,大都有一種技術(shù)至上的心態(tài),比如說(shuō)很多技術(shù)人員找工作會(huì)特別在乎公司用的技術(shù)是否足夠牛逼,足夠高大上。
之所以產(chǎn)生這種現(xiàn)象的原因是因?yàn)椋夹g(shù)人員的心態(tài)是學(xué)會(huì)牛逼的技術(shù),走到哪里都不怕。
而老板的心態(tài)是,能解決問題把業(yè)務(wù)跑起來(lái)最重要,現(xiàn)有的解決方案或許不是最好的,但它卻是經(jīng)過驗(yàn)證的,能夠保證業(yè)務(wù)的穩(wěn)定性;但如果提出新的解決方案,就要承擔(dān)新方案潛在的各種風(fēng)險(xiǎn)。等以后業(yè)務(wù)穩(wěn)定之后,可以慢慢的優(yōu)化現(xiàn)有的方案。
什么時(shí)候需要訓(xùn)練和微調(diào)模型?
在上面的內(nèi)容中,描述了一下員工與老板思維以及心態(tài)上的區(qū)別;這兩種思維方式?jīng)]有絕對(duì)的對(duì)錯(cuò)之分,區(qū)別只是兩種完全不同的發(fā)展方向,一種是打工人的思維方式,一種是創(chuàng)業(yè)者的思維方式。
就拿大模型訓(xùn)練與微調(diào)來(lái)說(shuō),很多技術(shù)人員都想親自參與或體驗(yàn)一下一個(gè)模型從無(wú)到有的誕生過程;但受限于各種原因,有機(jī)會(huì)參與這樣工程的人還是比較少的;因此很多人都退而求其次,想做一下模型的訓(xùn)練與微調(diào)。

舉個(gè)例子,你是某個(gè)小公司的技術(shù)人員,老板想引入大模型技術(shù)來(lái)升級(jí)現(xiàn)有的業(yè)務(wù)系統(tǒng),然后讓你做一下前期調(diào)查和簡(jiǎn)單的解決方案。
不管使用的是大模型的什么技術(shù),比如Agent,知識(shí)庫(kù),AIGC等;很多技術(shù)人員下意識(shí)的方式就是先搞一個(gè)本地模型,試試能不能訓(xùn)練和微調(diào)一下,然后就陷入各種技術(shù)細(xì)節(jié)中無(wú)法自拔。
但事實(shí)上,市面上已經(jīng)有很多大模型服務(wù)商,他們有專門訓(xùn)練和微調(diào)過的模型;根據(jù)現(xiàn)有的業(yè)務(wù)體系,或許隨便找一個(gè)合適的模型就可以用了。
為什么不建議企業(yè)引入大模型技術(shù)時(shí),就直接打造屬于自己的大模型?
原因就是,你還不知道怎么把大模型技術(shù)與自己的業(yè)務(wù)場(chǎng)景相結(jié)合;雖然市面上可能有一些相似的案例,但每個(gè)企業(yè)都有其獨(dú)特的運(yùn)作方式,適合別人的不一定適合你。
簡(jiǎn)單來(lái)說(shuō)就是,你都不知道現(xiàn)有業(yè)務(wù)引入大模型能解決哪些問題,以及潛藏著哪些問題;說(shuō)白了就是,你都不知道要訓(xùn)練和微調(diào)出一個(gè)需要解決什么問題的模型,這樣的模型怎么可能做的好呢?

就類似于你需求都不清楚,就直接開始開發(fā)產(chǎn)品了,這樣的產(chǎn)品能有人用嗎?
當(dāng)然,如果說(shuō)你覺得你是上帝之子,即使需求不明確也能做出符合業(yè)務(wù)場(chǎng)景的大模型;或者說(shuō)你不差錢,訓(xùn)練一次不行就重新訓(xùn)練,那也可以。
因此,什么時(shí)候開始訓(xùn)練和微調(diào)模型?
最好的時(shí)機(jī)就是,在你的業(yè)務(wù)成型之后,有一些問題確實(shí)需要解決或者說(shuō)需要節(jié)約成本;這時(shí),你再去考慮訓(xùn)練和微調(diào)一個(gè)模型,甚至是找模型服務(wù)商幫你重新設(shè)計(jì)一個(gè)模型都可以。

一句話就是,在你的需求明確之后,也就是你知道要訓(xùn)練出一個(gè)什么樣的模型,并且你有足夠的技術(shù)和資金支持,那么你就可以訓(xùn)練和微調(diào)自己的模型了。
說(shuō)到底還是那句話,技術(shù)是為業(yè)務(wù)服務(wù)的,技術(shù)的發(fā)展是基于業(yè)務(wù)場(chǎng)景的落地,而不是從技術(shù)去推動(dòng)業(yè)務(wù)場(chǎng)景的發(fā)展,雖然技術(shù)的發(fā)展也有可能顛覆現(xiàn)有的業(yè)務(wù)場(chǎng)景,但那是技術(shù)與業(yè)務(wù)場(chǎng)景的深度融合的結(jié)果。
總之,不要一開始就想著訓(xùn)練和微調(diào)屬于自己的模型,要從問題出發(fā),而不是從結(jié)果出發(fā)。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/Ag2thIY2-TCAX15rbugWyA??

















