沒人告訴你的真相:大模型應用開發靠的是經驗,不是技術 原創
“ 提示詞工程是模型應用的技術,而思路是模型開發的法寶。”
上周比較忙基本上處于天天加班到很晚的狀態,原因就是做的大模型應用效果不太好,再加上業務端要去甲方爸爸那邊演示,因此就加班改bug調整優化。
然后等周末兩天閑下來休息的時候回頭看看才發現,之所以出現這樣的情況完全是開發思想還沒轉變過來,因為大模型的開發流程上正確并不代表結果上也會正確。
大模型應用開發是經驗開發
在之前的技術開發中,從經驗來看只要流程正確了基本上結果也是正確的,但這個經驗放到大模型開發上發現好像不是那么回事。
以作者手中目前的項目來說,剛開始作者在做這個項目的時候總覺得功能特別簡單,很容易就做出來了;然后等做了一段時間之后才發現好像沒有那么簡單,想做出來好像很容易,但想做好真的很難。
之后,在業務需求穩定下來之后作者也用了很多方法去優化系統,但發現效果雖然變好了一點,但好像也沒有那么好,并沒有達到用戶的要求。

所以,經過上周連續的加班之后,效果要比之前好了很多;但現在回頭看看其實優化點也并不是特別多,并且在流程上改動也不是特別大,主要問題基本上都集中在提示詞上面,以及部分的思路問題。
在上篇文章中介紹了這次的技術架構上的調整,但在調整之后進入具體開發時,作者把之前的優化方法和手段都用到了新的架構上;但這里也遇到了一個問題,好像流程上都是對的;但結果上好像也沒有達到想要的效果。
所以,這時作者就在思考一個問題,到底是什么原因導致的?
然后就發現了兩個問題,一個是提示詞;另一個是思路問題,不知道在合適的環節選擇合適的技術,而只是簡單的把之前的思路照搬過來。
首先來說一下提示詞的問題,在大模型應用中提示詞是重中之重,一個好的提示詞能解決大部分問題;并且很多時候效果不好的原因就是你提示詞寫的太拉垮了。
說實話作者個人并不擅長寫提示詞,甚至很多時候面對一個新的業務場景都不知道應該怎么寫好一個提示詞;大部分情況下都是把要求業務需求羅列到提示詞中,然后再交給模型,讓模型幫忙優化一下。
但提示詞既然被稱為提示詞工程,還是有一定的原因的,那就是寫提示詞有一套具體的方法,針對不同的業務場景有不同的提示詞模板和方式。提示詞既要寫的嚴謹,格式清晰,還要寫的簡單易懂,足夠的泛化,否則很容易出現模型訓練中的過“擬合”狀態。
而關于思路問題,一是需要在不同的業務中選擇合適的技術架構,畢竟單純的從技術角度來說,其實大模型應用開發的技術棧并不多,也不復雜,主要還是一個思路問題和理解問題。

在剛開始做問數功能時,直接開發了一個檢索工具, 把元數據作為查詢條件,用戶問題作為相似度檢索參數,對知識庫進行標量檢索和混合檢索;但發現檢索的效果并不是很好。
但從測試的過程來看,用戶一般會使用模糊查詢的方式,比如說某某地區某個部門的什么數據,或者說某個地區某個部門的具體數據;而這樣就可以通過把地區,部門和什么數據作為檢索條件進行查詢;并且把什么數據這個參數作為非必填項,這樣就可以讓模型理解用戶的問題。
如果有具體的數據名稱,那么就使用標量(條件查詢),如果沒有具體的名稱,那么就使用向量進行模糊查詢,這樣既提升了召回率,也提升了精準度。
總之,大模型應用開發不僅僅是一個技術問題,更多的是經驗和思路問題;當然,提示詞工程能力也很重要,畢竟提示詞是模型應用的基礎。
本文轉載自???AI探索時代?? 作者:DFires

















