大家好,我是玄姐。在Manus項目啟動之初,團(tuán)隊面臨一個關(guān)鍵抉擇:是基于開源基礎(chǔ)模型訓(xùn)練端到端的智能體,還是借助前沿模型的核心能力搭建AI智能體?回溯NLP生涯前十年,我們根本沒有這樣的選擇余地。在七年前的BERT時代,模型必須經(jīng)過繁瑣的微調(diào)與評估,才能遷移到新任務(wù)中,即便這些模型相較于如今的LLM體積小巧,每次迭代仍需耗費(fèi)數(shù)周時間。對于亟待快速迭代的應(yīng)用而言,尤其是在尚未實(shí)現(xiàn)產(chǎn)品市場匹配(PMF)的階段,這種緩...
5h前 70瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。提示詞工程是上下文工程中至關(guān)重要的基礎(chǔ),而上下文工程已成為與大語言模型協(xié)作的核心環(huán)節(jié)。簡單說,提示詞工程就是通過合理組織指令,讓AI模型輸出更符合需求的結(jié)果,比如:怎么提問、指定輸出風(fēng)格、提供背景信息,最終引導(dǎo)AI按你的目標(biāo)做事。模糊的指令和精心設(shè)計的提示詞,差距可能天差地別:前者可能需要反復(fù)溝通才能明確需求,后者卻能一步到位拿到想要的結(jié)果。下面就從基礎(chǔ)技巧到進(jìn)階方法,分享一套實(shí)...
5h前 104瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐上下文是AI智能體的關(guān)鍵但有限資源。本文將探討如何有效篩選和管理驅(qū)動AI智能體運(yùn)行的上下文。在應(yīng)用AI領(lǐng)域,提示詞工程多年來一直是關(guān)注焦點(diǎn),如今一個新術(shù)語逐漸嶄露頭角:上下文工程。使用大語言模型(LLM)構(gòu)建應(yīng)用,已不再是單純尋找合適的提示詞短語,而是要解決更宏觀的問題:“什么樣的上下文配置最有可能讓模型產(chǎn)生我們期望的行為?”上下文指的是從大型語言模型中采樣時包含的一系列tokens。當(dāng)前的工...
6h前 63瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。現(xiàn)在AI行業(yè)正發(fā)生一件超關(guān)鍵的事:前幾個月,我們還看著AI智能體相關(guān)的框架亂成一團(tuán),幾十個框架各玩各的,互相不兼容,想整合用簡直難上天。但現(xiàn)在不一樣了!行業(yè)終于“定調(diào)子”,三大核心協(xié)議脫穎而出,它們不是互相搶飯碗,而是組隊發(fā)力、配合默契。這三大協(xié)議就是:1.AGU(智能體用戶交互協(xié)議)簡單說,就是智能體的“前后端溝通橋梁”,負(fù)責(zé)后端核心功能和前端界面的雙向連接。有了它,APP里的智能體就...
3天前 227瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。通過將原始輸入轉(zhuǎn)化為固定維度的高維向量以捕捉語義信息,Embedding(嵌入)模型在構(gòu)建RAG、推薦系統(tǒng),甚至自動駕駛模型訓(xùn)練中都發(fā)揮著極為關(guān)鍵的作用。近年來,OpenAI、Meta、Google、阿里、騰訊等科技巨頭紛紛加大對Embedding模型研發(fā)的投入。以O(shè)penAI為例,其最新推出的textembedding3small模型能夠生成1536維向量,在保持高語義表達(dá)能力的同時,實(shí)現(xiàn)了更低的延遲和更小的模型體積,非常適合對性能要求較...
5天前 1327瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐一、為啥需要“LLM當(dāng)裁判”?大語言模型(LLM)的輸出向來沒有固定答案,尤其是在投入企業(yè)實(shí)際應(yīng)用時,怎么判斷它生成內(nèi)容的質(zhì)量成了大難題。評估工程成為AI智能體下一個重要演進(jìn)方向,可以參考這篇文章:《???評估工程:AI智能體演進(jìn)的重要技術(shù)方向???》。傳統(tǒng)的評價指標(biāo)比如ROUGE、BLEU,面對現(xiàn)代LLM生成的那些需要結(jié)合語境、有細(xì)微差別的回答,根本不夠用。靠人工評價吧,雖然準(zhǔn)確,但又貴又慢,還沒...
6天前 343瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐一、先搞懂:RAG優(yōu)化的核心目標(biāo)RAG(檢索增強(qiáng)生成)的核心流程很簡單:用戶提問→檢索知識庫→拼接Prompt→LLM生成。但落地時總會遇到三類問題:檢索不準(zhǔn)、檢索不全、生成不穩(wěn)。所以企業(yè)落地RAG優(yōu)化的本質(zhì),就是圍繞“檢索器→索引與分塊→生成器”三個核心環(huán)節(jié),打造性能閉環(huán),既要“找得到”,也要“答得好”。二、檢索器優(yōu)化:找對材料是前提(核心中的核心)檢索是RAG的基礎(chǔ),要是找不到優(yōu)質(zhì)相關(guān)內(nèi)容,再強(qiáng)...
6天前 331瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。2025年11月12日,SpringAI團(tuán)隊正式宣布SpringAI1.1.0GA版本發(fā)布!作為Spring生態(tài)的AI核心組件,這個版本帶來了ModelContextProtocol集成、高級AI能力升級、擴(kuò)展模型廠商支持等重磅特性,累計包含850+項改進(jìn)、bug修復(fù)和文檔更新,堪稱一次全面升級。一、核心亮點(diǎn):ModelContextProtocol(MCP)集成這是本次發(fā)布最具里程碑意義的特性,SpringAI為MCP提供了SpringBoot自動配置和完整的注解式編程模型,讓AI應(yīng)用...
7天前 1315瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。當(dāng)某中型電商企業(yè)用通用LLM生成2023年Q3財報時,860萬元“平臺推廣費(fèi)”被誤歸入“主營業(yè)務(wù)成本”,直接導(dǎo)致毛利率從31%虛高至53%,后續(xù)500萬元產(chǎn)能投資因需求誤判淪為庫存積壓;當(dāng)研究者用單一AI撰寫“新能源汽車產(chǎn)業(yè)技術(shù)與政策協(xié)同”報告時,模型雖能羅列鋰電池技術(shù)與補(bǔ)貼政策,卻無法關(guān)聯(lián)“氫儲運(yùn)材料成本”與補(bǔ)貼導(dǎo)向的深層邏輯。這些案例并非個例,而是單一AI在復(fù)雜場景中“能力孤島”困境的集中體現(xiàn)。多...
7天前 626瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。AI智能體已經(jīng)在企業(yè)的眾多場景中落地,比如:對話與問答、報告生成、內(nèi)容審核、流程自動化、可視化數(shù)據(jù)分析、AI編程等。當(dāng)你向智能客服提問時,在你點(diǎn)擊發(fā)送按鈕之后,AI智能體應(yīng)用架構(gòu)是如何生成并回復(fù)你的問題的?這篇文章將通過一張核心架構(gòu)設(shè)計全流程圖,帶你深入了解AI智能體應(yīng)用架構(gòu)設(shè)計在接收到用戶請求后是如何一步步處理的。這不僅是對AI智能體技術(shù)的揭秘,也是對AI智能體應(yīng)用架構(gòu)設(shè)計落地的深入探...
2025-11-14 08:51:45 407瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。最近,X(原推特)上有一條推文火了灬大多數(shù)人看到后會想:我得學(xué)CUDA內(nèi)核工程,這樣才能有價值。但事實(shí)并非如此。即便你花一輩子鉆研,也大概率擠不進(jìn)那個約100人的頂尖圈子。內(nèi)核固然重要,但不該是你的第一步。首要任務(wù)是理解整個系統(tǒng)的運(yùn)作邏輯。你可能讀過幾百篇關(guān)于Triton內(nèi)核、PCIe與NVLink對比、或是DeepSpeedZeRO的文章,但作為GPU工程師,核心問題不是“我能手寫內(nèi)核嗎?”,而是“這些組件如何協(xié)...
2025-11-13 09:21:49 334瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。我整理了一份簡潔的可視化指南,涵蓋AIAgent領(lǐng)域30個最重要的術(shù)語。這些術(shù)語能幫你理解現(xiàn)代AI智能體(Agent)實(shí)際的思考、行動和協(xié)作方式,是核心必備知識。如果你正在研究LangChain、SpringAI、SpringAIAlibaba、CrewAI、LangGraph或AutoGen等智能體框架,這份術(shù)語表能幫你理清關(guān)鍵構(gòu)成模塊之間的關(guān)聯(lián)。一、核心術(shù)語解析Agent(智能體):能感知環(huán)境、進(jìn)行推理并為達(dá)成目標(biāo)采取行動的自主AI實(shí)體。Environmen...
2025-11-13 09:07:33 383瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。?在這個行業(yè)待了足夠久,見證了無數(shù)技術(shù)的興衰更迭。見過新框架引發(fā)的狂熱追捧,見過革命性工具許下的美好承諾,也聽過那些宣稱“將改變一切”的激動人心的預(yù)言。但大多數(shù)時候,這些技術(shù)不過是裹著營銷噱頭的漸進(jìn)式改進(jìn)。但并行智能體(ParallelAIAgents)不一樣。這是第一次可以毫不夸張地說,正在見證一項將從根本上改變軟件開發(fā)方式的技術(shù)。一、發(fā)展歷程回顧要理解當(dāng)下的技術(shù)現(xiàn)狀,我們需要回顧AI輔助編...
2025-11-12 09:47:52 435瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。?AI智能體正加速重構(gòu)企業(yè)工作模式,卻也引發(fā)了"技術(shù)替代人力"的廣泛討論。事實(shí)上,理解其技術(shù)架構(gòu)、發(fā)展階段與核心能力,才能真正發(fā)揮其價值。本文將從技術(shù)底層出發(fā),拆解AI智能體的核心架構(gòu)、進(jìn)化路徑與落地關(guān)鍵,助力企業(yè)實(shí)現(xiàn)智能化轉(zhuǎn)型。一、AI智能體的5級進(jìn)化階梯:從執(zhí)行器到數(shù)字分身AIAgent的能力迭代遵循明確的進(jìn)化路徑,每一級都對應(yīng)著技術(shù)突破與應(yīng)用場景的拓展:L1(簡單步驟跟隨):基于預(yù)設(shè)指令...
2025-11-10 09:04:53 1619瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。在傳統(tǒng)軟件工程中,測試是保障系統(tǒng)質(zhì)量的“護(hù)城河”,基于明確規(guī)則驗證輸入輸出,用覆蓋率和準(zhǔn)確率衡量穩(wěn)定性。但當(dāng)AI系統(tǒng)成為技術(shù)主流,一切都變了。AI智能體的核心是基于概率模型的推理與生成,結(jié)果的不確定性、語義的多義性、上下文的敏感性,讓傳統(tǒng)測試方法徹底失效。這也意味著,誰能搞定“評估”,誰就能掌握下一輪AI智能體演進(jìn)的主動權(quán)。評估工程,正是為解決AI系統(tǒng)不確定性而生的關(guān)鍵技術(shù)。它貫穿AI...
2025-11-10 09:02:20 578瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。一、背景任何成功的平臺都需要可靠的技術(shù)支持,但我們發(fā)現(xiàn),團(tuán)隊成員每天要花數(shù)小時查找技術(shù)問題的答案。這種低效不僅拖慢了工程師的工作進(jìn)度,也成為了用戶使用過程中的關(guān)鍵瓶頸。LangChain官方?jīng)Q定用自己推崇的工具解決這個問題:LangChain、LangGraph和LangSmith。最初,將chat.langchain.com作為原型開發(fā),明確設(shè)定了兩大功能:產(chǎn)品問答:幫助用戶和內(nèi)部團(tuán)隊快速獲取權(quán)威的產(chǎn)品相關(guān)答案。客戶原型示例:...
2025-11-07 09:08:13 689瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。?在學(xué)習(xí)AI智能體(AIAgents)的記憶相關(guān)知識時,被各種新術(shù)語搞得不知所措。一開始是“短期記憶”和“長期記憶”,后來又出現(xiàn)了“程序性記憶”、“情景記憶”和“語義記憶”,這就更混亂了。但等等,“語義記憶”讓我想到了一個熟悉的概念:檢索增強(qiáng)生成(RAG)。難道AI智能體的記憶,是基礎(chǔ)RAG演進(jìn)到AI智能體化RAG之后的合理下一步?本質(zhì)上,AI智能體的記憶核心是“將信息傳入和傳出大型語言模型(LLM)的...
2025-11-07 09:02:53 412瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。“單體智能體”(指只靠一個大語言模型,再塞一堆系統(tǒng)提示詞)的路子走不長遠(yuǎn)。我們很快就意識到,要搭建高效的系統(tǒng),得用多個“專精型智能體”。它們要能協(xié)作,還能自主組織。為實(shí)現(xiàn)這一點(diǎn),AI智能體領(lǐng)域已經(jīng)出現(xiàn)了幾種典型的架構(gòu)設(shè)計模式。這張圖解會介紹多智能體“協(xié)同調(diào)度”的7種核心架構(gòu)設(shè)計模式,每種模式都對應(yīng)特定的工作流程:1.并行架構(gòu)設(shè)計模式(Parallel)每個智能體負(fù)責(zé)不同的子任務(wù),比如:有的...
2025-11-06 09:19:24 598瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。越來越多企業(yè)已經(jīng)落地AI智能體應(yīng)用,我們會不約而同的發(fā)現(xiàn),AI智能體應(yīng)用在企業(yè)落地90%的工作都是工程架構(gòu)設(shè)計(軟件工程),只有10%是真正的AI大模型。AI智能體在企業(yè)落地中的每一個組件都是模塊化的,而且逐步達(dá)成到了行業(yè)標(biāo)準(zhǔn):比如:LangChain、SpringAIAlibaba開發(fā)編排框架,MCP通信交互協(xié)議等等,這些構(gòu)成了AI智能體的生態(tài)系統(tǒng)。AI智能體應(yīng)用落地的生態(tài)系統(tǒng)包含14層,從下到上分別為:CPUGPU提供商層、...
2025-11-06 09:07:40 420瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是玄姐。?做過AI智能體(Agent)開發(fā)的同學(xué),大概率都遇到過這些頭疼問題:“調(diào)了無數(shù)次提示詞,Agent還是答非所問”、“多輪交互后,它就忘了自己該做什么”、“明明沒給的信息,它硬說有,幻覺太嚴(yán)重”……我們團(tuán)隊在開發(fā)“企業(yè)服務(wù)智能助手”(服務(wù)領(lǐng)域數(shù)字員工,支持MultiAgent協(xié)同與工具調(diào)用)的過程中,也踩過不少類似的坑。從最初的“Agent混亂輸出”到后來實(shí)現(xiàn)“穩(wěn)定解決客戶問題”,我們在上下文工程、多智...
2025-11-05 08:50:30 458瀏覽 0點(diǎn)贊 0回復(fù) 0收藏