嘿,大家好!這里是一個(gè)專注于前沿AI和智能體的頻道年初KimiK1.5發(fā)布的時(shí)候,被DeepSeekR1狙擊。在閉關(guān)半年后,掏出來了驚艷全球的KimiK2。在經(jīng)過一個(gè)季度,K2推理版本發(fā)布,發(fā)布即開源。HLE和IMO都刷到了SOTA,沒有任何定語的真SOTA(值得一提的是IMO這個(gè)新bench在kimi出來之前sota居然是Deepseek而不是北美模型)這2天,看到最多的是,KimiK2Thinking能夠在沒有人為干預(yù)的情況下執(zhí)行多達(dá)200300個(gè)連續(xù)的工具調(diào)用,通過數(shù)百個(gè)步...
2025-11-11 07:17:57 303瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
伴隨著Gemini3、GPT5.1的各種小道消息散播半個(gè)月。NanoBanana2,2K原生輸出,竟然要提前來了,春節(jié)前大玩具有了。今年玩模型,比較沉迷的是Gemini2.5Pro和Nanobanana,第二代Nanobanana肉眼可見的提升,可以替代很多Photoshop的功能。在生活實(shí)戰(zhàn)中,價(jià)值一點(diǎn)都不比語言模型低。圖片AGI提前到來?提前泄露,意外上線,GitHub代碼曝光,這串營(yíng)銷工作流是越來越熟練了。NanoBanana2用了一套多步驟生成流程,先規(guī)劃、再生成、然后自...
2025-11-11 07:15:55 370瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
嘿,大家好!這里是一個(gè)專注于前沿AI和智能體的頻道最近,Langchain的工程師LanceMartin和Manus的創(chuàng)始人Peak季逸超進(jìn)行了一次關(guān)于Agent的研討會(huì),信息量有點(diǎn)大,整理了一些結(jié)論分享一下。一個(gè)現(xiàn)實(shí):Agent越智能,死得越快。問題出在哪?Agent會(huì)瘋狂調(diào)用工具,每次調(diào)用都會(huì)把結(jié)果塞進(jìn)上下文里。Manus提到他們一些任務(wù)需要50次工具調(diào)用,Anthropic說生產(chǎn)環(huán)境的Agent對(duì)話能跑幾百輪。結(jié)果就是,上下文像滾雪球一樣越滾越大,最后開...
2025-11-03 07:13:37 475瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
最近硅谷在發(fā)生一件很有意思的事:很多的VC都在招聘一個(gè)叫FDE(ForwardDeployedEngineer)的崗位。這是一個(gè)誕生于情報(bào)部門、看起來像咨詢業(yè)務(wù)的模式,突然成了AIAgent創(chuàng)業(yè)公司的標(biāo)配。前OpenAI首席研究官、Palantir第二位工程師BobMcGrew透露,過去一年,他聊了很多AI初創(chuàng)公司,幾乎所有創(chuàng)始人都只關(guān)心一件事,Palantir的FDE策略到底是怎么運(yùn)作的,為什么能孵化數(shù)百家創(chuàng)業(yè)公司,10多家獨(dú)角獸。我找到了一個(gè)BobMcGrew的訪談,可...
2025-10-21 00:48:06 1486瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
Anthropic最近又發(fā)了一篇關(guān)于AIAgents的博客,過去幾個(gè)月已經(jīng)連續(xù)好幾篇了。我覺得他們關(guān)于Agents的內(nèi)容整體都挺好的,寫的也很有實(shí)踐意義。今天的分享,圍繞一個(gè)核心問題:如何配置上下文,才能讓模型持續(xù)輸出期望的行為。TLDR:上下文是有限資源,存在ContextRot現(xiàn)象。好的上下文工程找到最小的高信號(hào)token集,最大化期望結(jié)果。長(zhǎng)時(shí)間任務(wù)三板斧:壓縮、結(jié)構(gòu)化筆記、子智能體。新的趨勢(shì)是Justintime策略:不預(yù)處理所有數(shù)據(jù),而...
2025-10-21 00:47:15 777瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
今天的內(nèi)容分享一個(gè)新的認(rèn)知,AInative瀏覽器引發(fā)的認(rèn)知革命,本文不強(qiáng)烈推薦某一款應(yīng)用因?yàn)槲野l(fā)現(xiàn),即使AI瀏覽器還沒那么靠譜,成功率可能只有6070%,或者更低,但還是很容易完成從“我要搜索什么網(wǎng)站”到“我想要什么結(jié)果的轉(zhuǎn)變”。AI瀏覽器到底做對(duì)了什么?一個(gè)好的AI瀏覽器,應(yīng)該都不是給Chrome加個(gè)AI插件,而是重新定義瀏覽器的底層邏輯:從導(dǎo)航工具變成執(zhí)行意圖的引擎。用下來,最徹底的3個(gè)核心能力圍繞在:持續(xù)的意圖記...
2025-10-21 00:46:06 803瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
我們一起分享AgentInfra,一個(gè)好的Infra已經(jīng)可以讓Agent自動(dòng)進(jìn)化了。然后,我去搜索了一下相關(guān)的開源框架,然后還真找到了一個(gè)。仔細(xì)研究了一下原理,今天給家人們分享一個(gè)自我進(jìn)化的智能體,到底是怎么做出來的?什么是自進(jìn)化AI?(SelfEvolvingAI)傳統(tǒng)的Agent工作流,本質(zhì)上是一個(gè)固定的程序。我們預(yù)先設(shè)定好Prompt、工具和流程,然后期望它能在特定任務(wù)上表現(xiàn)良好。自進(jìn)化AI的核心思想,是把Agent從一個(gè)固定的工具,變成一...
2025-10-10 07:04:16 1606瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
過去半年,幾乎10個(gè)創(chuàng)業(yè)者有8個(gè)在做各種各樣的Agent,但是AgentInfra絕對(duì)是被大多數(shù)人忽視的一個(gè)板塊。月初,給家人們以AutoGLM2切入,深挖了AgentInfra的核心要素,有朋友留言說智譜的AutoGLM2背后是阿里云無影AgentBay。阿里云?無影?這2個(gè)詞組合起來確實(shí)非常陌生。但是,今天在云棲大會(huì)上,刷到了,阿里云無影宣布Agent基礎(chǔ)設(shè)施AgentBay迎來重大升級(jí),并首次展示全新的個(gè)人計(jì)算產(chǎn)品——無影AgenticComputer。無影AgentBay擁...
2025-10-10 07:01:34 2090瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
國慶各種新聞滿天飛,大佬們都不過節(jié)的。。。今天快速梳理了一下所有的新聞,給家人們補(bǔ)補(bǔ)課。Anthropic、OpenAI、Google假期前后,御三家,接連放出王炸。誰才是下一代最強(qiáng)模型?AnthropicClaudeSonnet4.5首先是Anthropic,扔出了ClaudeSonnet4.5,世界上最好的編碼模型。在SWEbench上,Sonnet4.5拿下了77.2%的平均分,直接把其他所有模型甩在身后。在無人監(jiān)督的情況下,連續(xù)工作30個(gè)小時(shí)來處理復(fù)雜的多步驟編程任務(wù),內(nèi)部代碼...
2025-10-10 06:57:24 2813瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
嘿,大家好!這里是一個(gè)專注于前沿AI和智能體的頻道人在云棲大會(huì),一上來,阿里云智能首席技術(shù)官周靖人就介紹了千問多款新模型發(fā)布,一款模型升級(jí)。今天給家人們分享一下,阿里今天發(fā)布&開源的那些大模型全家桶!首當(dāng)其沖的是Qwen的萬億參數(shù)旗艦?zāi)P?mdash;—Qwen3Max來了。參數(shù)量直接拉滿到超1萬億、用36Ttokens數(shù)據(jù)預(yù)訓(xùn)練的變態(tài)。月初的Qwen3MaxPreview,在LMArena排名第三,各種表單幾乎都是暴捶開、閉源模型。滿血版,Qwen3Max有...
2025-09-24 14:19:30 2990瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
前陣子,智譜AutoGLM還是挺刷屏的,它的核心理念是,給每個(gè)人配一個(gè)云端分身,7x24小時(shí)的幫大家干活今天想給家人們?cè)敿?xì)挖掘一下AgentInfra,隨著模型的Agent能力越來越強(qiáng),infra也變得越來越重要了!為什么AIAgent需要新的AIinfra?過去,我們談?wù)揂gent,只講他的大腦。因?yàn)榇竽X負(fù)責(zé)思考,工具負(fù)責(zé)執(zhí)行。但是,一個(gè)越來越不容忽視的組件是,Agent的身體。因?yàn)锳gent都存在一個(gè)致命缺陷:它們?cè)谀愕膫€(gè)人電腦上運(yùn)行。這意味著:搶...
2025-09-15 07:54:22 4158瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
關(guān)于Agent的記憶,大多數(shù)人印象中,后臺(tái)可能就是一個(gè)RAG罷了。但是到底有哪些細(xì)節(jié)和值得注意的地方呢?今天深度分析一個(gè)還不錯(cuò)的開源項(xiàng)目,探索關(guān)于記憶的秘密。項(xiàng)目是這個(gè):???https:github.comGibsonAImemori??不止是RAG其實(shí)如果細(xì)看很多記憶框架,他們做到的真的遠(yuǎn)不止一個(gè)“存儲(chǔ)檢索”的RAG思路。在Memori中,把記憶分成了兩種:ConsciousMode就是傳統(tǒng)意義上的短期工作記憶。但是比較特別的是,在系統(tǒng)啟動(dòng)時(shí),會(huì)主動(dòng)分...
2025-09-12 07:15:41 2051瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
OpenAI上周發(fā)了一篇論文,重點(diǎn)聊了大家都挺感興趣的話題:為什么大模型會(huì)有幻覺?評(píng)測(cè)缺陷舉個(gè)例子:你現(xiàn)在參加一場(chǎng)考試,答對(duì)得1分,答錯(cuò)或不答都是0分。在這種規(guī)則下,最佳策略是什么?應(yīng)該是碰到完全不會(huì)的題目,蒙一個(gè)答案。因?yàn)槊蓪?duì)了血賺,蒙錯(cuò)了不虧。這個(gè)模式正是今天絕大多數(shù)AI模型在面對(duì)的評(píng)測(cè)環(huán)境。包括GPQA、MMLUPro、SWEbench在內(nèi)的眾多熱門評(píng)測(cè)基準(zhǔn),都是在用BinaryGrading。非對(duì)即錯(cuò),如果模型回復(fù)IDK(IDon'tKn...
2025-09-12 07:15:01 1568瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
騰訊優(yōu)圖實(shí)驗(yàn)室悄摸摸開源了??Youtuagent??,在較復(fù)雜的的深度搜索和工具使用benchmark上表現(xiàn)不錯(cuò),今天給家人們分享一下他的亮點(diǎn)。不依賴GPTClaude的SOTA最值得一提的是,上面的評(píng)測(cè)都是使用的DeepSeek!!!!以后不能隨便說,現(xiàn)在的Agent離開Claude,啥也不是了?所以他的框架到底有些什么亮點(diǎn)呢?最大的亮點(diǎn):像聊天一樣生成Agent對(duì)新手來說,配置Agent很煩人。他們搞了一個(gè)自動(dòng)智能體生成的功能。別的框架是,你可能要...
2025-09-01 00:12:17 2963瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
要讓一個(gè)LLM成為頂尖行業(yè)專家,需要多長(zhǎng)的Prompt?畢馬威給出的答案是:100頁。作為四大咨詢巨頭之一的畢馬威,搞出來一個(gè)新聞。說他們打造了一款名為TaxBot的稅務(wù)AI助手,直接把過去需要兩周的專業(yè)咨詢工作,壓縮到了一天內(nèi)完成,效率提升超過10倍!從封殺到Allin,從巨長(zhǎng)Prompt到未來的AgentRuntime,畢馬威這套操作,幾乎把企業(yè)落地Agent該踩的坑、該走的路,都趟了一遍。今天,給家人們分享一下這個(gè)框架思路。畢馬威的故事2...
2025-09-01 00:11:15 1539瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
這幾天,英偉達(dá)的一篇論文非常火,標(biāo)題很直接,小模型才是AgenticAI的未來整個(gè)內(nèi)容,主要是論證了為什么要考慮SLM?以及如何從LLM遷移成SLM的六步教程,并論證了開源Agent框架替換成SLM,帶來的結(jié)果。今天給家人們分享一下論文內(nèi)容。為什么說LLM做大了還不行?目前行業(yè)主流的萬事皆用LLM的Agent構(gòu)建模式,是一種巨大的資源浪費(fèi)。AIAgent的大部分子任務(wù),其實(shí)是重復(fù)、有范圍、非對(duì)話式的,用一個(gè)龐大的、無所不能的LLM去處理,就...
2025-09-01 00:10:00 1324瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
今天有個(gè)大新聞,OpenAI和Google這兩大巨頭,罕見地聯(lián)手了,協(xié)同F(xiàn)actory、Sourcegraph、Cursor等一眾廠商,共同推出了一個(gè)簡(jiǎn)單、開放的Agents標(biāo)準(zhǔn)。背景是,隨著現(xiàn)在AI編程Agent圈子神仙打架。為了讓AI按項(xiàng)目規(guī)范行事,我們的代碼庫里被硬塞進(jìn)了??.cursorrules???,??AGENT.md???,??CLAUDE.md??等五花八門的配置文件。項(xiàng)目目錄越來越亂,昨天,來自大廠們聯(lián)手推出的??AGENTS.md??出來了,目標(biāo)只有一個(gè):用一個(gè)...
2025-08-21 15:06:11 2663瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
GPT5的提示詞不出意外的,又被破解出來了。結(jié)合官方提供的《GPT5PromptingGuide》的內(nèi)容,仔細(xì)琢磨了一下,有一些值得學(xué)習(xí)的地方,今天分享給家人們。systemprompt:https:github.comelderpliniusCL4R1T4SblobmainOPENAIChatGPT508072025.mkdgpt5promptguide:https:cookbook.openai.comexamplesgpt5gpt5promptingguideGPT5時(shí)代,寫不好提示詞,那就成為MetaPrompting工程師吧!Metaprompting,簡(jiǎn)單說,就是讓GPT5來幫你優(yōu)化你...
2025-08-20 06:56:08 3766瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
今天給家人們分享一下,2025AIAgents的六大趨勢(shì)、MultiAgents的協(xié)作架構(gòu)、Agent的自主L1L5等級(jí)趨勢(shì)一:DeepResearchAgent——任務(wù)從執(zhí)行到拆解與監(jiān)督我們最熟悉的Agent模式是接收一個(gè)任務(wù),然后自己從頭干到尾。DeepResearch的玩法變了,它引入了一個(gè)Manager的角色。Manager不親自干活,核心任務(wù)是兩件事:拆解任務(wù):把一個(gè)復(fù)雜問題(比如“分析Q3季度AIAgent行業(yè)報(bào)告”)拆解成一堆更小的、可以獨(dú)立執(zhí)行的子任務(wù)(文獻(xiàn)檢索、數(shù)...
2025-08-20 06:51:59 3852瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
最近,一篇萬字綜述《ASurveyonAgentWorkflow》有一點(diǎn)牛皮,作者們扒光了市面上超過20個(gè)主流的Agent框架,今天把要點(diǎn)給家人們分析一下內(nèi)容涉及到AgentWorkflow到底是什么,它如何組織多個(gè)Agent高效協(xié)作,以及我們?cè)撊绾芜x擇適合自己的框架。什么是AgentWorkflow?論文這里的Workflow是一套高效的管理流程。負(fù)責(zé)將一個(gè)復(fù)雜的大任務(wù),拆解成一個(gè)個(gè)子任務(wù),然后派給不同角色、不同能力的Agent去執(zhí)行,并確保它們之間能順利溝通、協(xié)...
2025-08-20 06:47:28 3238瀏覽 0點(diǎn)贊 0回復(fù) 0收藏