現在是“Agent十年”而不是“Agent的元年”Karpathy提出“這是智能體的十年”,是對先前行業內“這是智能體之年”的回應。他認為“代理的十年”才是對當前情況更準確的描述,行業內存在一定程度的過度預測(overprediction)。ClaudeCode和Codex,這些都是由大語言模型演變而來的早期代理。它們確實是令人深刻的。Karpathy自己每天都在使用這些代理。但是,他強調距離真正成熟的代理,仍有“很多工作要做”理想的代理應該可以像...
2025-10-22 07:36:37 717瀏覽 0點贊 0回復 0收藏
大家不輕易切換,不僅因為"用得太熟",更因為Cursor本身確實比較強大。再加上前期各大媒體的集中宣傳,它已經成為了大家最熟悉的AI編碼工具。我們的版本更新解析,上次停在??1.2??。最近Cursor的面板好像也變了很多。也加入了一些新功能。這次我們就來盤一盤。本文的框架如下:自定義斜杠命令自定義斜杠命令在claudecode、cline等等里面應該很早就有了,在cursor中創建如下文件??.cursorcommands[command].md??即可,文...
2025-09-24 07:20:23 1.2w瀏覽 0點贊 0回復 0收藏
發現一個有趣的提示詞:“把Linux之父塞進ClaudeCode”。或許能帶來一些實際的編碼提升,也可能啟發你之后的提示詞靈感:該提示將AI角色扮演為LinusTorvalds,以增強代碼調試、重構和質量,以及AI生成代碼中的內存泄漏等頑固問題。它利用Torvalds的實用主義、簡單性和直接批評的理念,使開發者更有效地重組代碼,同時避免過度設計、過度工程化。提示源自一個專注于Claude特定提示的GitHub倉庫,核心在于體現Torvalds的內核維護...
2025-08-19 07:43:26 7784瀏覽 0點贊 0回復 0收藏
中國開源模型開發商排名NathanLambert,Allen人工智能研究所的研究員兼Interconnects通訊作者,于2025年8月17日發布了“中國開源模型開發商排名”。該報告根據19家中國人工智能實驗室在開源AI生態系統中的貢獻質量和數量進行評估,重點關注開源模型、工具和數據集的發布,而非專有能力或原始性能。該排名強調通過可訪問的資源推動全球AI發展的影響。Lambert的分析指出,中國在開源AI領域的快速進步,今年夏季的旗艦模型如Qwen3...
2025-08-19 07:37:08 6748瀏覽 0點贊 0回復 0收藏
Anthropic又發新東西了。ClaudeOpus4.1,算是對Opus4的一次小升級。主要提升了三個方面:智能體任務、真實世界代碼處理和推理能力。官方還提了一嘴:未來幾周,還會有“更大幅度”的升級。現在,付費的Claude用戶和ClaudeCode里已經能用上了。API、亞馬遜Bedrock和谷歌云VertexAI也都同步了。價格沒變,和Opus4一樣。那這次升級,具體強在哪?最直觀的,是在SWEbenchVerified這個編程評測上,性能干到了74.5%。圖片另外,在深度...
2025-08-06 06:32:07 3322瀏覽 0點贊 0回復 0收藏
亞馬遜發布Kiro,一個新的AgenticIDE,能處理‘規格’和架構圖來搞定更復雜的任務。預覽階段免費:???https:t.coNe5m2Nh4wC??,可以看到兩款模型。圖片這是又一個VSCode的閉源分支。圖片有氛圍編碼和規劃兩種模式。氛圍編碼(VibeChat&Build):探索想法,并在發現需求時進行迭代。首先是VibeChat,然后是build。規劃(Plan&Build):先制定詳細計劃,再構建。在開始編碼之前創建需求和設計。圖片Kiro的特色:規約(Specs)與掛鉤(...
2025-07-21 06:50:01 2713瀏覽 0點贊 0回復 0收藏
有點離譜,早上還在和群友說ClaudeCode封得太嚴重了,結果這時候就有人說Cursor也鎖國區了。。雖然我還用著正常。幾個小時前官方直接上了一條公告:Curosr部分模型限制大陸使用,deepseek能用,gpt,gemini,Claude就不行。貌似中國香港的也不行不過。這三個模型本來也不給大陸用戶調用,OPENAI官方明確不對大陸提供服務。Cursor最開始一直是公開的給國內用這玩意估計是上游原因,被提供商給壓力了。ClaudeCEO。。Claude這兩天還...
2025-07-21 06:45:05 3928瀏覽 0點贊 0回復 0收藏
最近,油管頂流4.09億粉絲MrBeast,把他那個ViewStatsAI縮略圖工具給關了。ViewStatsAI(6月初發布):他發推說,聽了大家的反饋,決定下架這個工具。圖片取而代之的,是搞了個頁面,幫創作者們找真正的縮略圖設計師約稿。這件事情的前幾天。PointCrow貼出了一張對比圖,指控MrBeast的ViewStatsAI工具,直接“偷”了其他創作者的縮略圖創意。“這是你嗎?你打算說點什么,還是就刪了推文,然后靠你那個新的ViewStatsAI垃圾工具...
2025-06-30 00:06:11 2203瀏覽 0點贊 0回復 0收藏
緣起——火山引擎在2025原動力大會上,也端出了自家的豆包大模型:DoubaoSeed1.6系列。這三兄弟都支持文本、圖片、視頻輸入,都帶著256K的長上下文。豆包三劍客DoubaoSeed1.6thinking,這是火山目前最強的思考模型,在編碼、數學、邏輯推理這些基礎能力上又進了一步。它的思考模式是強制開啟的,關不掉。然后是DoubaoSeed1.6,AllinOne的綜合模型,是國內首個支持256K上下文的思考模型,支持深度思考、多模態理解、圖形界面操作...
2025-06-17 06:14:38 9131瀏覽 0點贊 0回復 0收藏
Hi,這里是Aitrainee,歡迎閱讀本期新文章。DeepSeek團隊悄無聲息地放出了他們推理模型的新升級版:DeepSeekR1。更準確地說,是DeepSeekR10528。這新模型是今天凌晨在HuggingFace上出現的,連個正經官宣都沒有,直接MIT協議開源。HuggingFace頁面上,社區已經開始幫忙補Readme、提調整了,官方的博客估計也快了。項目地址:https:huggingface.codeepseekaiDeepSeekR10528treemain但從初步的反饋看,這模型挺猛,比原來的DeepSee...
2025-06-04 06:31:07 1.1w瀏覽 0點贊 0回復 0收藏
Vercel最近在v0.dev和API里都上了新的AI模型:v01.5md、v01.5lg和v01.0md。今天,他們把v0模型背后的"復合模型架構"給扒了。簡單說,這套架構就是把RAG(檢索增強生成)的專業知識、SOTA大模型的推理能力、再加上一個定制的流式后處理模型來修bug,給縫合到了一起。Vercel說,這么搞能讓v0生成代碼的質量高出一大截。而且,以后基礎大模型升級了,他們也能快速換上最新的,其他部分保持穩定。??v0為啥要搞這么一套"復合模型架構"...
2025-06-04 06:26:32 2697瀏覽 0點贊 0回復 0收藏
AIAgent賽道又添一員猛將,一個叫IntelligentInternet(II)的團隊高調宣布,他們打造了IIAgent,目標是“全球最強Agent”,而且還要開源。StabilityAI的前CEO,EmadMostaque,也為這個項目站臺。消息一出,社區直接炸鍋,高呼“LETSFREAKINGGO”。II團隊的計劃簡單粗暴:打造IIAgent,可能是世界上最好的Agent。開源它。...大家一起獲利。II的使命是“提升人類的智能”。IIAgent就是他們實現這個目標的關鍵一步,直接在Agent基準...
2025-05-21 06:53:19 4144瀏覽 0點贊 0回復 0收藏
Cursor老大扔了個話:AI每天生成10億行被接受的代碼,人類世界一天也就寫那么幾十億行。還給了目前最受歡迎的模型和使用頻率增長最快的模型社區:“牛”、“軟件行業的改變”、“對新手簡直福音”。有人已經開始暢想未來:程序員角色會更像架構師+QA,整個市場都被激活了。瓶頸要從寫代碼變成審代碼了(Amdahl定律yyds)。求Cursor加個編輯歷史上下文,讓AI更好地審PR。說到怎么用好Cursor,特別是應付復雜的代碼。Cursor官方專門...
2025-05-08 00:54:22 5488瀏覽 0點贊 0回復 0收藏
Hi,這里是Aitrainee,歡迎閱讀本期新文章。Cursor0.49更新來了,這次帶來一波實用功能,讓Agent更聽話,開發流程更順暢。在設置Beta選項中,把更新頻率切換到早期預覽,然后在幫助里檢查更新,你應該就能更新到最新0.49.x版本。規則系統升級聊天直接生成規則:我了解到自從Cursor改版成了分塊的mdc規則:cursorrules即將棄用!每個人都需要遷移到更靈活的項目規則來(無痛遷移教程)有很多人其實覺得麻煩,不想去寫一個個寫這些...
2025-04-23 07:24:03 5463瀏覽 0點贊 0回復 0收藏
Google正式下場定義Agent協作新規矩:Agent2Agent(A2A)開放協議來了。AIAgent單打獨斗的時代要過去了?GoogleCloud聯合超過50家技術和咨詢大佬(包括Cohere,Langchain,MongoDB,等等一票重量級選手)正式推出Agent2Agent(A2A)協議。這玩意兒要干啥?簡單說,就是給不同廠商、不同框架下構建的AIAgent提供一套標準的溝通語言和協作方式,打破信息孤島,讓它們能真正“組隊打怪”,提升效率。與MCP的關系?A2A與MCP是兼容互補的Googl...
2025-04-11 00:08:29 6322瀏覽 0點贊 0回復 0收藏
Hi,這里是Aitrainee,歡迎閱讀本期新文章。阿里Qwen家族添新丁:Qwen2.5Omni,一個真正的“Omni”全能模型。這款新模型號稱能看、能聽、能說、能寫,還能實時響應。文本、圖片、音頻、視頻,一個模型全搞定。自家QwenChat也用上了,還能語音、視頻直接聊,跟真人似的。體驗地址:???https:chat.qwen.ai??社區也熱贊,雖然也有人說離GPT還差點,但這波開源全能操作確實很頂。更重要的是,團隊把Qwen2.5Omni7B開源了,用的A...
2025-03-28 10:07:12 3853瀏覽 0點贊 0回復 0收藏
Mistral又搞了個“小而美”的狠貨:MistralSmall3.1發布并開源:號稱“小3.1”,但能力不“小”。多模態、開源Apache2.0協議,關鍵是性能還杠杠的,直接PK掉Gemma3和GPT4omini。看Benchmark圖:橫坐標是速度,越小越快;縱坐標是知識,越大越強。MistralSmall3.1,直接霸榜左上角,速度、知識雙Buff加持。Mistral官方列出了Small3.1的關鍵特性和能力:?輕量級:能在RTX4090或32GB內存的Mac上運行,適合本地部署。?快速響應:...
2025-03-18 08:26:13 4611瀏覽 0點贊 0回復 0收藏
前段時間比較火的Deepseek+多維表格大家應該都有了解:圖片來源機器之心:飛書中的每個表格都相當于一個prompt輸入框,你可以把需求和背景當作一列數據粘貼進去,DeepSeekR1就能按這個隊列全自動處理了。那么你有沒有想過Deepseek(滿血版)+畫布呢?OpenAI研究主管KarinaNguyen所說,‘我心目中的終極AGI界面是一張空白畫布(Canvas)’,它隨著人類的偏好不斷演變,自我變形,給予用戶無限的創作空間和自由度,讓交互方式更加...
2025-03-06 09:35:51 3180瀏覽 0點贊 0回復 0收藏
圣誕節在二月,Claude扔了個王炸!看來爆料者的信息還挺準的:明天:Claude4沒等到,Claude3.7要來了?不是嘛,哈哈哈。Anthropic官方有個毛病,他們通常不會做任何的預發布,大半夜他給你扔出來了個王炸:這次的新模型叫:Claude3.7Sonnet,它帶來了一種新的思維方式。它不再把快速回答和深度思考割裂開來,而是像人類大腦一樣,在同一個模型中實現兩種能力。Claude3.7Sonnet既能快速回答問題,也能在需要時進行深度思考,給用...
2025-02-26 14:08:03 4006瀏覽 0點贊 0回復 0收藏
Hi,這里是Aitrainee,歡迎閱讀本期新文章。就在昨天,Windsurf又推出了一波新版本更新。他們顯然把這個批次里面的新版本都稱為Wave,這次是Wave3。Wave2的更新:Memories功能很貼心。自動記住對話內容,方便后續引用。想記住什么,隨時提醒它。記憶面板里能看到所有內容。可以用命令面板打開,也能刪除不要的記憶。這個不花信用點。還有些小更新,修了bug,改進了細節。好了,回到Wave3,官方表示為了沉浸式編碼,你可以使用一...
2025-02-18 12:18:12 8934瀏覽 0點贊 0回復 0收藏