圖生視頻新玩法刷爆外網：圖上畫兩筆就能動起來，終于告別文本提示

2025-08-19 16:21:52

人工智能新聞

前者只需上傳一張靜態圖像，在上面繪制圖形、文字或箭頭等元素，即可生成具有電影質感的視頻畫面。該功能一經發布就在外網爆了，短短 4 天時間 X 上的瀏覽量就超 530 萬。

現在，AI看你畫的就能懂。

Higgsfield AI 這家公司，有點意思。

不僅三天兩頭上線新功能，在 X 上瘋狂刷存在感，還一度被傳出和 Meta 洽談收購事宜，雖然最后不了了之。

據 The Information 報道，Meta Platforms 正在尋求與開發人工智能視頻生成與編輯模型的初創公司建立合作關系，曾與視頻生成初創公司 Higgsfield 探討過潛在的收購事宜，但這些談判目前已不再進行。

該公司專注于 AI 視頻生成，最擅長電影級鏡頭控制技術，三個月前曾憑借 AI 運鏡視頻生成火出圈，我們還專門報道過：一張照片實現超 70 種百萬級運鏡！這款 AI 神器給了攝影師一記「鐵拳」

前幾天，它又先后發布了 Draw-to-Video 和 Product-to-Video 功能。

后者則可以通過簡單的拖拽操作，免費生成精美的、電影級的廣告視頻。截至目前也已在 X 上收獲 160 萬次瀏覽量。

如果再往前扒拉扒拉，你會發現這家公司幾乎每周都會發布新功能或新模板。

8 月 6 日，上線 UPSCALE 功能，能夠將模糊的圖片和視頻升級到 4K 或 8K 分辨率。

8 月 2 日，推出全新升級的多參考圖功能，支持最多 4 張參考圖輸入，實現高度一致的角色呈現，并徹底消除隨機偽影。配合 Higgsfield Soul 使用后，整體效果更為真實，還能一鍵更換膚色、背景、服裝。

7 月 24 日，推出全新功能 STEAL，搭配 Soul ID 使用，可以讓用戶「偷取」他人的動作、表演風格等，并將其應用到自己的虛擬角色或視頻中。

7 月 17 日，發布全新的 UGC Builder 工具，只需通過一個界面上傳人臉、設定人物動作、語音、情緒和背景音樂，即可生成無需剪輯的完整電影場景。

……

而且，哪家模型火了，它轉頭就將其「納入麾下」，比如 GPT-5、MiniMax、Veo 3、Seedance Pro 等。

打開 Higgsfield 的官網，密密麻麻都是視頻功能和模板。

體驗鏈接：https://higgsfield.ai/

網友一手實測

Higgsfield 的功能一上新，就有網友親自上手體驗，整出了不少花活。

就以最新的 Draw-to-Video 為例。

其玩法相當簡單。打開 Higgsfield AI 官網，選擇 Create-Draw to Video，上傳任意一張圖片。

然后直接在畫面上繪制箭頭、圖形等元素，并輸入動作指令，比如「演員跑進來」、「這里爆炸」或「鏡頭移動」，AI 會立即執行，并生成極具真實感的動態畫面。

過去需要工作室、演員和高昂成本的大片場景，如今只需幾分鐘就能完成。它可以憑空生成一只貓，還能自由控制鏡頭運動和演員的入場位置。

為了生成效果更佳，有網友總結出一個教程。

使用 Higgsfield 的 Draw-to-Video 時，要先確保圖片主體清晰，若需要加入人物或物體，可以提前去掉背景，用透明 PNG 格式。

畫箭頭可以清晰指示人物或物體的出現方向，畫爆炸標記可以很好地引導爆炸場景。在畫布上直接寫文字提示，能顯著提升成功率。如果有出現順序，務必清晰寫明「Step 1, Step 2, Step 3」，避免 AI 出錯。

在價格上，使用Seedance Pro 的 480p 生成 5 秒視頻是免費的，其他如 Hailuo02、Seedance Pro 和 Veo3 都有不同分辨率和時長對應的點數消耗。其中最貴的是 Veo3 ，標準版本 720p 分辨率需要 150 個點數。

因此，我們可以先用免費 480p 版本不斷嘗試和調整提示詞，滿意后再生成 720p 或更高分辨率，最后通過 Upscale 功能提升清晰度，就能在保證質量的同時最大限度降低成本。

在此基礎上，Higgsfield 又推出了 Product-to-Video 功能，只需上傳一張人物照片，然后拖拽產品圖片、添加文字，就能生成廣告大片。

比如讓金剛狼從冰箱里掏出一瓶可口可樂：

甜茶在線安利巧克力：

此外，該功能還有四大亮點：

1. 它支持谷歌 Veo 3、字節 Seedance、MiniMax Hailuo02 等視頻生成模型，無需切換不同平臺，只在一個界面就能完成圖像和視頻的創作。

2. 可以在成片基礎上疊加特效（Effects）、Flux Kontext、UGC Builder 等功能模塊，進一步豐富廣告內容。

3. 還能添加片頭 / 片尾幀，或用「修補（inpaint）」來精細修改。

4. 渲染速度更快，不再需要繁瑣的導入導出。

看了一圈網友生成的效果，感覺還不錯，感興趣的朋友可以去體驗一下。

公司及創始人介紹

根據公開資料顯示，Higgsfield AI 創立于 2023 年 10 月，總部位于美國舊金山，專注于為內容創作者打造個性化 AI 視頻工具。目前，團隊規模約為 11-50 人。

2024 年 4 月，Higgsfield AI 完成了由 Menlo Ventures 領投的 800 萬美元種子輪融資，用于推動視頻生成工具、社交媒體創作平臺的發展。2025 年 8 月，Meta 被傳出曾與 Higgsfield AI 進行過收購層面的討論，但最終不了了之。

公司創始人兼 CEO Alex Mashrabov 此前曾任 Snap 公司（以構建頂級社交媒體應用 Snapchat 而聞名）的生成式 AI 負責人，旗艦負責開發 MyAI 對話式聊天機器人、生成式 AI 增強現實（AR）特效、Cameos Stories（個性化的 AI 驅動的視頻內容形式）以及 3D 合成數據框架。

而更早之前他創立的圖像和視頻識別公司 AI Factory 以 1.66 億美元的金額被 Snap 收購。

2023 年 9 月，Alex Mashrabov 從 Snap 離職并開始自己創業。

自創立以來，Higgsfield AI 先后推出了旗艦產品 Diffuse、Diffuse 2.0，支持用戶免費上傳單張自拍照或輸入文本，利用最新的生成式 AI 技術來生成個性化視頻內容，甚至用戶自己自然地插入場景中。

圖源：https://www.trydiffuse.com/

2025 年 3 月，Higgsfield AI 推出了最新的視頻生成模型 DoP I2V-01-preview，以專業級鏡頭控制、世界建模和電影級敘事意圖為主要特征，尤其在精準性、真實性與風格表現力方面出色。

此外，Higgsfield AI 還對世界模型有所涉獵。今年 4 月，Mashrabov 曾表示，「我們正在構建世界模型，它可以提供頂級的視頻生成與編輯體驗，并能實現直觀的細粒度控制。」

此次推出的 Draw-to-Video 功能更是 Higgsfield AI 在生成式視頻交互方式上的一次突破，將用戶從「寫文本提示詞」的困擾中解放出來，通過簡單的圖形動作（比如箭頭）指引就能完成直觀的創作。

網友盛贊，終于不用后期加特效了。而相比于文本提示，空間提示將成為最佳的視覺控制器之一。

責任編輯：張燕妮來源：機器之心

AI 視頻生成模型