百度蒸汽機(jī)再進(jìn)化:AI長(zhǎng)視頻可邊生成邊改,發(fā)布互動(dòng)數(shù)字人與開放世界
10月15日,視頻生成模型百度蒸汽機(jī)(文心專精)再次升級(jí),行業(yè)首次實(shí)現(xiàn)AI長(zhǎng)視頻實(shí)時(shí)交互生成。該功能升級(jí)依托流式視頻技術(shù)實(shí)現(xiàn)“無(wú)限時(shí)長(zhǎng)”生成,突破傳統(tǒng)AI視頻生成10秒左右的時(shí)長(zhǎng)限制,生成速度超越國(guó)內(nèi)主流視頻生成模型。
據(jù)悉,用戶只需上傳單張圖片與一段提示詞即可啟動(dòng)視頻生成流程,并能實(shí)時(shí)預(yù)覽模型推理全部?jī)?nèi)容。在生成過(guò)程中,用戶可隨時(shí)暫停、或在任意節(jié)點(diǎn)修改提示詞,實(shí)現(xiàn)對(duì)視頻劇情、畫面、轉(zhuǎn)場(chǎng)的實(shí)時(shí)控制,全程干預(yù)。這意味著,AI視頻從“單向生成”邁向“雙向共創(chuàng)”,真正實(shí)現(xiàn)“無(wú)限畫布”式的連續(xù)創(chuàng)作體驗(yàn)。
此外,此次升級(jí)同步推出了可交互數(shù)字人與開放世界動(dòng)態(tài)構(gòu)建兩大功能。數(shù)字人支持沉浸式雙向互動(dòng),可應(yīng)用于AI導(dǎo)購(gòu)、教育、陪伴等場(chǎng)景;開放世界則允許用戶通過(guò)自行操控,在AI生成的游戲地圖、旅游景點(diǎn)、宇宙空間等環(huán)境中自由探索。
據(jù)悉,百度蒸汽機(jī)自5月以來(lái)持續(xù)迭代,先后實(shí)現(xiàn)音視頻一體化生成、多人對(duì)話生成、移動(dòng)端適配等能力。本次長(zhǎng)視頻實(shí)時(shí)交互功能的推出,進(jìn)一步拓展了AI視頻在影視預(yù)演、互動(dòng)娛樂(lè)、個(gè)性化營(yíng)銷等場(chǎng)景的應(yīng)用邊界,推動(dòng)AIGC從“素材生成工具”向“內(nèi)容共創(chuàng)平臺(tái)”演進(jìn)。



























