8月21日,百度蒸汽機(MuseSteamer)音視頻一體化模型完成升級,Turbo版、Lite版、Pro版,及有聲版全面開放,實現(xiàn)多人有聲音視頻一體化生成。百度蒸汽機通過五大技術(shù)突破實現(xiàn)“需求即成片”,在生成電影級高清視頻畫面的同時,實現(xiàn)逼真環(huán)境音效、自然人物語音的同步輸出。即日起,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業(yè)用戶可在千帆平臺享受高性能視頻生成服務(wù)。
五大突破定義視頻生成新標(biāo)準(zhǔn),終結(jié)“無聲時代”
據(jù)介紹,百度蒸汽機是中文音視頻一體化生成的I2V模型,不僅支持環(huán)境音效,更支持多角色語音的一體化生成。百度蒸汽機2.0有聲版模型讓AIGC視頻創(chuàng)作徹底告別了配音,創(chuàng)作者對完美視聽語言的想象,只需要一張圖和提示詞。
這背后依托于百度蒸汽機視頻模型的五大核心技術(shù)突破:實現(xiàn)多人有聲音視頻一體化生成,語音與唇形、表情、動作的毫秒級精準(zhǔn)對齊,復(fù)雜場景下依然穩(wěn)定;多模態(tài)潛在空間規(guī)劃技術(shù)(Latent Multi-Modal Planner),自主協(xié)調(diào)多角色身份、情感與互動邏輯,保障電影級敘事連貫性;中文場景深度適配,以超98%的還原度精準(zhǔn)呈現(xiàn)中文語音細(xì)節(jié)與情感表達(dá);端到端電影級畫質(zhì)生成,通過精準(zhǔn)主體動態(tài)刻畫,打造真實細(xì)膩的人物表現(xiàn)力;大師級運鏡控制,內(nèi)置數(shù)十種專業(yè)鏡頭語言,精準(zhǔn)響應(yīng)文本指令,實現(xiàn)視覺細(xì)節(jié)與創(chuàng)意意圖的完美對齊。
定價低至行業(yè)70% ,百萬級特效降至“百元”
百度蒸汽機2.0技術(shù)突破帶來的不僅是質(zhì)量提升,更是成本結(jié)構(gòu)的根本性變革。傳統(tǒng)影視制作中昂貴的演員、場地、設(shè)備租賃費用,以及繁瑣的后期配音、特效追加等環(huán)節(jié),現(xiàn)在均可通過AI生成實現(xiàn)。國際知名視效指導(dǎo)姚騏現(xiàn)場分享了他用百度蒸汽機模型制作的科幻短片《歸途》?!八尯萌R塢級大片鏡頭不再需要百萬預(yù)算”,姚騏表示。該作品共有40多個鏡頭,每個鏡頭生成3次,共用AI生成超120個片段素材,成本低至百元。
在伊利倍暢成人羊奶粉的AI整合營銷案例中,以百度蒸汽機AIGC視頻生成技術(shù)為核心,伊利倍暢高效打造首支AIGC品牌宣傳片《漂“羊”過海來看你》,將傳統(tǒng)4-6周視頻制作周期大幅壓縮,以較低成本投入實現(xiàn)高品質(zhì)的創(chuàng)意呈現(xiàn),顯著降低制作門檻與營銷成本。
隨著百度蒸汽機全系版本開放,百度同步公布了具有競爭力的價格體系。針對不同需求用戶,平臺提供了梯度會員服務(wù),價格低至行業(yè)同類產(chǎn)品的70%。
視頻AIGC席卷生態(tài)全域,重塑創(chuàng)作者工作流
不同于業(yè)界的模型發(fā)展多由技術(shù)催生,百度蒸汽機的研發(fā)是由應(yīng)用驅(qū)動模型研發(fā)的新范式。來自百度各業(yè)務(wù)場景的、旺盛的應(yīng)用需求,推動著百度蒸汽機模型快速發(fā)展,而模型技術(shù)的迭代,也在反哺著應(yīng)用生態(tài)的創(chuàng)新,包括搜索生態(tài)、內(nèi)容生態(tài)、商業(yè)生態(tài)以及云生態(tài)等。AIGC的涌現(xiàn),大大打開了多模態(tài)內(nèi)容創(chuàng)作的自由度,提高了視頻生成質(zhì)量和效率,并大幅降低了視頻制作成本。目前,百度蒸汽機已在百度生態(tài)廣泛使用。
在百度搜索中,用戶只需點擊視頻創(chuàng)作即可輕松完成從腳本到視頻免費生成,普通用戶也可獲得簡單而驚喜的AI創(chuàng)作體驗;在內(nèi)容創(chuàng)作領(lǐng)域,百度蒸汽機模型與創(chuàng)作工具結(jié)合,正在百家號平臺上為創(chuàng)作者打破專業(yè)壁壘,釋放個體創(chuàng)作自由,在商業(yè)生態(tài),百度蒸汽機視頻生成技術(shù)為營銷客戶提供了高質(zhì)量、低成本的營銷創(chuàng)作新路徑。一汽-大眾攬境借助百度蒸汽機制作的七夕熱點營銷視頻,告別高額拍攝預(yù)算,將“天馬行空”的節(jié)日創(chuàng)意轉(zhuǎn)化為具象視頻內(nèi)容,通過趣味劇情自然傳遞攬境的核心賣點,讓視頻兼具“內(nèi)容屬性”與“營銷屬性”,引發(fā)用戶共鳴。
目前,百度智能云千帆大模型平臺已全面接入百度蒸汽機模型服務(wù),為企業(yè)提供高性能、低成本、安全可控的視頻生成解決方案。通過按量后付、預(yù)付費資源量包、批量計算等極致的資源利用和靈活的計費模式,助力企業(yè)及開發(fā)者低成本用好視頻生成模型。支持企業(yè)在商業(yè)營銷、影視創(chuàng)作、創(chuàng)意特效等五大場景快速落地,實現(xiàn)企業(yè)級AI視頻即開即用。