我們研究視頻到視頻的合成問題,其目的是學(xué)習(xí)從輸入源視頻(例如,一系列語義分割掩碼)到精確描述源視頻內(nèi)容的輸出真實(shí)感視頻的映射功能。
雖然它的圖像對(duì)應(yīng)物(圖像到圖像合成問題)是一個(gè)受歡迎的話題,但是視頻到視頻合成問題在文獻(xiàn)中很少探討。在不了解時(shí)間動(dòng)態(tài)的情況下,將現(xiàn)有的圖像合成方法直接應(yīng)用于輸入視頻通常會(huì)導(dǎo)致視覺質(zhì)量低下的時(shí)間不連貫視頻。
在本文中,我們提出了一種在生成對(duì)抗性學(xué)習(xí)框架下的新穎的視頻合成方法。通過精心設(shè)計(jì)的生成器和鑒別器架構(gòu)以及時(shí)空對(duì)抗目標(biāo),我們可以通過多種輸入格式(包括分割蒙版,草圖和姿勢(shì))獲得高分辨率,逼真的,時(shí)間上連貫的視頻結(jié)果。在多個(gè)基準(zhǔn)上進(jìn)行的實(shí)驗(yàn)表明,與強(qiáng)基準(zhǔn)相比,我們的方法具有優(yōu)勢(shì)。
尤其是,我們的模型能夠合成長達(dá)30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測(cè),其性能超過了幾個(gè)最先進(jìn)的競爭系統(tǒng)。
我們的模型能夠合成長達(dá)30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測(cè),其性能超過了幾個(gè)最先進(jìn)的競爭系統(tǒng)。
我們的模型能夠合成長達(dá)30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測(cè),其性能超過了幾個(gè)最先進(jìn)的競爭系統(tǒng)。
-
視頻
+關(guān)注
關(guān)注
6文章
2012瀏覽量
75180 -
模型
+關(guān)注
關(guān)注
1文章
3811瀏覽量
52257 -
生成器
+關(guān)注
關(guān)注
7文章
322瀏覽量
22791
發(fā)布評(píng)論請(qǐng)先 登錄
昆侖萬維天工AI大模型SkyReels V4登上Artificial Analysis榜單全球第一
嵌入式AI開發(fā)必看:杜絕幻覺,才是工業(yè)級(jí)IDE的核心底氣
NVIDIA和ComfyUI攜手簡化本地AI視頻生成工作流
SeaVerse發(fā)布全球首個(gè)AI Native平臺(tái),“All in AI Native”引領(lǐng)AI創(chuàng)作前瞻革命
商湯科技日日新Seko系列模型與寒武紀(jì)成功適配
OpenAI Sora 2模型上線微軟Azure AI Foundry國際版
全球首個(gè)動(dòng)漫專屬AI視頻生成平臺(tái)Animon,國內(nèi)版"萌動(dòng)AI"正式發(fā)布
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)
【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)
生成式 AI 重塑自動(dòng)駕駛仿真:4D 場景生成技術(shù)的突破與實(shí)踐
一種基于擴(kuò)散模型的視頻生成框架RoboTransfer
4種用于視頻生成的尖端AI技術(shù)
評(píng)論