隨著Sora爆火,國內(nèi)運營商企業(yè)也開始與快手等公司一起“卷”AI 視頻賽道了。2024 年 12 月 3 日,在中國電信 “2024 數(shù)字科技生態(tài)大會” 上,中電信人工智能科技有限公司和中國電信人工智能研究院(TeleAI)發(fā)布了首個央企全自研視頻生成大模型. 以下是對該事件及相關(guān)預(yù)測的具體介紹:
- 核心技術(shù)領(lǐng)先:該模型實現(xiàn)了從文字到分鏡圖和從分鏡圖到視頻的端到端生成,在主體目標(biāo)時空一致性、個體復(fù)雜動作精準(zhǔn)控制、交互式動作精確控制及角色動作符合物理規(guī)律等核心技術(shù)上達(dá)到全國領(lǐng)先水平.
- 應(yīng)用場景廣泛:可通過整合語義、語音、文生圖、文生視頻等全棧大模型能力,打通短視頻及影視劇制作的各個環(huán)節(jié),覆蓋文字腳本撰寫、分鏡腳本繪制、視頻拍攝及剪輯、配音及音效合成等全流程,提升視頻創(chuàng)作效率,實現(xiàn)降本增效,主要應(yīng)用于高質(zhì)量可控短劇生成,賦能文宣產(chǎn)業(yè)創(chuàng)新發(fā)展.
- 評測排名第一:目前,該視頻生成大模型在權(quán)威視頻生成評測榜單 VBench 中排名第一,在 VBench 的 16 個評分項目中,一舉奪得 9 項第一,覆蓋了模型的畫面穩(wěn)定性、語義一致性、空間場景以及視覺風(fēng)格等幾個核心能力,其中有 5 項得分超過 99%.
中電信人工智能公司還構(gòu)建了視覺大模型產(chǎn)用一體化平臺,作為央企首個自主研發(fā)的視覺大模型產(chǎn)用一體化系統(tǒng),為政務(wù)、應(yīng)急、工業(yè)、能源等多個行業(yè)的開發(fā)人員提供全方位賦能,實現(xiàn)全流程提效.
據(jù) Fortune Business Insights 數(shù)據(jù),2032 年全球 AI 視頻生成市場規(guī)模將超過 180 億元,增至 25.629 億美元(約合人民幣 186.36 億元),年復(fù)合增長率 19.5%,市場前景廣闊.從近期實踐來看,AI手機、AI PC等智能終端逐步走進(jìn)日常生活,行業(yè)大模型在金融、工業(yè)、醫(yī)療等領(lǐng)域加快落地,借助大模型解決生產(chǎn)實際問題逐步形成共識。 |