人工智能在去年給人類帶來巨大沖擊,不少聲音指出在創(chuàng)意等方面人類尚無法被其取代。這一想法再次遭到挑戰(zhàn)。當?shù)貢r間2月15日,人工智能巨頭,ChatGPT母公司OpenAI宣布,正在研發(fā)“文生視頻”模型Sora,可創(chuàng)建長達60秒的視頻,其中包含高度詳細的場景、復(fù)雜的攝像機運動以及充滿活力的情感的多個角色,也可以根據(jù)靜態(tài)圖像制作動畫。根據(jù)OpenAI官網(wǎng),Sora不僅了解用戶提出的要求,還了解這些東西在物理世界中的存在方式。
目前,Sora仍在開發(fā)中,正在接受安全測試,尚未向公眾開放使用。OpenAI CEO奧特曼在社交平臺上向公眾征集他們想看到的視頻,表示公司將制作并發(fā)布。
OpenAI CEO奧特曼在社交平臺發(fā)布Sora視頻。
Sora視頻一出,立刻震驚業(yè)界。此前,其他企業(yè)也有類似文本生成視頻的AI模型,其中,谷歌正在測試名為Lumiere的模型,Meta則有名為Emu的模型,還有人工智能初創(chuàng)企業(yè)Runway也在開發(fā)相應(yīng)產(chǎn)品來幫助制作視頻。
針對Sora視頻的發(fā)布,Runway聯(lián)合創(chuàng)始人兼首席執(zhí)行官Cristóbal Valenzuela 回應(yīng)道,“游戲已經(jīng)開始”。Runway是一家AI視頻公司,幾個月前剛剛推出了AI視頻模型的第2代更新,并且已可供所有人使用。
人工智能圖像生成領(lǐng)域的另一家領(lǐng)導(dǎo)者Stability AI在去年11月推出了生成視頻模型Stable Video Diffusion,但表示它“專門用于研究”,尚未準備好用于“現(xiàn)階段的現(xiàn)實世界或商業(yè)應(yīng)用”(有一個等待名單,但該公司尚未透露何時發(fā)布)。
Pika Labs是AI視頻領(lǐng)域的新晉競爭者,它于去年11月推出了生成式AI視頻工具Pika 1.0,并于去年12月底宣布“等待(名單)已結(jié)束”,并向所有人開放。
谷歌最近發(fā)布了下一代人工智能模型Gemini 1.5,并公布了Lumiere 模型的研究和演示片段,不過目前還不清楚谷歌計劃何時公開該工具,該公司表示需要強大的工具來對抗偏見和惡意內(nèi)容,確保其技術(shù)能夠安全部署。
Meta擁有包括Facebook、Instagram和WhatsApp在內(nèi)的穩(wěn)定應(yīng)用程序,并于2022年首次推出了一款名為Make-A-Video的視頻生成工具,該工具生成的內(nèi)容明顯虛假、扭曲和模糊,但在當時仍然是一項重大成就。
Meta在去年年底推出了一種新的文本轉(zhuǎn)視頻模型Emu Video,并表示幾乎所有使用它的人都將其在質(zhì)量和對文本提示的忠實度方面評為高于“僅僅制作一個視頻”(Make-A-Video),在談到該工具何時發(fā)布時,Meta首席執(zhí)行官馬克扎克伯格表示,Emu將被整合到Facebook和Instagram中。
特斯拉CEO埃隆·馬斯克的人工智能初創(chuàng)公司xAI希望能夠與DeepMind和OpenAI等行業(yè)領(lǐng)導(dǎo)者競爭,但尚未宣布文本到視頻生成器的計劃,盡管這種功能可能會融入到其人工智能聊天機器人 Grok中。
此外,亞馬遜已經(jīng)透露了一款面向工人的生成式人工智能聊天機器人Q和人工智能圖像生成器,盡管這家電子商務(wù)巨頭尚未透露何時計劃推出這些工具,也沒有透露是否會推出更先進的視頻生成器。
本文鏈接:OpenAI首個視頻模型發(fā)布,競爭者有誰、何時可供使用?http://m.sq15.cn/show-11-3012-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇: 湖南大學(xué)全國重點實驗室+4!