您現(xiàn)在的位置是:首頁(yè) >每日動(dòng)態(tài) > 2024-06-07 09:15:01 來(lái)源:
實(shí)測(cè)完快手的AI視頻「可靈」后,我覺(jué)得這才是第一個(gè)中國(guó)版Sora
昨天,6月6號(hào),是快手的13周年生日。
在這一天,所有AI圈的人都想不到,快手在13周年之際,沒(méi)有任何預(yù)兆、沒(méi)有任何宣傳,直接發(fā)布了他們的AI視頻大模型。
可靈。
給我也干了個(gè)措手不及。
我當(dāng)時(shí)正在看360的發(fā)布會(huì),突然手機(jī)就叮叮當(dāng)當(dāng)一頓狂響,打開(kāi)一看,一群人跟我說(shuō):快快快,看快手,他們發(fā)AI視頻模型了。
我當(dāng)時(shí)想著,發(fā)個(gè)AI視頻模型就發(fā)個(gè)AI視頻模型唄,能有啥大驚小怪的,這年頭,做AI視頻的多了。要么就是發(fā)了個(gè)老技術(shù)的產(chǎn)品給大家先用著占坑,要么就是發(fā)了個(gè)Sora那種新技術(shù)的純PR視頻,又不給用純粹To VC的。還能有啥。
打開(kāi)快手的模型官網(wǎng)一看,嚯,新技術(shù)的,運(yùn)動(dòng)幅度跟Sora有的一拼,還能支持最長(zhǎng)2分鐘。這就有點(diǎn)意思了。
然后,即刻開(kāi)放邀測(cè)。
雖然不抱有能用的希望,但是我秉持著來(lái)都來(lái)了的原則,還是去申請(qǐng)了一下。
申請(qǐng)流程:下載快影APP - AI玩法 - AI生視頻模塊 - 填問(wèn)卷申請(qǐng)。
我本來(lái)以為,跟兩個(gè)月前的某AI視頻產(chǎn)品一樣,說(shuō)是比Sora還好,但是我申請(qǐng)了兩個(gè)月都沒(méi)動(dòng)靜。
結(jié)果沒(méi)過(guò)幾個(gè)小時(shí),我就收到了快手的短信。。。
不是哥們,你來(lái)真的啊?
你說(shuō)的發(fā)布居然是真發(fā)啊,居然當(dāng)天真的給人用啊?你居然不是畫(huà)餅啊?
這一下,給我整不會(huì)了...
快手不愧是老鐵,真實(shí)誠(chéng)。
到家了之后,我花了好幾個(gè)小時(shí),跑了100多個(gè)case,又跟好基友@吉川明靜勾兌了一下他那邊的case。差不多有了一些不是特別全面的認(rèn)知。
但,有一句話,我覺(jué)得是可以放心說(shuō)了。
快手的可靈,就是我認(rèn)為正兒八經(jīng)的,經(jīng)過(guò)驗(yàn)證的,而且還能上手直接用的,第一個(gè)中國(guó)版Sora。
不過(guò)可靈是大模型,真正變成產(chǎn)品,還是有很多限制的,比如算力、功能、開(kāi)發(fā)周期等等。
所以現(xiàn)在可以使用的版本,并不是完全體。
比如現(xiàn)在的固定時(shí)間只能為5s、不支持圖生視頻只支持文生、不能自定義尺寸等等。
但是都無(wú)關(guān)大雅,因?yàn)樗腥藢?duì)Sora的興奮點(diǎn),不是那些功能,而是他那最核心的:
極度真實(shí)的物理規(guī)律。
而這一點(diǎn),快手可靈,做到了。
隨手放幾個(gè)我跑的case,第二個(gè)是吉川跑的。
這運(yùn)動(dòng)幅度、物理規(guī)律的穩(wěn)定性,就非常的離譜。
如果不涉及人與人、或者人與物體之間復(fù)雜的交互,那可靈的物理表現(xiàn),幾乎可以稱的上完美。
畢竟,連吃面條這種坑死所有AI視頻產(chǎn)品的case,都能搞定掉。做一些復(fù)雜的動(dòng)作或者細(xì)膩的表情,也都沒(méi)啥問(wèn)題。比如:
但是我們真的去看一部電影、一部電視劇,里面還是有很多復(fù)雜交互的。
比如最常見(jiàn)的打斗戲、比如操作一臺(tái)極其精密的設(shè)備等等。而這些,也是物理難度最高的,連Sora處理的都非常的一般。
可靈自然也不例外,在復(fù)雜交互上,目前還有很大的進(jìn)步空間。比如我跑的這個(gè)決斗場(chǎng)景。
但至少,他給了我們一個(gè)新的可能性。如果大家留意一下過(guò)往的所有AI視頻,你用圖生視頻的方式去做,是幾乎不可能做出這種交互鏡頭的,都是用蒙太奇或者AE去替代掉。而現(xiàn)在,有希望了。
而在單人鏡頭上,人物在沒(méi)有支點(diǎn)(比如空中墜落)的時(shí)候,會(huì)發(fā)生一定程度上的變形。同時(shí)如果人物在畫(huà)面中比例較小的時(shí)候,也會(huì)發(fā)生糊臉現(xiàn)象,這個(gè)是現(xiàn)在AI的通病,不僅AI視頻有,AI繪圖一樣也有。等未來(lái)數(shù)據(jù)集和技術(shù)迭代吧。
還有一個(gè)很意外的片段,我自己非常非常喜歡。
Prompt是:“你站在橋上看風(fēng)景,看風(fēng)景的人在樓上看你。明月裝飾了你的窗子,你裝飾了別人的夢(mèng)?!?/p>
雖然出來(lái)的視頻,跟Prompt稍微有那么一些的不搭嘎,但是這個(gè)片段,真的屬于意外之喜,我非常非常的喜歡。
目前看下來(lái),可靈在“真實(shí)風(fēng)格”的場(chǎng)景上,表現(xiàn)的最好,而在一些風(fēng)格化的表現(xiàn)上,就會(huì)比“真實(shí)風(fēng)格”上,稍微遜色一些。
比如我的這段Prompt:
“擬人化的穿著西裝的狗,提著包在公交車上,窗外是飛馳而過(guò)的城市”
如果是真實(shí)風(fēng)格,效果就會(huì)非常好。
但是如果改成動(dòng)漫風(fēng)格,就會(huì)傻里傻氣很多...
可靈整體上,在Prompt的依從性上,個(gè)人覺(jué)得在AI視頻里,肯定是第一梯隊(duì),但是如果你跟AI繪圖的頭部、跟文本大模型的頭部去比,那感覺(jué)還是會(huì)差一些。
比如:“一只企鵝穿著西裝,在辦公室里開(kāi)會(huì),用嚴(yán)肅的表情進(jìn)行演講”,西裝丟了,只剩企鵝了。
比如:“一只穿著盔甲的貓騎著獨(dú)角獸在彩虹上奔馳,穿越魔法森林,背景是古老的城堡”,奔馳這個(gè)動(dòng)作沒(méi)了,直接不動(dòng)了。
不過(guò)這也不是什么大問(wèn)題,畢竟這才第一版,還在內(nèi)測(cè),這些做好了,都是錦上添花的東西。
模型的質(zhì)量,模型的物理規(guī)律,才是真正的核心,真正的重中之重。
這一點(diǎn),快手可靈,除了那個(gè)沒(méi)發(fā)布的Sora之外,基本碾壓所有同行。
我現(xiàn)在非常期待可靈的圖生視頻功能。
因?yàn)閷?duì)于專業(yè)的AI視頻創(chuàng)作者來(lái)說(shuō),基本上還是會(huì)用圖生視頻,因?yàn)榭煽匦愿鼜?qiáng),一致性的控制更方便一點(diǎn)。而文生視頻,還是會(huì)更偏向于普通用戶一些。
說(shuō)實(shí)話,我現(xiàn)在已經(jīng)有了一個(gè)非常想做的AI作品的故事。
現(xiàn)在,我真的非常非常想用快手可靈,把他做出來(lái)。
畢竟,這是真正的第一個(gè),中國(guó)版Sora。
哪個(gè)創(chuàng)作者會(huì)不興奮,會(huì)沒(méi)有創(chuàng)作欲望呢?
就看什么時(shí)候,快手可靈能更新它的圖生視頻功能了。
我期待著那一天。
謝謝你,快手。
猜你喜歡
最新文章
點(diǎn)擊排行
- 17歲女孩酷似87版林黛玉走紅:正努力學(xué)習(xí)表演技巧
- 摩根士丹利財(cái)富管理CIO:美股下半年將進(jìn)一步上漲
- 鑫字適合什么生肖(鑫和什么字搭配寓意好)
- 三角函數(shù)公式表格30 45 60(三角函數(shù)公式表)
- 沙特阿美股票發(fā)售計(jì)劃吸引強(qiáng)勁海外需求,西方、亞洲投資者興趣皆濃
- 抖音發(fā)布高考期間戶外直播規(guī)范 ?禁止戶外直播干擾考場(chǎng)秩序
- 動(dòng)感音樂(lè)相冊(cè)制作下載(動(dòng)感音樂(lè)相冊(cè))
- 武漢生物工程學(xué)院專業(yè)代碼查詢(武漢生物工程學(xué)院專業(yè))
- 美國(guó)火山噴發(fā)(美國(guó)火山)
- 廣東女生粵式英語(yǔ)帶火走地雞:稱不考慮用流量賺錢