您現(xiàn)在的位置是:首頁 >每日動態(tài) > 2024-06-17 16:10:07 來源:
AI日報:Luma官方親自下場夸自家“孩子”;日本藝術(shù)家用Luma復(fù)活妻子看哭網(wǎng)友;蘋果AI可能要放大家“鴿子”;北大快手聯(lián)合推視頻生成框架VideoTetri
歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、Luma 官方發(fā)視頻介紹Dream Machine模型特點(diǎn)
我看了站長之家關(guān)于Luma官方發(fā)布的Dream Machine模型介紹視頻,感覺這款A(yù)I視頻生成工具非常強(qiáng)大。它不僅提供高質(zhì)量的視頻輸出,而且能夠快速理解用戶的提示,生成符合美學(xué)風(fēng)格的視頻內(nèi)容。這對于創(chuàng)意迭代過程非常有幫助,讓視頻生成變得更加高效。
2、新對口型視頻項(xiàng)目Hallo發(fā)布 可對表情,嘴型進(jìn)行精確控制
新對口型視頻項(xiàng)目Hallo發(fā)布,通過單張圖像和音頻輸入生成唱歌和說話的視頻,實(shí)現(xiàn)精確控制人物表情和姿態(tài),提升語音輸入與生成動畫之間的對齊精度。該技術(shù)不僅可用于虛擬角色動畫生成,還可應(yīng)用于真實(shí)人物,支持多種運(yùn)動控制,跨演員應(yīng)用,以及歌唱動畫生成。技術(shù)先進(jìn),動畫逼真,具有廣泛的應(yīng)用潛力。
3、北大快手聯(lián)合推視頻生成框架VideoTetris 復(fù)雜視頻生成效果超越Pika
本文介紹了北京大學(xué)與快手AI團(tuán)隊合作攻克復(fù)雜視頻生成難題,提出VideoTetris框架,成功超越商用模型Pika和Gen-2。該框架定義了組合視頻生成任務(wù),支持復(fù)雜指令和長視頻生成,保留位置信息和細(xì)節(jié)特征。團(tuán)隊采用時空組合擴(kuò)散方法,優(yōu)化訓(xùn)練數(shù)據(jù)預(yù)處理和引入?yún)⒖紟⒁饬C(jī)制,生成更具動感和自然的視頻。
4、日本AI藝術(shù)家用Luma復(fù)活妻子 網(wǎng)友淚目
這篇文章講述了65歲的AI藝術(shù)家松尾公也用技術(shù)復(fù)活了他逝去11年的妻子Tori-chan,感動了無數(shù)人。通過AI技術(shù),他重新編曲、錄制妻子的歌曲,制作動態(tài)視頻,并提取翻譯她的信件,表達(dá)對妻子的思念和愛意。這是一個普通人用技術(shù)造夢的故事,展現(xiàn)了愛在AI時代的力量和溫度。
5、清華與北大合作發(fā)布長視頻理解基準(zhǔn)測試:LVBench
本文介紹了智譜、清華大學(xué)和北京大學(xué)合作推出的長視頻理解基準(zhǔn)測試項(xiàng)目LVBench,旨在彌補(bǔ)現(xiàn)有多模態(tài)大型語言模型在處理長視頻方面的挑戰(zhàn)。該項(xiàng)目包含多類別的數(shù)小時QA數(shù)據(jù),涵蓋不同類型的視頻內(nèi)容,旨在推動長視頻領(lǐng)域的技術(shù)突破和創(chuàng)新。許多研究機(jī)構(gòu)已在LVBench數(shù)據(jù)集上展開工作,為視頻理解和多模態(tài)學(xué)習(xí)領(lǐng)域注入新活力。
6、網(wǎng)格生成模型MeshAnything:將任何3D轉(zhuǎn)換為藝術(shù)家創(chuàng)建的網(wǎng)格
近期,由重建和生成創(chuàng)建的3D資產(chǎn)已經(jīng)達(dá)到了手工制作資產(chǎn)的質(zhì)量水平,凸顯了它們在替代領(lǐng)域的潛力。MeshAnything是一種用于生成藝術(shù)家創(chuàng)建的3D網(wǎng)格的自動回歸模型,通過VQ-VAE和形狀條件的僅解碼器變壓器實(shí)現(xiàn)高質(zhì)量的網(wǎng)格生成。該方法顯著提高了存儲、渲染和模擬效率,同時保持與以往方法相當(dāng)?shù)木取?/p>
7、哈佛神經(jīng)科學(xué)家和谷歌DeepMind在虛擬老鼠中創(chuàng)建人工大腦
這篇文章介紹了哈佛大學(xué)研究人員與谷歌DeepMind團(tuán)隊合作,利用人工智能技術(shù)為虛擬老鼠創(chuàng)建人工"大腦"的突破性研究。他們成功建立了生物力學(xué)逼真的3D老鼠模型,并利用DeepMind的深度強(qiáng)化學(xué)習(xí)算法訓(xùn)練了一個人工神經(jīng)網(wǎng)絡(luò)大腦,實(shí)現(xiàn)了超越真實(shí)的模擬效果。這一創(chuàng)新有望為神經(jīng)科學(xué)和人工智能領(lǐng)域帶來革命性進(jìn)展。
8、麥當(dāng)勞宣布結(jié)束與 IBM 的 AI 得來速訂購合作
麥當(dāng)勞宣布結(jié)束與 IBM 的 AI 得來速訂購合作,將在2024年7月26日前移除在100多家餐廳中測試的技術(shù)。盡管目前尚不清楚麥當(dāng)勞為何結(jié)束與 IBM 的合作,但該公司表示正在測試語音接單聊天機(jī)器人是否能加快服務(wù)速度,并對測試結(jié)果表示自信。餐飲行業(yè)普遍渴望引入 AI 技術(shù)來提升效率。
9、研究:人們與ChatGPT對話五分鐘,很難區(qū)分是否為人類
大型語言模型(LLMs)如 GPT-4模型在聊天平臺ChatGPT展現(xiàn)出驚人能力,難以區(qū)分其生成的文本是否為人類所寫。加州大學(xué)圣迭戈分校研究發(fā)現(xiàn),人們與GPT-4對話時很難分辨其是否為人類,展示出機(jī)器展現(xiàn)人類智能的程度。
10、多模態(tài)模型的畫布框架Sketchpad:提升多模態(tài)模型數(shù)學(xué)能力
這篇文章介紹了研究人員引入的“Sketchpad”概念,為多模態(tài)LM提供了視覺畫板和繪圖工具,使其能夠進(jìn)行視覺推理。通過實(shí)驗(yàn)結(jié)果顯示,Sketchpad顯著提高了LM在數(shù)學(xué)任務(wù)和復(fù)雜的視覺推理任務(wù)上的表現(xiàn),進(jìn)一步接近人類的思維方式,為人工智能技術(shù)的發(fā)展開辟了新的可能性。