日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >每日動態(tài) > 2024-06-06 15:35:04 來源:

        AI日報(bào):字節(jié)推王炸級語音生成模型Seed-TTS;Suno新功能被Udio搶跑;騰訊發(fā)布開源混元DiT加速庫;即夢全量上線實(shí)時(shí)畫布功能

        導(dǎo)讀 歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)...

        歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

        新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/

        1、字節(jié)推語音生成模型Seed-TTS 擅長感情控制,聲音與真人無異

        這篇文章介紹了字節(jié)跳動團(tuán)隊(duì)提出的新型語音生成模型Seed-TTS,該模型基于自回歸Transformer架構(gòu),具有極高的語音質(zhì)量和表現(xiàn)力,難以區(qū)分與人類語音的差異。它在情感控制、小說配音和跨語言內(nèi)容創(chuàng)作等方面表現(xiàn)出色,通過自我蒸餾和強(qiáng)化學(xué)習(xí)技術(shù)提升了發(fā)音的自然性和可控性。Seed-TTS在語音合成領(lǐng)域帶來了顯著進(jìn)展,為未來的語音合成技術(shù)開辟了新的可能性。

        2、Stability AI發(fā)布AI音頻模型Stable Audio Open

        Stable Audio Open是Stability AI推出的開源文本轉(zhuǎn)音頻模型,可生成長達(dá)47秒的音頻樣本和音效,適用于音樂制作和聲音設(shè)計(jì)。用戶可以創(chuàng)建鼓點(diǎn)、樂器樂段、環(huán)境聲音等音頻元素,支持音頻變化和風(fēng)格轉(zhuǎn)換。模型提供了穩(wěn)定的音頻生成質(zhì)量和長度,用戶可根據(jù)自定義音頻數(shù)據(jù)微調(diào)模型,提高生成音頻的質(zhì)量和可控性。

        3、Suno新功能被Udio搶跑 上傳任意音頻Udio自動幫延長創(chuàng)作

        這篇文章介紹了Suno原本計(jì)劃推出的新功能被競爭對手Udio搶先發(fā)布的情況。Udio推出了一系列更新,幫助用戶上傳音頻片段并自動解析旋律和和弦,創(chuàng)作出美妙的音樂,并提供了多項(xiàng)便利功能。

        4、騰訊混元發(fā)布開源文生圖大模型混元DiT加速庫

        騰訊混元發(fā)布了針對開源文生圖大模型混元 DiT 的加速庫,可將推理時(shí)間縮短75%,生圖時(shí)間大幅縮短。用戶可通過三行代碼調(diào)用模型,無需下載原始代碼。騰訊混元表示將繼續(xù)優(yōu)化混元 DiT 的開源生態(tài),共建視覺生成開源生態(tài),推動大模型行業(yè)發(fā)展。

        5、MiGPT項(xiàng)目:將小愛音箱接入ChatGPT和豆包

        MiGPT項(xiàng)目將小愛音箱、米家智能設(shè)備與ChatGPT技術(shù)相結(jié)合,創(chuàng)造智能貼心的家庭助手,實(shí)現(xiàn)家庭自動化并建立情感聯(lián)系。項(xiàng)目主要亮點(diǎn)包括LLM回答、角色扮演、流式響應(yīng)、長短期記憶、自定義TTS和智能家居Agent。項(xiàng)目提供兩種啟動方式以適應(yīng)不同用戶需求,配置參數(shù)需用戶自定義以確保連接正常。

        6、猿輔導(dǎo)旗下 AI 設(shè)計(jì)工具 Motiff 妙多全球發(fā)布

        Motiff 妙多是一款定位為 AI 時(shí)代設(shè)計(jì)工具的界面設(shè)計(jì)軟件,通過 AI 技術(shù)優(yōu)化設(shè)計(jì)流程,提高生產(chǎn)效率,為用戶帶來前所未有的設(shè)計(jì)體驗(yàn)。該軟件帶來多項(xiàng)創(chuàng)新,包括 AI 復(fù)制、AI 布局、AI 設(shè)計(jì)系統(tǒng)創(chuàng)建、AI 設(shè)計(jì)系統(tǒng)維護(hù)、AI 一致性檢查等多個(gè) AI 功能,是國內(nèi)首個(gè)自研圖形渲染引擎的界面設(shè)計(jì)軟件。

        7、即夢全量上線實(shí)時(shí)畫布功能

        即夢宣布全量上線實(shí)時(shí)畫布功能,用戶可以通過簡單涂抹形狀并添加提示詞定制圖像,讓AI畫圖更可控。保存為新圖層后可繼續(xù)優(yōu)化,定稿后保存為圖片。

        8、谷歌AI概覽功能觸發(fā)頻率大幅下降

        谷歌的人工智能概述現(xiàn)在只在不到15%的查詢結(jié)果中顯示,與過去84%的情況相比發(fā)生了顯著變化。人工智能在搜索結(jié)果中的呈現(xiàn)方式經(jīng)歷了調(diào)整,以提高搜索質(zhì)量。文章指出人工智能在搜索中的作用不斷演進(jìn),雖然概述功能減少,但人工智能在搜索中的應(yīng)用是不可避免的變化。

        9、研究人員開發(fā)出能識別運(yùn)動員情緒的人工智能

        研究人員利用計(jì)算機(jī)輔助神經(jīng)網(wǎng)絡(luò)成功從網(wǎng)球運(yùn)動員的肢體語言中準(zhǔn)確識別出情緒狀態(tài),展示了人工智能在情緒識別方面的潛力。然而,這項(xiàng)研究也引發(fā)了倫理問題,需要明確相關(guān)法律和道德問題。

        10、Ouroboros3D:通過3D感知實(shí)現(xiàn)圖像到3D的生成

        Ouroboros3D是一個(gè)集成了多視角圖像生成和3D重建的統(tǒng)一3D生成框架。通過遞歸擴(kuò)散過程,實(shí)現(xiàn)了從圖像到3D的生成。研究人員提出的這種新方法具有多個(gè)優(yōu)點(diǎn),包括生成更多樣化和真實(shí)的視角圖像,減少噪聲和失真,提高生成效率。實(shí)驗(yàn)證明Ouroboros3D生成的3D模型具有更好的細(xì)節(jié)和準(zhǔn)確性,接近真實(shí)的3D場景。

        11、Mobile-Agent-v2:讓AI學(xué)會自動刷手機(jī)

        Mobile-Agent-v2是一個(gè)先進(jìn)的AI系統(tǒng),通過多代理協(xié)作架構(gòu)實(shí)現(xiàn)對移動設(shè)備的全面控制,提高任務(wù)完成率30%以上。該系統(tǒng)能夠自動化完成搜索購買商品、郵件發(fā)送、導(dǎo)航設(shè)置和視頻觀看等任務(wù),為用戶帶來更多便利。

        12、美國監(jiān)管機(jī)構(gòu)將對微軟、OpenAI和英偉達(dá)展開反壟斷調(diào)查

        這篇文章報(bào)道了美國司法部和聯(lián)邦貿(mào)易委員會達(dá)成協(xié)議,將針對微軟、OpenAI和英偉達(dá)展開反壟斷調(diào)查。監(jiān)管機(jī)構(gòu)對人工智能產(chǎn)業(yè)的關(guān)注度顯著提高,反映出AI行業(yè)的重要性和影響力。