您現(xiàn)在的位置是:首頁(yè) >每日動(dòng)態(tài) > 2024-06-06 09:00:02 來(lái)源:
開(kāi)源音頻模型Stable Audio Open,文本生成47秒高清音效
6月6日,著名開(kāi)源大模型平臺(tái)Stability.ai在官網(wǎng)宣布,開(kāi)源最新文生音頻模型Stable Audio Open。
用戶通過(guò)文本就能生成最多47秒,鋼琴、笛子、鼓點(diǎn)、模擬人聲等不同類型的44.1kHz音效。
值得一提的是,Stable Audio Open支持?jǐn)?shù)據(jù)微調(diào),歌手、音樂(lè)人可以讓其生成基于自己的音樂(lè)數(shù)據(jù),例如,架子鼓手可以根據(jù)自己的鼓點(diǎn)來(lái)進(jìn)行微調(diào)。
開(kāi)源地址:https://huggingface.co/stabilityai/stable-audio-open-1.0
在線demo:https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero
根據(jù)Stability.ai介紹,Stable Audio Open使用了486,492個(gè)錄音訓(xùn)練數(shù)據(jù),其中472,618個(gè)來(lái)自Freesound,13874個(gè)來(lái)自免費(fèi)音樂(lè)檔案館,并且所有音頻文件均根據(jù) CC0、CC BY或CC Sampling+獲得了商業(yè)許可。
就是說(shuō)通過(guò)Stable Audio Open生成的音效無(wú)需擔(dān)心商業(yè)化問(wèn)題,不會(huì)受到法律方面的追究。
「AIGC開(kāi)放社區(qū)」根據(jù)其提供的在線demo體驗(yàn)了一下,在文本語(yǔ)義理解、生成音效等方面還是相當(dāng)優(yōu)秀。
需要注意的是,目前只支持英文提示詞,其他任何語(yǔ)言都不行,即便你使用了識(shí)別效果也是相當(dāng)?shù)牟睢?/p>
在生成的過(guò)程中,用戶可以對(duì)時(shí)間、擴(kuò)散步數(shù)和CFG進(jìn)行詳細(xì)控制,以達(dá)到更好的效果。例如,一首非常舒適抒情的鋼琴曲。
此外,Stable Audio Open目前只能用于學(xué)術(shù)研究,還無(wú)法商業(yè)化。
猜你喜歡
最新文章
點(diǎn)擊排行
- 硬金是純金嗎(黃金硬金多少錢(qián)一克)
- 計(jì)策謀略的成語(yǔ)(略的成語(yǔ))
- “第一”旗號(hào)滿天飛,紅利基金“花式”較勁出圈
- DHL全球貨運(yùn):未來(lái)三四個(gè)月海運(yùn)運(yùn)力緊張問(wèn)題不會(huì)明顯緩解
- 首批綠色普惠主題金融債基成立,合計(jì)發(fā)行規(guī)模近320億元
- 深圳限牌時(shí)間怎么申請(qǐng)(深圳限牌時(shí)間)
- 我妻由乃經(jīng)典臺(tái)詞(我妻由乃臺(tái)詞)
- 蘋(píng)果天氣應(yīng)用突然宕機(jī) 用戶抱怨:蘋(píng)果最不可靠的應(yīng)用
- 男生仰臥起坐能減肚子嗎(仰臥起坐能減肚子嗎)
- 加拿大央行宣布降息25個(gè)基點(diǎn),為G7國(guó)家“首降”