音樂領(lǐng)域的“ChatGPT”要來(lái)了嗎?

2024-03-27 19:33

輸入音樂流派風(fēng)格、內(nèi)容主題,只需幾秒鐘內(nèi)就可生成2分鐘音樂......生成式人工智能再次在音樂領(lǐng)域?yàn)槿藗儙?lái)驚喜。 

近日,人工智能初創(chuàng)企業(yè)Suno對(duì)外發(fā)布了Suno模型V3版本。據(jù)介紹,在V2版本基礎(chǔ)上,V3版本增加了更多音樂風(fēng)格和流派,同時(shí)也加強(qiáng)了對(duì)提示詞的依從性,減少了幻覺問題。

目前Suno V3支持自定義模式,用戶可以在自定義模式中通過輸入歌詞、標(biāo)題、音樂風(fēng)格、勾選是否純器樂來(lái)生成音樂作品;也可以在非自定義模式下以更為簡(jiǎn)單的提示詞生成作品。

界面新聞以“A jazz song that describes happy love(一首描述幸福戀愛的爵士樂歌曲)”作為提示詞輸入Suno V3,以下為模型生成的音樂作品鏈接及歌詞:(歌詞翻譯由kimi智能助手完成)

https://app.suno.ai/song/c066c053-e038-493b-a48d-095a9891b1cb
 
The moon is shining bright above
月光皎潔,高懸天際
As we sway to the rhythm of love
我們隨著愛的旋律輕輕搖擺
Your touch, it sets my heart on fire
你的輕撫,如火點(diǎn)燃我的心房
In this moment, nothing could be higher
此刻情深,無(wú)物能及
 
The sweet melody fills the air
甜美旋律,充盈夜空
As we dance without a care
我們翩翩起舞,無(wú)憂無(wú)慮
Your eyes, they sparkle like stars
你的雙眸,如繁星般璀璨
In this jazz embrace, we're taking it far
在爵士的懷抱里,我們遨游至遠(yuǎn)方
 
Oh, this love is like a moonlit serenade
哦,此情此景,宛如月下小夜曲
A harmony that will never fade
和諧旋律,永不消逝
In your arms, I find my solace and peace
在你懷中,我尋得安寧與寧?kù)o
Together, we create a love masterpiece
攜手共繪,愛的絕世佳作

據(jù)滾石雜志報(bào)道,Suno創(chuàng)業(yè)團(tuán)隊(duì)僅成立不到兩年時(shí)間,由Mikey Shulman、Keenan Freyberg、Georg Kucsko和Martin Camacho聯(lián)合創(chuàng)立。四人都是機(jī)器學(xué)習(xí)方面的專家,此前曾一同就職于人工智能企業(yè)Kensho。其中,Shulman和Camacho也是音樂家,常常一同即興演出。

在技術(shù)路徑方面,與ChatGPT等大語(yǔ)言模型類似,Suno將人類語(yǔ)言以token為單位進(jìn)行分解,吸收其用法、結(jié)構(gòu)之后再根據(jù)需求進(jìn)行重新輸出。但與可以被輕易拆分的純文本不同,音頻往往以連續(xù)信號(hào)的形式出現(xiàn),這使得AI對(duì)音樂的理解和生成變得更加困難。

相似的訓(xùn)練思路使得Suno可能面臨OpenAI所遭受的版權(quán)訴訟。2023年12月,《紐約時(shí)報(bào)》曾以侵犯版權(quán)為由起訴OpenAI和微軟,要求兩家公司銷毀任何使用到《紐約時(shí)報(bào)》版權(quán)材料的聊天機(jī)器人模型和訓(xùn)練數(shù)據(jù)。Suno創(chuàng)始團(tuán)隊(duì)并未透露模型的訓(xùn)練數(shù)據(jù),只透露了模型會(huì)通過學(xué)習(xí)語(yǔ)音錄音來(lái)了解人類聲音的特質(zhì)。

Suno v3發(fā)布后,Suno創(chuàng)始團(tuán)隊(duì)于社交媒體上發(fā)文表示,目前Suno模型仍處于早期階段,未來(lái)還將沿著質(zhì)量、可控和速度上進(jìn)行改進(jìn),并透露V4正在開發(fā)中。同時(shí),為了防止模型作品被濫用,Suno還開發(fā)了專有的無(wú)聲水印技術(shù),用以檢測(cè)歌曲是否是使用Suno創(chuàng)作的。

在人工智能音樂創(chuàng)作方面,如谷歌、Stability AI都曾發(fā)布過類似產(chǎn)品,谷歌的Dream Track支持用戶使用名人聲音制作自己的歌曲,Stability AI所發(fā)布的Stable Audio AI則可以生成45秒左右的曲目。

目前Suno只有12名左右員工,但在上述報(bào)道中創(chuàng)始團(tuán)隊(duì)表示他們計(jì)劃擴(kuò)大規(guī)模。與此同時(shí),他們也表示目前Suno模型還沒接近完美,還有大量的工作要去做。其中一個(gè)方向是,Suno希望能以更直觀的交互方式來(lái)替換文本轉(zhuǎn)音樂的方案,如根據(jù)用戶自己的演唱生成歌曲。


來(lái)源:界面新聞 作者:于浩

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【界面新聞】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞