电竞比分网-中国电竞赛事及体育赛事平台

分享

我用Suno給你寫了首歌

 王智遠(yuǎn)同學(xué) 2024-03-24 發(fā)布于北京

文:王智遠(yuǎn) | ID:Z201440

我對(duì)生成式AI特別感興趣。

這個(gè)領(lǐng)域涵蓋文本、圖片、聲音、視頻和3D模型五個(gè)方面。我猜你也聽(tīng)說(shuō)過(guò),甚至用過(guò)一些;對(duì)我來(lái)說(shuō),音樂(lè)很重要,因?yàn)槊刻觳畈欢嘤?/12的時(shí)間都在聽(tīng)歌。
去年5月,有件事特別火。
有人用AI技術(shù)翻唱一首孫燕姿的歌曲,不少人聽(tīng)完后表示,唱的跟本人一樣好聽(tīng),本人還在社交媒體上表達(dá)說(shuō):擁抱AI,人類比不過(guò)AI,做好自己就行。
緊接著一個(gè)月內(nèi)容,市面冒出來(lái)上千首用AI技術(shù)翻唱的歌,這些歌橫跨了幾十年的流行音樂(lè)。
當(dāng)時(shí),我還研究一陣。發(fā)現(xiàn)這些歌曲用音色替換的技術(shù)制作而成,該技術(shù)基于so-vits-svc開(kāi)源項(xiàng)目開(kāi)發(fā),門檻非常低,你要感興趣,也能學(xué)會(huì)。

但后來(lái),由于工作關(guān)系加上下半年AIGC(AI生成內(nèi)容)技術(shù)爆炸式發(fā)展,我的興趣點(diǎn)也就跟著轉(zhuǎn)移了。不過(guò),最近發(fā)現(xiàn),AI音樂(lè)技術(shù)又有了新的進(jìn)步。

01

進(jìn)步在哪呢?

以前用so-vits-svc工具時(shí),要懂一些基礎(chǔ)、且專業(yè)知識(shí)。
像怎么采集音頻、編輯波形、把人聲伴奏分開(kāi),以及音頻訓(xùn)練推理技巧等,這些是處理和生成音頻文件必要的基礎(chǔ)。
如果你要用自己的聲音來(lái)做歌曲,得先上傳幾段自己的聲音,讓系統(tǒng)學(xué)習(xí)。這個(gè)所謂“訓(xùn)練”過(guò)程會(huì)電腦顯卡負(fù)荷很大,通常持續(xù)好幾個(gè)小時(shí)。
過(guò)程中,還會(huì)用到一些插件。
比如有8種不同的編碼器,每種都適用于不同的情景,有些插件不提供預(yù)先訓(xùn)練的模型,你還得自己訓(xùn)練一番;所以,看似簡(jiǎn)單的步驟對(duì)小白來(lái)說(shuō),也有點(diǎn)復(fù)雜。
現(xiàn)在不一樣了。
3月22日,位于美國(guó)加州舊金山的一家人工智能公司Anthropic,他們開(kāi)發(fā)的音頻軟件Suno AI進(jìn)行一次重大升級(jí),幾個(gè)簡(jiǎn)短文字,一閃而過(guò)的靈感,立馬變成一首歌曲。
Suno AI的官網(wǎng):https://app./?
可以先用谷歌注冊(cè)一個(gè)賬號(hào),然后點(diǎn)擊右上角的“make a song”按鈕,接下來(lái)點(diǎn)擊“create”,就能進(jìn)入創(chuàng)作頁(yè)面了。
目前官網(wǎng)上,有很多用戶上傳了他們用AI創(chuàng)作的歌曲,可以隨便聽(tīng)聽(tīng),其中不少華人創(chuàng)作的。

Pic?https://app.官網(wǎng)

比如:
有一首是用“中國(guó)傳統(tǒng)民樂(lè)、慢板、空靈、天使之音”幾個(gè)關(guān)鍵詞生成的全新版本《水調(diào)歌頭(明月幾時(shí)有)》(和我們熟悉的《但愿人長(zhǎng)久》不一樣的版本)。
還有一首用“歌劇”這個(gè)提示詞創(chuàng)作的《宮保雞丁》,歌詞,居然是一整套宮保雞丁的菜譜,簡(jiǎn)直不要太離譜。
suno有免費(fèi)模式可以使用,每日贈(zèng)送50積分,而每次生成都會(huì)一起生成2首歌,每首歌小耗5積分,性價(jià)比比較高。
也有專業(yè)計(jì)劃和尊貴計(jì)劃,前者8美金/月;附帶2500積分(500首歌曲);后者24美金/月,附增10,000 個(gè)積分(2.000 首歌曲)。
來(lái)聽(tīng)聽(tīng)我寫的歌曲:?
如果不是專業(yè)選手使用,免費(fèi)的玩玩還可以,對(duì)了,我特別找了下,國(guó)內(nèi)有個(gè)網(wǎng)站跟它挺像,功能差不多,還能免費(fèi)試用,不過(guò),如果要充值,得注意真假。
目前suno ai創(chuàng)作模式有兩種:
1.半自動(dòng)模式?
只要提供一些簡(jiǎn)單的信息,比如,你想要的音樂(lè)風(fēng)格、描述和氛圍等關(guān)鍵詞,然后點(diǎn)擊“創(chuàng)建”,剩下的交給AI來(lái)完成,它能把歌詞曲調(diào)都幫你弄好。
2.自定義模式
這個(gè)模式下,你可以詳細(xì)輸入想要的歌詞、音樂(lè)類型、風(fēng)格和氛圍等,AI會(huì)根據(jù)這些信息來(lái)為你創(chuàng)作歌曲。過(guò)程也比較快,基本上幾秒鐘就能完成。

而且,在創(chuàng)作頁(yè)面如果開(kāi)啟了Instrumental(器樂(lè))選項(xiàng),它還會(huì)為你制作一首不含歌詞的純音樂(lè);個(gè)人而言,我更喜歡自定義模式。

02

問(wèn)題來(lái)了:很多人說(shuō)我不會(huì)寫歌詞流派怎么辦?

也不用擔(dān)心,用AI工具生成歌詞后再給Suno,這樣效果會(huì)更好。我總結(jié)了一下,一首歌曲的有效提示詞包括四個(gè)因素,分別是音樂(lè)風(fēng)格、情緒、樂(lè)器,以及節(jié)奏。
什么是音樂(lè)風(fēng)格呢?
比如,通俗易懂的流行風(fēng)(Pop)、強(qiáng)調(diào)節(jié)奏的搖滾風(fēng)(Rock)、即興演奏爵士風(fēng)(Jazz)、歐洲傳統(tǒng)巴洛克的浪漫古典風(fēng)(Classical)。
以及電子風(fēng)(Electronic)、嘻哈音樂(lè)(Hip Hop/Rap)、R&B(Rhythm and Blues)、鄉(xiāng)村音樂(lè)(Country)、民謠音樂(lè)(Folk)等等。
情緒你應(yīng)該知道,是歡快、悲傷、浪漫還是激動(dòng)人心的?樂(lè)器方面,你傾向于鋼琴、吉他、小提琴還是鼓?至于節(jié)奏,有快節(jié)奏、慢節(jié)奏適中的節(jié)奏等等。
舉幾個(gè)例子:
如果你想要一首活力四射的流行電子舞曲,就跟AI說(shuō),我想寫一首歡快、流行、電子、舞曲、快節(jié)奏的歌曲;
假如你想要一首溫柔又浪漫的古典鋼琴曲,那就告訴AI,你想要一首浪漫、古典、用鋼琴?gòu)椬嗟?,而且?jié)奏要慢的曲子。
如果你想聽(tīng)一首讓人陷入深思的悲傷爵士薩克斯曲,就用這些關(guān)鍵詞:憂郁、爵士、薩克斯風(fēng)、即興演奏,節(jié)奏保持在中等。
對(duì)于那種能讓人熱血沸騰的搖滾吉他曲,你可以這么說(shuō):我想要一首充滿激情的搖滾歌,用電吉他彈奏,節(jié)奏要快;而如果你希望聽(tīng)到一首暖心的民謠木吉他曲,那就描述成:想聽(tīng)一首溫馨的民謠,用木吉他演奏,風(fēng)格輕柔。
......
你可以自由地混搭各種音樂(lè)風(fēng)格,像電子即興演奏、鋼琴土嗨這樣的組合,只有想不到?jīng)]有做不到,寫的越詳細(xì),生成的越精準(zhǔn),
你還可以選擇直接在Suno上填入這些關(guān)鍵詞,或利用AI工具,先生成好,然后把結(jié)果復(fù)制粘貼進(jìn)去,這樣,也能輕松創(chuàng)作出符合你想法的音樂(lè)了。
至于歌詞上,目前支持隨機(jī)生成和自己填寫。
隨機(jī)生成是系統(tǒng)自帶,自己填寫顧名思義,是寫好再給它,我最近這幾天一直讓AI幫我寫詞。
想快速形成,就用「角色扮演」。基礎(chǔ)prompt是這樣:
想象你是個(gè)音樂(lè)天才,在音樂(lè)界深耕了20年。譜曲和寫詞是你的專業(yè),現(xiàn)在,我希望你能當(dāng)作曲家,用中文來(lái)創(chuàng)作。
我們要的風(fēng)格是流行而且有治愈感的,就像周杰倫的《稻香》那樣,你給我寫一段歌詞。
當(dāng)它給完之后,你還可以說(shuō):你可以做得更好。歌詞要有節(jié)奏感,要能感受到情感波動(dòng),既美又簡(jiǎn)潔,避免用那些聽(tīng)起來(lái)像口號(hào)的詞句。
第二個(gè)方法也相對(duì)簡(jiǎn)單,即「仿寫」。
原創(chuàng)要自己設(shè)定情節(jié)并總結(jié),然后投喂給AI,讓AI按照自己的設(shè)定去寫;仿寫是模仿對(duì)標(biāo)歌曲的內(nèi)容大綱、寫作風(fēng)格、語(yǔ)言特色等。
你可以說(shuō),幫我寫一個(gè)歌詞,類似于李榮浩的《老街》,或者某某的什么歌。對(duì)了,也許原歌詞所對(duì)應(yīng)的歌曲是流行風(fēng),你也可以投喂給Suno,讓它生成搖滾風(fēng),也不是不可以。
目前多次體驗(yàn)來(lái)看,它生成和模仿歌曲還是有區(qū)別的。
第三個(gè)方法是,先建立一個(gè)大致結(jié)構(gòu)框架。
一首完整的歌曲,它由前奏、詩(shī)句(或稱為節(jié))、副歌、橋段、尾奏五個(gè)部分組成,有點(diǎn)像寫小說(shuō)時(shí)會(huì)有的開(kāi)場(chǎng)、發(fā)展、高潮和結(jié)尾四個(gè)環(huán)節(jié)。
劃分結(jié)構(gòu)后,按部就班地展開(kāi)創(chuàng)作。這個(gè)過(guò)程中,你可以采用各種不同的技巧,比如押韻法。押韻法本身就有很多種形式,包括不限于ABAB、AABB、ABBA、ABCA等模式。
除押韻法以及增加歌詞的韻律節(jié)奏感外,還可以要求AI多增加一些技巧,以及情感深度在里面,比如,用描述法,或者比喻,反復(fù)疊唱,以及具體抽象的結(jié)合等。
所以,AI寫歌詞本身和AI進(jìn)行其他領(lǐng)域的創(chuàng)作底層相似,唯一區(qū)別在于,一旦你理解了一些特定領(lǐng)域?qū)I(yè)術(shù)語(yǔ),掌握它的難度就會(huì)大大降低。
不過(guò),目前這個(gè)平臺(tái)最多只能生成兩分鐘的歌曲,你給的詞過(guò)多,后面也未必能用上,但也不要擔(dān)心,它提供了一個(gè)連續(xù)創(chuàng)作功能。

你可以選擇一首歌的任何部分,繼續(xù)創(chuàng)作接下來(lái)的部分,然后把它們組合起來(lái),就能突破兩分鐘的限制,創(chuàng)作出一首完整的歌曲。

03?

生成音樂(lè)后你可以以下載(視頻,音頻)分享,也可以選擇公開(kāi)。

看起來(lái)是不是蠻爽的??
說(shuō)回Suno這個(gè)平臺(tái),官方宣稱目前不少知名藝術(shù)家在用,但主要用戶群體依然是沒(méi)有經(jīng)驗(yàn)的普通人。的確,最新v3版本在音樂(lè)質(zhì)量、使用提示詞上都有明顯提升。
而且,這一版本他們還搞了AI音樂(lè)水印系統(tǒng),如此也能保護(hù)用戶作品不被抄襲,防止別人濫用平臺(tái)上的音樂(lè)去分發(fā),目前我已經(jīng)看到不少人用AI音樂(lè)開(kāi)始賺錢了。
雖然這聽(tīng)起來(lái)不錯(cuò),但我作為一個(gè)深度AI使用者,和深度聽(tīng)歌人士,還是想說(shuō)幾個(gè)問(wèn)題,或幾個(gè)特性。
一方面,平臺(tái)簡(jiǎn)單提示詞的確很棒,AI有更多自由度,但同時(shí)也意味著我們控制得少了,有時(shí)候,我給的提示詞AI可能不會(huì)完全按照原意去寫歌詞。
另一方面在功能上,雖然我不是專業(yè)音樂(lè)人,但覺(jué)得AI音樂(lè)應(yīng)該有一些基礎(chǔ)、或?qū)I(yè)功能,比如像音色克隆、轉(zhuǎn)midi、分軌等。
轉(zhuǎn)midi和分軌技術(shù)上比較難,但音色克隆(SVC)相對(duì)容易些,已有的開(kāi)源模型也在不斷進(jìn)化,稍作調(diào)整就能集成進(jìn)去,這也意味著用戶只要上傳一段自己的聲音,就能定制一首歌,這肯定會(huì)吸引不少人付費(fèi)。
這好比美顏相機(jī)的「美顏功能」,你不能總「一鍵美顏」,還要增加一些大眼睛、瘦臉、磨皮等功能。
我用so-vits-svc時(shí)不同,它部分插件看似全英文比較麻煩,但可以訓(xùn)練人聲,還可以變換歌曲場(chǎng)景等等,所以,從專業(yè)角度來(lái)看,Suno更像一鍋出的大雜燴。
雖然還不夠完美,有點(diǎn)粗糙,但不可否認(rèn),這種工業(yè)化生產(chǎn)的音樂(lè),已經(jīng)占據(jù)了視頻和流媒體平臺(tái)大部分的流量。
換句話說(shuō),就質(zhì)量而言,現(xiàn)在AI生成的好音樂(lè)已經(jīng)可以媲美一般的音樂(lè)創(chuàng)作者了,盡管對(duì)于我們不熟悉的音樂(lè)流派來(lái)說(shuō),可能還是聽(tīng)不出太多門道。

目前Suno AI官網(wǎng)沒(méi)有公開(kāi)技術(shù)文檔,我也不清楚模型結(jié)構(gòu),但可以看出,v3版本在支持中文方面比上一版進(jìn)步很多,盡管偶爾會(huì)有電音;不過(guò),模型迭代是必要的,畢竟遵循AI領(lǐng)域的一個(gè)通用規(guī)律即:模型越大,效果越好。

04?

你聽(tīng)說(shuō)了嗎?

國(guó)內(nèi)昆侖萬(wàn)維推出了「天工AI」搜索后,國(guó)外,AI搜索初創(chuàng)公司Perplexity AI一飛沖天。
Perplexity AI的創(chuàng)始人說(shuō),他對(duì)Suno這家公司很有信心,覺(jué)得它有潛力成為下一個(gè)AI領(lǐng)域的重磅玩家。
我特意去了解了下這家公司,原來(lái)Suno四個(gè)創(chuàng)始人之前在劍橋一個(gè)叫Kensho Technologies的公司共事的,他們中有兩個(gè)是業(yè)余音樂(lè)愛(ài)好者。
他們?cè)贙ensho的時(shí),主要開(kāi)發(fā)一種AI技術(shù),用來(lái)把上市公司的電話會(huì)議內(nèi)容轉(zhuǎn)錄下來(lái);后來(lái),他們發(fā)現(xiàn)雖然AI在圖像和文本生成方面搞出了不少大動(dòng)作,音頻這塊卻相對(duì)冷清。于是,就萌生了自己搞點(diǎn)動(dòng)靜的念頭。
盡管有人說(shuō)他們?cè)诔醋?,但?shí)不可否認(rèn),他們的產(chǎn)品更新快,音質(zhì)也挺好的;就連Perplexity AI的老板都說(shuō),現(xiàn)在他聽(tīng)歌更傾向于用Suno而不是Spotify。

從個(gè)人使用角度來(lái)說(shuō),我自己這一周一直在用,我并不關(guān)注它到底是否炒作,或者割韭菜,至少它滿足了我的「耳感」,讓我愿意去嘗試這些新奇的東西。

我覺(jué)得,未來(lái)個(gè)人創(chuàng)作音樂(lè)的熱潮會(huì)跟寫作一樣,爆發(fā)式增長(zhǎng),市場(chǎng)角色已經(jīng)從單純的供給方轉(zhuǎn)變?yōu)榱斯┬桦p方互動(dòng),這意味著更多人可以參與到創(chuàng)作中來(lái),甚至出現(xiàn)共創(chuàng)的模式。
在國(guó)內(nèi),音頻AI領(lǐng)域也有不少實(shí)力派玩家,比如科大訊飛、騰訊音樂(lè)娛樂(lè)集團(tuán)(TME)、網(wǎng)易云音樂(lè)等,它們?cè)贏I音樂(lè)上的嘗試雖然步伐稍顯緩慢,但也在穩(wěn)步前進(jìn)。
根據(jù)Suno的一個(gè)創(chuàng)始人所說(shuō),高質(zhì)量音頻采樣率一般是44kHz或48kHz,意味著每秒要處理48000個(gè)數(shù)據(jù)點(diǎn),音樂(lè)生成面臨的一個(gè)挑戰(zhàn)是,不像文字那樣可以離散處理,音頻數(shù)據(jù)處理要復(fù)雜得多。

所以,看似文生圖模型大爆發(fā),但在音視頻這塊,類似產(chǎn)品還只是剛剛起步,或者說(shuō)它們根本不一樣,真心希望國(guó)內(nèi)企業(yè)能夠加快發(fā)展步伐,推出更多像Suno這樣的創(chuàng)新產(chǎn)品。

總結(jié)而言:

好玩,有趣。
音樂(lè)界也終將被AI改變命運(yùn),只有親身體驗(yàn)過(guò),你才會(huì)驚嘆于自己竟能成為一名音樂(lè)家??烊ピ囋嚢伞?/span>
————

我開(kāi)通一個(gè)新專欄叫《AI產(chǎn)品操作手冊(cè)》;如果,你對(duì)如何將AI轉(zhuǎn)化為先進(jìn)生產(chǎn)力感興趣,歡迎點(diǎn)擊下方圖片訂閱。

里面有理論,有實(shí)操,訂閱后,內(nèi)容每天通過(guò)微信服務(wù)號(hào)進(jìn)行推送,相當(dāng)于,我?guī)е鴥?nèi)容跟你匯報(bào),歡迎找我聊聊你的工作方法,我也樂(lè)意,把經(jīng)驗(yàn)分享出來(lái)。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多