Home 科學技術 Suno升級的AI音樂發電機在技術上令人印象深刻,但仍然無私

Suno升級的AI音樂發電機在技術上令人印象深刻,但仍然無私

58
0

當它不嘗試防止主要唱片公司的訴訟時,Suno仍在努力清理他的AI音樂創建工具。最新的型號Suno V5比以前的V4.5++以前的技術改進。但這似乎並沒有從擴大AI藝術的金發真空中逃脫。

音頻質量有一些板的更新,例如較低的工件和設備之間的清晰分區。使用v4.5+產生的一些曲目是吉他,老闆和合成器之間最好的泥濘線條。但是使用V5,合金非常乾淨。

在演示期間,Suno產品經理亨利·菲普斯(Henry Fips)具有代表一首歌的模型生成,其中長笛具有像乒乓球一樣延遲效果的長笛:“我從未聽說過以前的型號……這是不同部分的噪音。估計是聽起來的,因為它決定了它的樣子。

沒有任何Suno聲音的邊緣。一切都沐浴在混響中,帶有旋律的層,完美地在球場上。儘管您清楚這些任務很明確,但該模型會忽略您。

儘管我的測試中的主張似乎值得懷疑,但Suno還表示V5對這種類型有很好的了解。及時我的“現代前衛R&B Glitchie,但是時髦的鼓,天氣旋律 把我拆開)。他們倆都接近了,給了我一些喜怒無常的合成器,但我希望他們沒有特殊性。

“在90年代初期,Suno無法弄清楚我在尋找什麼,說:“在90年代初,90年代初,在4-Fi Indi Rock 4軌錄音機上的關鍵聲音外面有點。 “儘管我嘗試了一切,但我無法將中國吐出任何看起來像人行道的東西。 傾斜和迷人 找不到任何地方。取而代之的是,我帶著Chakki即興演奏和乾淨的駕駛動力弦轟炸了“ Indi”岩石。 Suno V提供了看起來像北極猴子的歌曲,而不是5世紀之前發行的任何歌曲。

同樣,在我的測試中,V5似乎在某些時候在時代或十年特定的提示中掙扎。當我問“在1970年代末”時,v4.5+基本上是在人聲之外(然後是更多)。但是V5通常在80年代提供合成器和軌道,儘管它們具有一些經典的croutac DNA,但它們具有更高級的嘈雜曲目。

我說的是,創建Suno的V5模型的安排非常複雜。與v4.5+相比,還有更多的音樂分類保持最重複,最多樣化的歌曲結構。 v4.5+通常具有基本的詩歌 – 核 – 工作結構(帶有良好測量的橋樑),V5通常具有前骨前部分,多橋或崩潰,並且通常在賽道上構建的軌道提供,而不僅僅是不同的部分。

在重新混合現有曲目時,這偶爾會產生有趣的結果。我上傳了幾年前發行的EP中的一首歌(它可能必須將其版權過濾器三倍),然後看,我不會撒謊,它將我的大弦吊艙變成了合成器主題,而我的大弦吊艙則變成了害羞的主題。

我歌曲的所有這些封面是什麼 早上3點記錄在我的房間裡 大約六年前。這是在這裡運行的主題。 Suno模仿了舊錄音或人類表演的某些表面特徵,例如膠帶或呼吸,但總是感覺真實。

FIPS承認,語音模型沒有聆聽,創造了真正人類外觀的獨特缺陷的重生。在關於V5的早期信息中,Suno聲稱自己是“精神上的聲音”和“類似人類的情感深度”,但該詞彙現在已經不使用公共資料了。取而代之的是,該公司現在選擇將聲音描述為“自然,真實的”,並且更改將被歸為“風格選項”。

但這似乎也在拉伸。是的,與v4.5+相比,聲音感覺更加人性化,它們仍然很緊。當Fips“ Suno(v4.5)認為聲音平坦時,我認為它正在失去一些賦予優勢的細節”,而V5模型的高可靠性提供了這些細節。

很難就該主張的技術方面進行爭論 – 聲樂展覽更詳細 – 但它們仍然很痛苦。每塊岩石都像想像中的龍,曼普福德和兒子,每場R&B歌曲夢遊adile或引人入勝的Ariana Grande。

沒有任何Suno聲音的邊緣。一切都沐浴在混響中,帶有旋律的層,完美地在球場上。儘管您清楚這些任務很明確,但該模型會忽略您。我要求V5“未經處理的情感獨奏,無伴奏歌手,沒有混響,沒有旋律,沒有效果,發出乾燥的聲音”。它提供的兩首歌被沐浴在混響中,另外的歌手與第一首歌進行了協調,一首似乎是老闆。 (但是,這可能是評估老闆的聲音。)但是FIP並不感到驚訝。他說:“模型尚未了解特定效果和記錄方法的描述。管理音調的過程可能在很大程度上受文學和正常情緒的影響。”

所以,我吃了Suno文學 只是 與滾石不同的是Gimme庇護所透明 避免標記侵犯版權。起初,刷子似乎擁有所有原始物品。配備了一位強大的女歌手,對Bluusi安排大喊,但它具有牙醫教科書的所有情感效果。

當我聽到“吉姆庇護所”時透明 這是瑪麗·克萊頓的方式 聲音破裂 當她在橋期間帶著“強姦和謀殺罪”時,它扼殺了我。這完全是羅伯特·史密斯(Robert Smith)的外部怪獸,它傳達了失望”我不是為什麼“在庫爾特·科本(Kurt Coben)提供最後一行之前,明顯的疲勞”你昨晚在哪裡睡覺“這是一個正在與真正的巨人作戰的人。

通常,曬太陽是“不好的” – 從曲調,原始,鑰匙,草率 – 浪費。儘管公司關於新模型的聲音是“自然”的所有談判,但它通常不會承受演出的情感體重。 Suno的虛擬歌手仍然分開。 V5模型可以理解為某種抒情詩,但與單詞沒有真正的情感聯繫,因為它不是代碼堆,是藝術家。

跟隨事物和作家 從這個故事中,可以在您的個性化主頁提要上看到這樣的信息並接收電子郵件更新。


來源連結