Як написати музичний хіт за 5 хвилин за допомогою штучного інтелекту?

Хто б міг подумати, що штучний інтелект здатний створювати музику? Адже музика – це мистецтво, яке вимагає творчості та натхнення. Проте сучасні технології розвиваються настільки стрімко, що вже зараз існують нейромережі, здатні генерувати цілком пристойні музичні твори. До речі можна обрати й нейромережу – чудовий генератор зображень. Про це ми пишемо в іншому нашому матеріалі.

А у цій статті ми розглянемо 5 найкращих нейромереж, які використовують штучний інтелект для створення музики.

Jukebox

Jukebox – генеративна нейромережа, здатна створювати оригінальні музичні композиції в різних жанрах та стилях виконавців. Jukebox навіть може генерувати примітивний вокал для супроводу музики.

На вхід Jukebox подаються такі дані: жанр, виконавець та текст пісні. На виході – абсолютно нові музичні фрагменти, згенеровані з нуля у вигляді сирого аудіо. Модель була навчена на величезній кількості музичних даних, щоб вивчити патерни та структури, притаманні різним музичним стилям.

Ключові можливості:

Генерує музичні фрагменти з вокалом на основі текстів пісень, жанрів та стилів виконавців;
Здатна створювати музику на основі текстів, яких вона не бачила під час навчання;
Видає композиції в широкому діапазоні жанрів та стилів виконавців;
Виводить складену музику у вигляді сирого аудіо, передаючи нюанси, які губляться при символьній генерації музики.

Модель використовує трансформери і побудована для роботи з надзвичайно довгими залежностями, притаманними музиці. 4-хвилинна пісня містить понад 10 мільйонів аудіо-таймстепів. Для порівняння, мовні моделі на кшталт GPT-2 працюють лише з 1000 словесними таймстепами.

Jukebox являє собою великий прорив у галузі генерації сирого аудіо та розширює межі можливостей генеративних ШІ-моделей. Незважаючи на певну недосконалість, вона демонструє стрімкий прогрес у напрямку ШІ-генерованої музики.

Код та попередньо натреновані ваги моделі опубліковані у відкритому доступі, що уможливлює подальші дослідження умовної генерації музики з сирого аудіо. Також доступний інструмент для перегляду згенерованих Jukebox композицій, де кожен бажаючий може послухати музику, складену нейромережею.

AIVA

AIVA – це нейромережа, яку навчали на класичних музичних творах. Вона вміє створювати мелодії у різних музичних жанрах та стилях. Користувач може задати бажаний жанр, стиль і тривалість композиції. Після цього AIVA згенерує декілька варіантів мелодій, з яких можна вибрати найкращий.

Перевагою AIVA є те, що вона постійно навчається на нових музичних творах та вдосконалює свої можливості. Крім того, згенеровані нею мелодії можна редагувати за допомогою спеціальних інструментів.

MuseNet

Ще одна потужна нейромережа від OpenAI – MuseNet. Вона використовує трансформери для генерації музики у форматі MIDI. MuseNet може створювати мелодії «з нуля» або ж додавати акомпанемент до заданої мелодії.

На відміну від AIVA, MuseNet застосовує повну увагу замість відносної. Це дозволяє генерувати музичні твори, що мають кращу зв’язність мелодій тривалістю до 4 хвилин.

Soundful

Багато блогерів, відеографів і подкастерів стикаються з проблемою підбору унікального музичного супроводу для свого контенту. Купівля ліцензій на використання популярних треків обходиться недешево, а наймати композитора для написання ексклюзивної музики під силу далеко не кожному. Рішенням цієї проблеми може стати хмарний сервіс Soundful, заснований на можливостях штучного інтелекту.

Soundful дозволяє користувачам самостійно створювати якісні музичні композиції потрібного жанру всього за кілька кліків. Вибір жанру і налаштування параметрів, таких як темп, тональність, настрій – це все, що потрібно зробити в інтуїтивно зрозумілому інтерфейсі сервісу. Потім нейромережа моментально генерує унікальний трек для використання.

Це ідеальне рішення для тих, кому потрібно оперативно підібрати фонову музику для відеороликів, стрімів або подкастів. Ніяких складнощів і довгого очікування.

Важлива перевага Soundful полягає в тому, що кожна згенерована мелодія абсолютно унікальна. Завдяки навчанню нейромережі з нуля знаменитими музичними продюсерами, система здатна створювати абсолютно нові, не схожі на будь-що з того, що вже існує, музичні фрагменти.

Це дає змогу використовувати згенеровані треки в комерційних цілях без ризику порушення чиїхось авторських прав. Побоюватися претензій не доведеться.

Для некомерційного використання Soundful надає безкоштовний доступ до функціоналу сервісу з обмеженням у 10 треків на місяць. Цього цілком достатньо для особистих стрімів або влогів. Платна підписка за 10 доларів знімає ліміти і забезпечує повний доступ до інструментів сервісу. А за комерційне використання конкретного згенерованого треку сервіс бере всього 50 доларів.

Таким чином, Soundful може стати як вигідною підмогою для некомерційних проектів і хобі, так і повноцінним рішенням для музичного оформлення комерційного відеоконтенту за доступною ціною.

WavTool

Нове слово у створенні музики – нейромережа WavTool, що дозволяє генерувати композиції за текстовими запитами. Цей AI-асистент відкриває нові можливості для початківців, які не бажають розбиратися в музичних програмах.

Доступний в браузері та на смартфонах WavTool – перший у своєму роді онлайн-додаток для написання треків за допомогою штучного інтелекту. Користувач може вводити запити мовою команд, наприклад: «Зіграй діп-хаус біт на 128 BPM». Після цього нейромережа виконає завдання та згенерує фрагмент.

WavTool надає доступ до 4 віртуальних інструментів, 12 ефектів, візуалізатора та інших можливостей. Функція Drag-and-Drop дозволяє імпортувати аудіофайли.

Для генерації мелодій використовується потужна мовна модель GPT-4. Вона розуміє запити будь-якою мовою і може створювати складні ритмічні малюнки, басові лінії, ефекти тощо. AI-асистент також допомагає опанувати музичну теорію.

Базова версія WavTool безкоштовна. Вона дозволяє ставити до 10 запитів на 8 годин та працювати з 6 доріжками по 384 такти. Створені композиції можна зберегти у форматі WAV.

Вартість підписки Pro – $20 на місяць. Вона надає необмежену кількість запитів і доріжок без обмежень за часом. Перед придбанням можна спробувати Pro-версію безкоштовно на добу.

Отже, якщо ви мрієте створювати власну музику, але не маєте спеціальних навичок, WavTool стане для вас чудовим помічником. Його інтуїтивно зрозумілий інтерфейс і потужний штучний інтелект допоможуть реалізувати ваші музичні амбіції.

У статті розглянуто 5 найпотужніших нейромереж, які використовують штучний інтелект для генерації музики – від сирого аудіо до MIDI-файлів. Вони дозволяють створювати оригінальні мелодії та композиції в будь-яких жанрах і стилях за кілька кліків. За рахунок постійного навчання на все нових музичних даних ці AI-асистенти стрімко вдосконалюють свої можливості і наближають нас до ери, коли комп’ютери зможуть складати музику не гірше за людей.