Top.Mail.Ru
Истории

«ChatGPT для музыки»: как стартап Suno делает создание песен доступным каждому

Истории
Дарья Сидорова
Дарья Сидорова

Редактор направления «Истории»

Дарья Сидорова

Цель Suno — позволить людям воплощать в жизнь те песни, что звучат у них в голове. В этом помогают две модели ИИ: музыку создает нейросеть Suno, а текст и название придумывает ChatGPT от OpenAI. Треки, созданные с помощью Suno, уже сейчас впечатляют пользователей сети своей реалистичностью.

О работе инструмента и его возможном влиянии на музыкальную индустрию — в пересказе материала Rolling Stone.

«ChatGPT для музыки»: как стартап Suno делает создание песен доступным каждому

Только за последний год генеративный ИИ добился значительных успехов в создании текстов, изображений (например, через Midjourney) и даже видео, прежде всего с помощью новой нейросети Sora от OpenAI. Однако в области звука, и музыки в частности, наблюдается отставание.

Похоже, Suno решает эту проблему. У основателей стартапа почти безграничные амбиции — они видят мир, в котором создавать музыку может каждый.

37-летний Майки Шульман, один из сооснователей Suno, получивший докторскую степень по физике в Гарвардском университете, считает, что в будущем миллиард человек по всему миру будут платить по $10 в месяц, чтобы создавать песни с Suno. По его словам, сейчас слушателей музыки значительно больше, чем создателей, и Suno исправит этот дисбаланс.

Suno был запущен два года назад. Его фаундеры — Шульман, Кинан Фрейберг, Георг Куско и Мартин Камачо — являются экспертами в области машинного обучения. До 2022 года они работали вместе в другой кембриджской компании Kensho Technologies, которая занималась поиском решений на базе ИИ для сложных бизнес-задач. Шульман и Камачо — музыканты, и им нравилось играть вместе во времена Kensho.

Как работает генератор Suno?

Suno использует тот же общий подход, что и большие языковые модели, такие как ChatGPT: разбивает человеческий язык на отдельные сегменты (токены), изучает миллионы вариантов использования, стилей и структур, а затем реконструирует его по запросу.

Однако создавать аудио, особенно музыку, гораздо сложнее, чем текст. Только в прошлом году в разговоре с Rolling Stone эксперты по ИИ-музыке заявляли, что на создание такого сервиса, как Suno, могут уйти годы.

Заставь искусственный интеллект самообучаться и совершенствоваться – выбирай онлайн-курсы в каталоге курсов по машинному обучению.

«Разделить аудио не так легко, как слова, — рассказывает Шульман. — Это волна. Это непрерывный сигнал». Частота дискретизации высококачественного звука обычно составляет 44 или 48 Гц — это, как утверждает Шульман, «48 тыс. токенов в секунду». «Поэтому нужно придумать, как свести это к чему-то более разумному», — сказал он, добавив, что предстоит еще много работы.

В конечном итоге Suno хочет представить возможность генерировать треки не только по текстовым запросам, но и, как примеру, на основе пения самих пользователей.

Возникнут ли проблемы с авторскими правами?

OpenAI сталкивается с многочисленными судебными исками из-за того, что для обучения ChatGPT использует книги, новостные статьи и другие материалы, защищенные авторским правом.

Основатели Suno не раскрывают, на каких именно данных обучают свою модель. По их словам, она может генерировать реалистичный человеческий вокал отчасти благодаря тому, что обучается не только на музыке, но и на записях речи.

Suno заявляет, что поддерживает связь с крупными лейблами, а также проявляет уважение к артистам и интеллектуальной собственности. Ее инструмент не позволяет указывать в запросах стили конкретных исполнителей и не использует их голоса.


Читайте по теме:

Кому принадлежит нейромузыка и как её использовать в коммерческих целях, чтобы не попасть в суд

Не только картинки и видео: нейросеть обучили генерировать музыку по текстовым подсказкам


Еще до появления Suno музыканты, продюсеры и авторы песен выражали обеспокоенность по поводу того, как ИИ повлияет на их бизнес. Однако основатели Suno утверждают, что бояться нечего, используя метафору о том, что люди продолжают читать, даже если умеют писать.

«Мы пытаемся сделать так, чтобы миллиард людей были увлечены музыкой гораздо больше, чем сейчас, — говорит Шульман. — Если люди гораздо больше увлекаются музыкой, гораздо больше сосредоточены на ее создании и становятся гораздо более разборчивыми, это, очевидно, хорошо для артистов».

«Мы не пытаемся заменить артистов», — добавляет он.

Где будет применяться инструмент?

Хотя Suno нацелен только на любителей музыки, которые хотят создавать песни для развлечения, инструмент все равно может значительно изменить ситуацию в индустрии. В краткосрочной перспективе это может затронуть такой прибыльный сегмент рынка, как создание песен для рекламы и телешоу.

Лукас Келлер, основатель управляющей компании Milk and Honey, отмечает, что это не коснется известных песен. «Но это определенно может нанести ущерб остальной части рынка, — утверждает он. — Я думаю, что в конечном итоге это позволит многим рекламным агентствам, киностудиям, телеканалам и другим отказаться от лицензий».

Кроме того, если в отношении контента от ИИ не будут введены строгие правила, пользователи таких моделей, как от Suno, могут наводнить стриминговые сервисы миллионами своих творений. Шульман говорит, что однажды Spotify, вероятно, запретит загружать такие произведения, но отмечает, что пока пользователи Suno предпочитают отправлять свои песни лишь нескольким друзьям.

Сейчас в Suno работает около 12 сотрудников, но компания планирует расширяться. На верхнем этаже здания, где сейчас находится их временный офис, строится гораздо более крупная постоянная штаб-квартира — там будет даже полноценная студия звукозаписи. «В основном она будет использоваться как комната для прослушивания, — рассказывает Шульман. — Нам нужно помещение с хорошей акустикой. Но нам всем также нравится создавать музыку — без ИИ».

Сейчас самым большим потенциальным конкурентом Suno, вероятно, является Dream Track от Google, который получил лицензии, позволяющие по запросу создавать песни с голосами известных исполнителей. Однако пока Dream Track доступен лишь некоторым пользователям, а выпущенные семплы звучат далеко не так впечатляюще, как у Suno.

«Не думаю, что в будущем люди захотят взаимодействовать с музыкой с помощью ИИ, создавая новые песни Билли Джоэла, — говорит Шульман. — Мы хотим, чтобы через пять лет люди создавали музыку, которой не существует. Ту, что звучит у них в голове».

Источник.

Фото на обложке: ViDI Studio / Shutterstock

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Сам себе Моцарт и Дрейк: подборка музыкальных нейросетей
  2. 2 Где слушать музыку в России: список музыкальных сервисов
  3. 3 Кому принадлежит нейромузыка и как её использовать в коммерческих целях, чтобы не попасть в суд
  4. 4 Правила аудиобрендинга, которые помогут компаниям избежать штрафов
  5. 5 «Прыжок на несколько поколений назад»: что происходит с российскими стримингами
RB в Telegram
Больше полезного контента в Telegram
Подписывайтесь!