Как создать трек со своим голосом в Suno 5.5?
Suno недавно выкатили возможность загрузить свой голос и генерировать треки сразу с ним. Давно пора. Я потестил, и вывел несколько советов для тех, кто хочет сделать свой трек. С интерфейсом сами разберётесь, там две с половиной кнопки.
Общие моменты:
- Загрузить можно готовую дорожку или записать звук прямо во время загрузки
- от 10 секунд до 4 минут, можно подрезать при необходимости
- Верификация идёт сразу во время загрузки. Нужно надиктовать рандомные фразы в микрофон, можно на русском.
- Можно загрузить несколько голосов на один аккаунт, от разных людей или несколько вариантов своего.
- Если создаёте голос на русском, песни на английском будут генерироваться с акцентом. Используйте отдельные голоса под нужные языки.
Если вы как я и не умеете петь вообще:
- Можете попытаться напеть какую-то простую песню хотя бы как-нибудь или загрузить готовое аудио, где вы разговариваете. Лучше первое, но второе тоже пойдёт.
- При загрузке нужно выбрать ваш уровень, выбирайте "Новичок" - так модель будет сильнее докручивать ваш вокал. Если выберете "профи", она будет стараться сохранить манеру оригинала, нам это только помешает.
- Не выбирайте сразу свой голос при генерации песни. Сначала создайте трек с чужим голосом. Но выбирайте сразу нужный вам пол вокала и текст песни, чтобы потом не мучаться.
- Когда сгенерили трек, который вам понравился, жмите на него и выбирайте remix/edit, cover. Трек подгрузится в окно ввода со всеми настройками генерации, и только тогда выбирайте свой голос. Имейте в виду, модель будет пытаться подтянуть уровень вашего вокала к оригиналу, особенно в сложных моментах. Из-за этого голос будет похож, но в отдельных местах может звучать немного инородно. Фиксится количеством попыток, но никогда на 100%. Не переживайте, людям которые реально начинают петь, их голос на записи тоже кажется странным, это ок.
Если вы умеете петь, перед тем как грузить свой голос нужно определиться что вы хотите генерить. Есть два варианта:
1. Песни в +- одном стиле, со схожей стилистикой вокала и приёмами. Тогда грузите 4 минуты своего вокала в одном стиле, максимально раскрывая его с разных сторон. Уровень выбирайте профи или продвинутый. Так у модели будет максимум данных и результаты внутри стиля будут лучше, но для генерации чего-то необычного может понадобиться новый голос. Если у вас уже есть хотя бы 6 готовых треков и вы хотите взять их за основу, сделайте ещё Custom Models, это ещё одна новая фича в Suno. Так модель сможет не только понять как вы поёте, но и запомнит какая у вас музыка.
2. Песни в разных стилях, с разными вокальными приёмами. Грузите 4 минуты своего вокала, сделайте его максимально разнообразным, спойте отрывки с разной ритмикой, в разных тональностях. Захватите как можно больший диапазон того, что можете. Всё не влезет, но чем шире будет, тем проще вам потом будет работать. Уровень выбирайте intermediate, это оптимальный баланс фиксации/изменения голоса. Если хотите и сладкий RnB делать и тяжелый скрим-вокал, то лучше создать два отдельных голоса.
При генерациях можете сразу выбирать свой голос, но если чувствуете что изменение промпта и шевеление ползунков не даёт нужного результата и модель "залипла", попробуйте способ для тех кто не умеет петь. Так бывает, потому что Suno пытается удержать много ограничивающих факторов(голос, стилистика, текст, и т.д.) внутри генерации, и иногда упирается в невидимую стену.