Фотастудио
Вы будете смеяцца, но у нас новый генератор картинок.
"Phota Studio и Phota API — персонализированную модель генерации и редактирования фотографий, обладающую возможностями флагманских моделей обработки изображений, но учитывающую ваши особенности"
Спойлер: у меня есть подозрение, что это не foundation model, а файнтюн и очень ловкий пайплайн на основе других моделей. Грубо говоря, большой и смышленый воркфлоу в Комфи, внутри которого крутятся разные другие модели, лоры, улучшайзеры. И хотя они называют это "моделью", мое чутье говорит, что это не так. Нет technical report, нет упоминания количества параметров, архитектуры и пр.
Спойлер 2: NSFW отсутствует, жесткие фильтры.
Так что я пока назову это генеративным сервисом, заточенным под решение типичных задач фотографов.
Цитирую: "Многие модели изображений заявляют о сохранении индивидуальности. Но как только вы начинаете работать с ними, это обещание часто нарушается. Изображения могут казаться похожими на вас, но на самом деле это не вы. С Phota вы впервые можете создавать, редактировать и улучшать фотографии, сохраняя при этом свою индивидуальность.
Наша цель – фотография, где реальные люди и реальные моменты имеют наибольшее значение . Мы хотим сделать захватывающие фотографии доступными для всех: помочь вам воссоздать моменты, которые вы хотели бы запечатлеть, с другого ракурса, при лучшем освещении, с более естественной позой или просто так, чтобы все смотрели в камеру и естественно улыбались. И более того, мы стремимся создавать новые фотографии реальных людей, которые по-прежнему будут выглядеть как настоящие фотографии, будь то студийный портрет, другая обстановка или момент, который вам так и не удалось запечатлеть."
Ну то есть, можно менять углы, ракурсы, освещение, позу, мимику, сохраняя консистентность. Тут я снова начинаю думать, что под капотом кроется Nano Banana или Квен.
Главная фишка - они включили в сервис тренировку (очевидно Лор) на ваших фотках.
В интерфейсе в просто загружаете минимум 30 фоток (50 макс) и тренируете свою "персону" (Лору).
У них есть API, поэтому я быстро нашел их на http://Fal.ai/ и обнаружил там:
phota test-to-image (нет seed, это зашквар) - $0.09 per 1K image and $0.18 per 4K image. Дорого
phota create-profile - собственно тренировка, на входе пакован фоток
phota edit
phota enhance - просто улучшайзер одной картинки (апскейл, деблюр)
В интерфейсе на сайте есть еще стилизатор, добавлятор (человека в существующую фотку), ракурсопоменятор.
На старте дают 20 кредитов (одна генерация в 4К - 4 кредита)
и 2 subject tokens (один токен на свою Лору\Персону)
За 20 долларов в месяц - 600 кредитов (150 картинок в 4К) и 6 тренировок своих Лор.
Довольно дешево для тренировки и дорого для последующих генераций.
В общем выглядит как сервис на основе Бананы или Квена с упором на нужды фотографов.
Я завтра буду занят, не смогу потестить, но вы можете потестить на бесплатных кредитах.
Интересно, что у него (пока) нет фильтров на селебритис, он сожрал у меня Марго Роби, сказал что нашел face of unknown person - можно делать дипфейки.
В общем у меня ощущение, что весь этот сервис можно соорудить в Комфи с большим количеством нод, но кто ж будет заморачиваться, поэтому сервис может зайти фотографам.
Вердикт: Хорошая обертка, но не своя модель.
https://studio.photalabs.com/
Блог:
https://news.photalabs.com/blog/the-new-photo-experience-starts-here
Фал:
https://fal.ai/models/fal-ai/phota