ChatGPT Image 2.0 із хір і вона не краще за Банану!
І поки всі писали про це вчора ввечорі, просто вставляючи відео з реліза — я пішла спочатку пробувати і порівнювати, щоб написати власні враження. Бо якось всі ці успішні успіхи нових моделей, які “не мають жодних недоліків”, вже починають трошки напрягати.
Тож, обіцяли як завжди супер топ і, як зазвичай, щось абсолютно нове/краще незвичайне. Але що я побачила на ділі:
1️⃣ Якість
Дійсно, в порівнянні з попередньою моделлю — стало значно краще. Зникла ця штучність в “натуральності”, яку заявляли. Як на мене, на прикладі з людиною та чашкою чаю, дуже відчувається цей стрибок. Мені, якщо чесно, більше подобаєтсья результат від GTP, ніж від банани. (окрім дивних пальців 😁)
2️⃣ Матеріали
Щось якось я так і не змогла добитись пластику, на зображенні з корзинкою, хоча в мене у промті прямо прописано: пластикова корзина. Можливо, я зловила якийсь глюк. А можливо, моделька просто може ігнорувати частини промту.
3️⃣ Ракурси
Непогані, навіть +- дотримується опису в промті, алееее якось виходить дивнувато. Якщо банана може собі дозволити щось обрізати, але зробити фото реалістичніше і “живіше”, то у GPT я бачу з цим певні проблемки. Можливо, це трошки пофікситься. Або ж треба по-іншому навчитись писати промт.
4️⃣ Знання реального світу
Як на мене, то у банани з цим поки що краще. Ніде не ідеально, але в GTP наче є бажання щось довигадати, якщо незрозуміло і недоописано. Хоча, було б логічно взяти щось відоме і зрозуміле в світі.
5️⃣ Генерація тексту і збереження консистентності тексту з рефа
Нуууу, я не скажу що краще за банану. З рефом справляється гірше, як на мене. Але не буду наговарювати — можливо, проблема в промті. Просто текст генерує непогано, але чомусь сплющило. Все більш примітивне, коли ви не маєте конкретного бачення і не вказуєте в промті — працює норм(приклади в відео та буквально всюди в інтернеті, з цим довбаним ШІ вайбом).
Швидкість і ліміти мене теж поки що не порадували, але я думаю, це проблема лише в натовпі, який прибіг на сервери Опен АІ і генерує щось. А також, деколи помітна довбаний типовий “паттерн” від ШІ. Можете порівняти на фото з банкою.
Не дарма я перестала гнатись і описувати кожен новий реліз “революційних” революцій в моделях. Я не знаю, наскільки треба мати на зараз погану якість, щоб я сказала, що це прям топ-вау зміни. Навіть зміни в альфа версії міда 8.1(що дійсно покращило якість, про це я на прикладах опишу в наступному пості), не викликають революції, хоча мід має проблеми з якістю зараз, в порівнянні з тою ж бананою. Проте, мід — це стиль, плюс вайб і ще якісь круті словечкі, тож там можна трошки закрити очі на якість.
А GPT — ну просто непогана модель для генерації. Можливо, буду використовувати для генерації людей і мені зайде. Але так, щоб я перейшла з банани на GPT — напевно поки ні.
Які ваші думки? Вже пробували?
|
https://www.instagram.com/grankina.dsgn/