Фото в аниме переживает свой момент славы
Все хотят быть кавайными ✌️
Новая волна ИИ-моделей для изображений и видео вызвала интерес к ИИ фото в аниме: люди хотят кастомные аниме-версии себя и своих близких.
Создать убедительную аниме-версию реального человека сложнее, чем кажется!
Модели, способные создавать аниме
Каждый раз, когда выходит новая ИИ-модель, начинается гонка за созданием всевозможных аниме-персонажей и эффектов. Модели типа Google Nano Banana и серии Qwen от Alibaba могут создавать изображения, неотличимые от кадров из телевизионного аниме. Аниме стало неофициальным бенчмарком для оценки следования промптам и точности моделей.
Фото в аниме сложнее, чем текст в изображение
Генерация текст-в-изображение начинается с чистого холста. Модель может выбирать позу, освещение, черты и точный стиль. Ей нужно лишь следовать атмосфере промпта.
Преобразование изображение-в-изображение, напротив, требует двух вещей одновременно:
- Сохранить идентичность реального человека, включая геометрию лица, линию роста волос, выражения и несовершенства.
- Трансформировать её в конкретную стилизованную художественную форму.
Это противоречие делает фото-в-аниме особенно сложной задачей. Один неверный шаг — и результат скатывается в зловещую долину.
«Момент Ghibli» в ChatGPT вызвал бум
Всё изменилось в тот момент, когда те вирусные «селфи в стиле Ghibli» появились в X и Instagram. Внезапно миллионы людей пытались генерировать милые аниме-портреты с визуальной теплотой студии Ghibli.
Но это также выявило основные проблемы. Пожелтение изображения, слишком общие лица и медленная загрузка были частыми жалобами.
Несмотря на несовершенства, этот момент доказал важную вещь: спрос на чистое, высококачественное преобразование фото-в-аниме огромен.
Точность изображения требует баланса
Существует множество различных аниме-стилей и уровней детализации. Есть спектр точности:
Высокая точность
- Сохраняет мелкие детали и текстуры реального мира
- Легко идентифицировать объект
- Может выглядеть более западным
Средняя точность
- Сохраняет большинство деталей реального мира, но стилизовано
- Похож на человека
- Больше текстуры, больше деталей
Низкая точность
- Большие глаза, более лёгкие линии, сел-шейдинг
- Упрощённые волосы и черты лица
- Более кавайный, но и более общий
Люди хотят выглядеть как стилизованная версия себя, а не как ИИ-карикатура. У реальных людей есть реальные черты: морщины, асимметрии, залысины, текстура под глазами, веснушки. Идеальная модель сохраняет идентичность, при этом изящно сглаживая эти черты в аниме-эстетику.
Подход AutoWeeb: Дообученная модель Qwen
Чтобы решить эту проблему, мы обучили кастомную модель на базе Alibaba Qwen-Image-Edit-2509, оптимизированную специально для задач фото-в-аниме.
Мы фокусируемся на:
- Балансировке уровня детализации для сохранения идентичности
- Чистой, тонкой штриховке
- Стиле slice-of-life аниме
Наша работа была отмечена ИИ-лабораторией Alibaba, которая выделила улучшения в способностях Qwen к рендерингу аниме, особенно в точности лиц и согласованности деталей.
Внутренне мы сравнили её с несколькими ведущими моделями и обнаружили значительно улучшенное сохранение сходства, особенно для разных этнических групп и возрастных категорий.
Начните работу с AutoWeeb
Готовы превратить себя в аниме?
Попробуйте последнюю версию нашей модели фото-в-аниме через AutoWeeb, работающую на нашей кастомной модели.
- Загрузите фото
- Выберите стиль
- Получите точный, стилизованный аниме-портрет за секунды