Фото в аниме переживает свой момент славы

Оригинальное фото — Источник: @fahabib91 в X

Фото в стиле аниме — Источник: @fahabib91 в X

Новая волна ИИ-моделей для изображений и видео вызвала интерес к ИИ фото в аниме: люди хотят кастомные аниме-версии себя и своих близких.

Создать убедительную аниме-версию реального человека сложнее, чем кажется!

Модели, способные создавать аниме

Каждый раз, когда выходит новая ИИ-модель, начинается гонка за созданием всевозможных аниме-персонажей и эффектов. Модели типа Google Nano Banana и серии Qwen от Alibaba могут создавать изображения, неотличимые от кадров из телевизионного аниме. Аниме стало неофициальным бенчмарком для оценки следования промптам и точности моделей.

Фото в аниме сложнее, чем текст в изображение

Генерация текст-в-изображение начинается с чистого холста. Модель может выбирать позу, освещение, черты и точный стиль. Ей нужно лишь следовать атмосфере промпта.

Преобразование изображение-в-изображение, напротив, требует двух вещей одновременно:

Сохранить идентичность реального человека, включая геометрию лица, линию роста волос, выражения и несовершенства.
Трансформировать её в конкретную стилизованную художественную форму.

Это противоречие делает фото-в-аниме особенно сложной задачей. Один неверный шаг — и результат скатывается в зловещую долину.

«Момент Ghibli» в ChatGPT вызвал бум

Всё изменилось в тот момент, когда те вирусные «селфи в стиле Ghibli» появились в X и Instagram. Внезапно миллионы людей пытались генерировать милые аниме-портреты с визуальной теплотой студии Ghibli.

Но это также выявило основные проблемы. Пожелтение изображения, слишком общие лица и медленная загрузка были частыми жалобами.

Несмотря на несовершенства, этот момент доказал важную вещь: спрос на чистое, высококачественное преобразование фото-в-аниме огромен.

Точность изображения требует баланса

Существует множество различных аниме-стилей и уровней детализации. Есть спектр точности:

Высокая точность

Пример высокой точности — Высокая детализация лица, легко узнаваем

Сохраняет мелкие детали и текстуры реального мира
Легко идентифицировать объект
Может выглядеть более западным

Средняя точность

Пример средней точности — Некоторая детализация лица, более узнаваемый

Сохраняет большинство деталей реального мира, но стилизовано
Похож на человека
Больше текстуры, больше деталей

Низкая точность

Пример низкой точности — Меньше деталей лица, менее узнаваем

Большие глаза, более лёгкие линии, сел-шейдинг
Упрощённые волосы и черты лица
Более кавайный, но и более общий

Люди хотят выглядеть как стилизованная версия себя, а не как ИИ-карикатура. У реальных людей есть реальные черты: морщины, асимметрии, залысины, текстура под глазами, веснушки. Идеальная модель сохраняет идентичность, при этом изящно сглаживая эти черты в аниме-эстетику.

Подход AutoWeeb: Дообученная модель Qwen

Чтобы решить эту проблему, мы обучили кастомную модель на базе Alibaba Qwen-Image-Edit-2509, оптимизированную специально для задач фото-в-аниме.

Мы фокусируемся на:

Балансировке уровня детализации для сохранения идентичности
Чистой, тонкой штриховке
Стиле slice-of-life аниме

Твит Alibaba Tongyi Lab — Источник: @Ali_TongyiLab в X

Наша работа была отмечена ИИ-лабораторией Alibaba, которая выделила улучшения в способностях Qwen к рендерингу аниме, особенно в точности лиц и согласованности деталей.

Внутренне мы сравнили её с несколькими ведущими моделями и обнаружили значительно улучшенное сохранение сходства, особенно для разных этнических групп и возрастных категорий.

Пример фото в аниме — Источник: @HarveenChadha в X

Начните работу с AutoWeeb

Готовы превратить себя в аниме?

Попробуйте последнюю версию нашей модели фото-в-аниме через AutoWeeb, работающую на нашей кастомной модели.

Загрузите фото
Выберите стиль
Получите точный, стилизованный аниме-портрет за секунды

👉 Попробуйте AutoWeeb сейчас