Фото в аниме переживает свой момент славы

Все хотят быть кавайными ✌️

Оригинальное фото Фото в стиле аниме
Источник: @fahabib91 в X

Новая волна ИИ-моделей для изображений и видео вызвала интерес к ИИ фото в аниме: люди хотят кастомные аниме-версии себя и своих близких.

Создать убедительную аниме-версию реального человека сложнее, чем кажется!

Модели, способные создавать аниме

Каждый раз, когда выходит новая ИИ-модель, начинается гонка за созданием всевозможных аниме-персонажей и эффектов. Модели типа Google Nano Banana и серии Qwen от Alibaba могут создавать изображения, неотличимые от кадров из телевизионного аниме. Аниме стало неофициальным бенчмарком для оценки следования промптам и точности моделей.

Фото в аниме сложнее, чем текст в изображение

Генерация текст-в-изображение начинается с чистого холста. Модель может выбирать позу, освещение, черты и точный стиль. Ей нужно лишь следовать атмосфере промпта.

Преобразование изображение-в-изображение, напротив, требует двух вещей одновременно:

  1. Сохранить идентичность реального человека, включая геометрию лица, линию роста волос, выражения и несовершенства.
  2. Трансформировать её в конкретную стилизованную художественную форму.

Это противоречие делает фото-в-аниме особенно сложной задачей. Один неверный шаг — и результат скатывается в зловещую долину.

«Момент Ghibli» в ChatGPT вызвал бум

Всё изменилось в тот момент, когда те вирусные «селфи в стиле Ghibli» появились в X и Instagram. Внезапно миллионы людей пытались генерировать милые аниме-портреты с визуальной теплотой студии Ghibli.

Но это также выявило основные проблемы. Пожелтение изображения, слишком общие лица и медленная загрузка были частыми жалобами.

Изображение Ghibli
Серверы OpenAI

Несмотря на несовершенства, этот момент доказал важную вещь: спрос на чистое, высококачественное преобразование фото-в-аниме огромен.

Точность изображения требует баланса

Существует множество различных аниме-стилей и уровней детализации. Есть спектр точности:

Высокая точность

Пример высокой точности
Высокая детализация лица, легко узнаваем
  • Сохраняет мелкие детали и текстуры реального мира
  • Легко идентифицировать объект
  • Может выглядеть более западным

Средняя точность

Пример средней точности
Некоторая детализация лица, более узнаваемый
  • Сохраняет большинство деталей реального мира, но стилизовано
  • Похож на человека
  • Больше текстуры, больше деталей

Низкая точность

Пример низкой точности
Меньше деталей лица, менее узнаваем
  • Большие глаза, более лёгкие линии, сел-шейдинг
  • Упрощённые волосы и черты лица
  • Более кавайный, но и более общий

Люди хотят выглядеть как стилизованная версия себя, а не как ИИ-карикатура. У реальных людей есть реальные черты: морщины, асимметрии, залысины, текстура под глазами, веснушки. Идеальная модель сохраняет идентичность, при этом изящно сглаживая эти черты в аниме-эстетику.

Подход AutoWeeb: Дообученная модель Qwen

Чтобы решить эту проблему, мы обучили кастомную модель на базе Alibaba Qwen-Image-Edit-2509, оптимизированную специально для задач фото-в-аниме.

Мы фокусируемся на:

  • Балансировке уровня детализации для сохранения идентичности
  • Чистой, тонкой штриховке
  • Стиле slice-of-life аниме
Твит Alibaba Tongyi Lab
Источник: @Ali_TongyiLab в X

Наша работа была отмечена ИИ-лабораторией Alibaba, которая выделила улучшения в способностях Qwen к рендерингу аниме, особенно в точности лиц и согласованности деталей.

Внутренне мы сравнили её с несколькими ведущими моделями и обнаружили значительно улучшенное сохранение сходства, особенно для разных этнических групп и возрастных категорий.

Пример фото в аниме
Источник: @HarveenChadha в X

Начните работу с AutoWeeb

Готовы превратить себя в аниме?

Попробуйте последнюю версию нашей модели фото-в-аниме через AutoWeeb, работающую на нашей кастомной модели.

  1. Загрузите фото
  2. Выберите стиль
  3. Получите точный, стилизованный аниме-портрет за секунды
👉 Попробуйте AutoWeeb сейчас
Интерфейс преобразования фото в аниме