照片转动漫正在掀起热潮

人人都想变可爱 ✌️

原始照片 动漫转换后
来源:X上的@fahabib91

新一波AI图像和视频模型的涌现引发了照片转动漫AI的热潮:人们想要自己和亲人的专属动漫形象。

创建一个逼真的真人动漫形象比看起来难得多!

具备动漫能力的模型

每当新的AI模型发布时,人们都会争相创作各种动漫角色和效果。像谷歌的Nano Banana和阿里巴巴的通义千问系列模型能生成与电视动漫截图几乎无法区分的图像。动漫已经成为评判图像模型提示词遵循能力和准确性的非官方基准。

照片转动漫比文字生图更难

文字生图从一张空白画布开始。模型可以自由选择姿势、光线、特征和精确的风格,只需要符合提示词的整体感觉。

而图片转图片则需要同时做到两件事:

  1. 保留真人的身份特征,包括面部几何结构、发际线、表情和细微特点。
  2. 将其转换为特定的风格化艺术形式。

这种矛盾使照片转动漫成为一项特别困难的任务。稍有不慎,结果就会滑入"恐怖谷"。

ChatGPT的"吉卜力时刻"引发热潮

当那些病毒式传播的"吉卜力自拍"图片出现在X和Instagram上时,一切都改变了。突然间,数百万人都在尝试用吉卜力工作室的温暖视觉风格生成可爱的动漫肖像。

但这也暴露了潜在的挑战。图像泛黄、面部过于通用、加载速度慢都是常见的抱怨。

吉卜力风格图片
OpenAI的服务器

尽管并不完美,这一时刻证明了一个重要观点:市场对高质量照片转动漫转换的需求是巨大的。

图像保真度需要平衡

动漫有许多不同的风格和细节层次,存在一个保真度的光谱:

高保真度

高保真度示例
面部细节丰富,容易辨认
  • 保留精细的真实世界细节和纹理
  • 容易辨认主体身份
  • 可能显得更偏西方风格

中等保真度

中等保真度示例
部分面部细节,辨识度更高
  • 保留大部分真实世界细节,但已风格化处理
  • 看起来像本人
  • 纹理更丰富,细节更多

低保真度

低保真度示例
面部细节较少,辨识度较低
  • 大眼睛、线条更轻柔、赛璐珞着色
  • 发型和面部特征简化
  • 更可爱,但也更通用

人们想要的是自己的风格化版本,而不是AI漫画。真实的人有真实的特征:皱纹、不对称、发际线后退、眼下纹理、雀斑。理想的模型应该在保留身份特征的同时,优雅地将这些特征融入动漫美学。

AutoWeeb的方案:基于通义千问的微调模型

为了解决这个问题,我们在阿里巴巴的Qwen-Image-Edit-2509基础上训练了一个专门针对照片转动漫任务优化的定制模型。

我们专注于:

  • 平衡细节层次以保留身份特征
  • 干净、纤细的线稿
  • 日常生活动漫风格
阿里巴巴通义实验室推文
来源:X上的@Ali_TongyiLab

我们的工作被阿里巴巴AI实验室报道,他们重点介绍了通义千问在动漫渲染能力上的改进,特别是面部保真度和细节一致性方面。

在内部测试中,我们将其与多个领先模型进行了对比,发现在肖像还原度方面有显著提升,尤其是在不同种族和年龄段的表现上。

照片转动漫示例
来源:X上的@HarveenChadha

开始使用AutoWeeb

准备好把自己变成动漫了吗?

通过AutoWeeb体验我们最新版本的照片转动漫模型,由我们的定制模型驱动。

  1. 上传一张照片
  2. 选择你的风格
  3. 几秒钟内获得精准的风格化动漫肖像
👉 立即试用AutoWeeb
照片转动漫转换界面