腾讯最新的人像写真工作PhotoMaker - AI魔法学院

腾讯最新的人像写真工作PhotoMaker

本文介绍了腾讯git上的一个新项目，该项目能利用少量真人照片、绘画或雕塑形象生成写实人像图片，甚至可融合两张图片的长相。项目使用了多种技术，如填充图像背景、微调模型参数提取脸部特征、融合文本和图像embedding等。此外，还介绍了摄影师训练的工作流。该项目相较于其他类似项目有更大改进，值得期待。

眼尖的我，昨天在腾讯git上发现了这一个新的项目，没开源但是现在有论文。

不仅能输入少量真人照片做写真，还能输入绘画类形象、雕塑形象，根据这个形象出图。

还能输入两个图片，融合他们的长相，即使是真人照片+漫画也完全ok。

项目主页：https://photo-maker.github.io/

不过，这个项目主要是为了生成写实人像的哈，虽然能处理非写实的数据，但是生成的图还是针对写实人像的。

大概讲了什么，说几条比较关键的。

输入图像的处理？用随机噪声填充了身体部分和背景，为了消除非脸部的图像区域影响。

训练clip图像编码部分。由于用于原始clip的数据大部分是自然图像，为了更好地提取脸部特征，对这部分模型参数进行了微调。

在文本输入上做文章，把man和woman这种单词与文本embedding结合，得到一个融合后的向量，这个向量会与图像embedding做融合。

会把同一个人脸的多个图像向量拼接起来训练，但是测试时可以拼接不同的人脸，所以可以有融合的效果，非常灵活。

为了原始的sd模型能够更好地感知这些人脸信息，训练了attention层的lora。

主要技术是这些，后面还讲了摄影师训练的工作流，包括如何处理图像数据之类的，感兴趣可以看看原文。

这工作看起来非常nice呀，期待一下，比facechain那些有更大的改进，目前看好photomaker。

出自：https://mp.weixin.qq.com/s/2g47AuKcNyLWqVstb5306Q

本文档由网友提供，仅限参考学习，如有不妥或产生版权问题，请联系我们及时删除。客服请加微信：skillupvip

这个创作者的更多内容

不会PS也能做神图？豆包AI绘画全解析，让你的创意秒变艺术品！

变天了，AI可以一键生成中文海报了......

登顶的小熊猫模型出AI产品了！3步10秒出一张海报，可免费商用

评论

1 评论

幸福的小白猪2024/5/13 12:10:20

哇塞，这腾讯git上的新项目简直神了啊！以后是不是可以自己动手做明星脸合成，或者做个自己和爱豆的“合影”啦？哈哈，这技术要是用好了，以后是不是连P图师都得失业啊！不过话说回来，这技术得小心使用，不然一不小心合成出个“四不像”，那可就尴尬了~ 期待这个项目能给我们带来更多惊喜和乐趣！

20秒读懂全文

PhotoMaker 文生图

伴读

# 1.一句话总结文章摘要
本文介绍了一个新的项目，该项目能够通过输入真人照片、绘画或雕塑形象生成写实人像，并支持融合不同图像的长相，主要技术包括随机噪声填充、clip图像编码、文本embedding融合以及lora训练等。

# 2.生成关键词和可能相关的关键词
关键词：
- Photomaker项目
- 真人照片
- 绘画形象
- 雕塑形象
- 写实人像生

查看更多...

推荐阅读

· 腾讯的 PhotoMaker - 更快更像更可控的 AI Avatar

· PhotoMaker：腾讯最新开源，根据照片生成该人物各种风格图片，项目可落地！

· 爆火！腾讯开源PhotoMaker：高效地定制化生成任意风格的逼真人类照片！

· 比 Roop 和 Reactor 更像！IP Adapter 新模型为任何人做写真

· 腾讯 IMA： AI 智能教学新助手

· 比真人还像真人！字节跳动PersonaTalk的黑科技有多强大？

· 腾讯开源的数字人MuseTalk到底行不行？

One More Thing

One More Thing again ...

找组织，加入AI魔法学院群

Ai魔法学院精选

腾讯最新的人像写真工作PhotoMaker

本文介绍了腾讯git上的一个新项目，该项目能利用少量真人照片、绘画或雕塑形象生成写实人像图片，甚至可融合两张图片的长相。项目使用了多种技术，如填充图像背景、微调模型参数提取脸部特征、融合文本和图像embedding等。此外，还介绍了摄影师训练的工作流。该项目相较于其他类似项目有更大改进，值得期待。

2024-05-13

Recommend

智能未来，AI悉心，学无止境

扫码阅读原文

下载到本地分享

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1