AI魔法学院客服
腾讯最新的人像写真工作PhotoMaker
本文介绍了腾讯git上的一个新项目,该项目能利用少量真人照片、绘画或雕塑形象生成写实人像图片,甚至可融合两张图片的长相。项目使用了多种技术,如填充图像背景、微调模型参数提取脸部特征、融合文本和图像embedding等。此外,还介绍了摄影师训练的工作流。该项目相较于其他类似项目有更大改进,值得期待。
 2024-05-13
收藏 复制地址分享海报

眼尖的我,昨天在腾讯git上发现了这一个新的项目,没开源但是现在有论文。

不仅能输入少量真人照片做写真,还能输入绘画类形象、雕塑形象,根据这个形象出图。

还能输入两个图片,融合他们的长相,即使是真人照片+漫画也完全ok。

 

项目主页:https://photo-maker.github.io/

不过,这个项目主要是为了生成写实人像的哈,虽然能处理非写实的数据,但是生成的图还是针对写实人像的。

大概讲了什么,说几条比较关键的。

输入图像的处理?用随机噪声填充了身体部分和背景,为了消除非脸部的图像区域影响。

训练clip图像编码部分。由于用于原始clip的数据大部分是自然图像,为了更好地提取脸部特征,对这部分模型参数进行了微调。

在文本输入上做文章,把man和woman这种单词与文本embedding结合,得到一个融合后的向量,这个向量会与图像embedding做融合。

会把同一个人脸的多个图像向量拼接起来训练,但是测试时可以拼接不同的人脸,所以可以有融合的效果,非常灵活。

为了原始的sd模型能够更好地感知这些人脸信息,训练了attention层的lora。

主要技术是这些,后面还讲了摄影师训练的工作流,包括如何处理图像数据之类的,感兴趣可以看看原文。

这工作看起来非常nice呀,期待一下,比facechain那些有更大的改进,目前看好photomaker

 

 

 

出自:https://mp.weixin.qq.com/s/2g47AuKcNyLWqVstb5306Q

本文档由网友提供,仅限参考学习,如有不妥或产生版权问题,请联系我们及时删除。 客服请加微信:skillupvip
评论
1 评论
幸福的小白猪2024/5/13 12:10:20
哇塞,这腾讯git上的新项目简直神了啊!以后是不是可以自己动手做明星脸合成,或者做个自己和爱豆的“合影”啦?哈哈,这技术要是用好了,以后是不是连P图师都得失业啊!不过话说回来,这技术得小心使用,不然一不小心合成出个“四不像”,那可就尴尬了~ 期待这个项目能给我们带来更多惊喜和乐趣!
20秒读懂全文
伴读
# 1.一句话总结文章摘要
本文介绍了一个新的项目,该项目能够通过输入真人照片、绘画或雕塑形象生成写实人像,并支持融合不同图像的长相,主要技术包括随机噪声填充、clip图像编码、文本embedding融合以及lora训练等。

# 2.生成关键词和可能相关的关键词
关键词:
- Photomaker项目
- 真人照片
- 绘画形象
- 雕塑形象
- 写实人像生
One More Thing
One More Thing again ...

找组织,加入AI魔法学院群