首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 从第一性原理看大模型Agent技术
· ComfyUI官方使用手册【官网直译+关键补充】
· 芯片拼接技术:英伟达新核弹,站在苹果的肩膀上
· AI声音克隆 | 最全最简教程(权威版)
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 生成式AI与大语言模型的区别
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 深入解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
OpenAI开源大模型调测
工
具
Transformer Debugger:可以在训练大模型之前理解模型的运行情况并干预
但就在刚才,OpenAI开源了一个全新的大模型调测
工
具
:Transformer Debugger。
大模型
调试工具
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本文本到
语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验文本到
语
音
转换。
数字人
声音克隆
GPT-SoVITS
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
ChatTTS是专门为对话场景设计的文本转
语
音
模型,例如LLM助手对话任务。
chattts
tts
文生语音
Agent
用了一个月,终于找到点写 AI Agent 的思路
不断尝试落地 AI 应用端不断尝试落地 AI 应用端 基于对运维的认知,我开发了一个开源的运维
工
具
https://github.com/shaowenchen/ops 。
AI
Agent
Ops
运维工具
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
但随着人
工
智能技术的飞速发展,特别是大
语
言模型(LLM)的兴起,我们似乎站在了一个新的十字路口。
大语音模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
TTS 的英文全名是 Text To Speech,中文译名是“文本转
语
音
”。
声音克隆
教程
写作
火山写作:一款助力写作能力提升的AI助手
这是由字节跳动的火山引擎团队精心打造的AI创作辅助
工
具
,无论是修改毕业论文、精炼个人简历,还是进行全文修订、检查
语
法拼写错误,添加生动词汇及灵活修改等,火山写作都能为您提供全方位的协助。
火山写作
工具
文章
Flowith:革新你的
工
作方式,体验节点式 AI 的超流畅生产力
无论是内容创作者、研究人员、还是企业高管,我们都需要一个能够高效整合信息、提升
工
作效率的
工
具
。
Flowith
GPT
生产力工具
鹅厂最新AI
工
具
刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
前脚字节阿里的
工
具
火了,现在腾讯这个新照片生成应用PhotoMaker直接刷屏,瞧这阵仗…… 只需上传一张或以上照片,无需额外LoRA训练,就能快速可定制。
PhotoMaker
图生图
AI拟声: 5秒内克隆您的声
音
源代码: http://www.gitpp.com/godan/mockingbird MockingBird是一个人
工
智能开源项目,它可以在仅仅5秒钟内克隆你的声
音
。
声音克隆
开源
我,大
语
言模型
作为大
语
言模型,我只前向思考,不反向思考。
大模型
阿里
淘宝模特全体注意!阿里AnyDoor AI换装神器出来了,年度最强AIGC重制绘图
工
具
,重塑电商模特产业
之前用MJ的垫图换装,不仅要记一长串的垫图提示
语
和指令,关键是换了的衣服都是通过提示
语
文字重组,经常发现货不对板,跟商家需要的不一样,真是急死个人。
AnyDoor
换装
文生图
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口型与
音
频中的
语
音
唇形同步)。
数字人
视频
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
包含两个核心模型:SenseVoice 负责
语
音
识别和
音
频处理,CosyVoice 负责
语
音
生成和控制。
asr
tts
声音
数字人
一款构建AI数字人项目开源了!自动实现
音
视频同步!
本周GitHub项目圈选: 主要包含
音
视频同步、多代理框架、3D对象模型、适用于开发者的演示文档构建
工
具
、网页程序打包、自构建CRUD应用等热点项目。
AI数字人
音视频同步
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100