首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开发
语
音
产品时设计唤醒词和命令词的技巧
在实际开发
语
音
产品过程中,要达到好的
语
音
识别效果,除了
语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
开源
有感情的
语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的
语
音
生成模型,专门用于大型
语
言模型(LLM)助手的对话任务、对话
语
音
和视频介绍等应用。
ChatTTS
语音合成
【进阶】-
文
生图术
语
解释
念咒 提示词组合 (prompts) 施法/吟唱/t2i
文
本
转
图像 (txt2img) i2i
文生图
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数
字
化时代,
文
本
转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
将
文
本
转
化为3D动画:DeepMotion推出MotionGPT,开启动画新时代!
这是一款基于生成式AI的工具,可以将
文
本提示无缝
转
换为复杂的3D动画,简化了动画创作过程,同时也超越了物理障碍,使得更多不同类型的创作者和行业可以使用3D动画。
3D
动作捕捉
Agent
【万
字
长
文
】全球AI Agent大盘点,大
语
言模型创业一定要参考的60个AI智能体
PS:因本
文
盘点的Agent项目众多,故而
字
数也达到了1W+,建议大家先收藏再阅读。
大语言模型
数
字
人起飞!
字
节Loopy对口型功能在即梦上线 可根据
语
境匹配表情和情绪
这个让数
字
人声
音
完美匹配画面还匹配表情和情绪的对口型项目已经正式在即梦上线了。
Loopy
视频
开源
一款构建AI数
字
人项目开源了!自动实现
音
视频同步!
本周GitHub项目圈选: 主要包含
音
视频同步、多代理框架、3D对象模型、适用于开发者的演示
文
档构建工具、网页程序打包、自构建CRUD应用等热点项目。
AI数字人
音视频同步
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段时间,「霉霉大秀中
文
」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
开源
腾讯开源的数
字
人MuseTalk到底行不行?
该模型能够根据输入的
音
频信号,自动调整数
字
人物的面部图像,使其唇形与
音
频内容高度同步。
MuseTalk
数字人
音频
Stable Diffusion
Stable Diffusion图生图(真人
转
动漫)
一、简介 今天给大家分享使用Stable Diffusion图生图进行真人
转
动漫,木木共使用了五种模型进行真人
转
动漫测试,重绘幅度在0.45~0.6之间,如果重绘幅度过大,会导致生成的图片偏离主体样貌
StableDiffusion
图生图
开源
GPT-4o实时
语
音
方案提供商Livekit开源voice agent:轻松处理
音
视频流
轻松访问 LiveKit WebRTC 会话并处理或生成
音
频、视频和数据流。
voice
agent
开源
音视频
美的数
字
化
转
型10年,方洪波的反思。作为领导者的高瞻远瞩与宽广胸襟!
那么ToC和ToB这四个板块的业务,在过去十年,都是我们同步数
字
化
转
型的。
工作
阿里
阿里&
字
节发表VividTalk,只需单张照片即可根据
音
频生成栩栩如生的人物说话头像视频
只需提供一张人物的静态照片和一段
语
音
录
音
,VividTalk即可制作出一个看起来像是实际说话的人物的视频。
VividTalk
视频
用AI轻松玩
转
年度总结PPT
这篇
文
章就是为你准备的 我会教你如何利用完全免费的国产 AI 工具,快速的制作 PPT 如果你有很多复杂的
文
字
需要整理,没问题,让 A 已帮你整理 如果你平时不喜欢总结工作内容,做了很多事,写总结不知如何下笔
PPT
年终总结
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100