首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 从第一性原理看大模型Agent技术
· ComfyUI官方使用手册【官网直译+关键补充】
· 芯片拼接技术:英伟达新核弹,站在苹果的肩膀上
· AI声音克隆 | 最全最简教程(权威版)
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 生成式AI与大语言模型的区别
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 深入解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
写作
火山写作:一款助力写作能力提升的AI助手
这是由字节跳动的火山
引
擎
团队精心打造的AI创作辅助工具,无论是修改毕业论文、精炼个人简历,还是进行全文修订、检查语法拼写错误,添加生动词汇及灵活修改等,火山写作都能为您提供全方位的协助。
火山写作
工具
文章
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM
引
入语音合成领域,下面是voicebox的一个工作流程图 Matcha-
TTS
是第一个开源conditional
音视频
Flow
Matching
Agent
AI Agent的千亿美金问题:如何重构10亿知识工作职业,掀起软件生产革命?
火热的背后是 Agent 的思路为我们带来了 Software 2.0 的图景:LLM 作为推理
引
擎
能力不断增强,AI Agent 框架为其提供结构化思考的方法,软件生产进入“3D 打印”时代,可以根据用户需求进行个性化定制
大模型
AI编程
大模型
姜子牙大模型系列 | 为知识检索而生,Ziya-Reader开源,多个长文本中文任务第一
我们几乎每天都使用搜索
引
擎
,搜索是大模型需求最多的落地应用之一。
大模型
Ziya
盘点字节跳动最新的AI应用
#65039;⃣ 今日头条的小悟空(200+AI工具集,海外名称为ChipChop),4️⃣ 大力教育的河马爱学(AI辅助学习工具),5️⃣ 巨量
引
擎
的即创
字节
AI工具
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
https://mp.weixin.qq.com/s/3h9NpU5Qn58WzSSeO9Ms9A 基础篇-ChatTTS介绍 ChatTTS 文本转语音项目在github爆火出圈,
引
来大家极大的关注
chattts
tts
文生语音
Sora
OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
•技术细节写得比较泛(防止别人模仿)大概就是用视觉块编码(visual patch)的方式,把不同格式的视频统一编码成了用transformer架构能够训练的embeding,然后
引
入类似diffusion
sora
openai
视频生成
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
诸公可知目前最牛逼的
TTS
免费开源项目是哪一个?
Bert-vits
语音
开源
开源版GPT-4o语音来袭,Mini-Omni开启实时语音对话
Mini-Omni的开源,很可能会
引
发语音交互领域的一场革命。
Mini-Omni
语音
开源
开源
向量数据库简介和5个常用的开源项目介绍
随着我们对人工智能应用,如图像识别、语音搜索或推荐
引
擎
的深入研究,数据的性质变得更加复杂。
开源模型
开源
网易有道强力开源中英双语语音克隆
8501:8501 syq163/emoti-voice:latest 现在打开浏览器,导航到 http://localhost:8501 ,就可以体验EmotiVoice强大的
TTS
语音
开源
工具
AIGC工具提示词技巧
以前,我们和软件对话用的是搜索的逻辑:把我们想要的结果、方向描述出来放到浏览器、搜索
引
擎
做检索。
AIGC
提示词
开源
17K star!30秒偷走你的声音,开源声音克隆工具
使用 OpenVoice 项目组说体验OpenVoice最方便的方法是直接使用MyShell中免费的
TTS
和即时语音克隆服务.
OpenVoice
声音克隆
开源
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
STT livekit-plugins-elevenlabs
TTS
voice
agent
开源
音视频
生成式AI工作流#产品经理和创业者的秘密武器
# 三、UE蓝图系统的启示 拖拽式的节点编程并不是ComfyUI的独创,例如,Blender、Maya和Unreal Engine(虚幻
引
擎
)也提供了类似的功能。
AIGC
工作流
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100