首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
SadTalker数字人常见问题3
SadTalker数字人制作
工
具
,用自带的图片
音
频可以生成,而用自己的图片、
音
频生成视频就不行。
SadTalke
ChatGLM
清华大学ChatGLM团队发布AI Agent能力评测
工
具
AgentBench:GPT-4是全能战士,超越所有模型
PART 01 未来大模型的发展方向:AI Agent 大
语
言模型(Large Language Models, LLM)最核心的能力是对
语
言的处理,
具
备良好的意图识别和文本生成能力让 LLM
GPT-4
SDXL
【AI绘图
工
具
】太爆炸了,AI出图速度100fps(每秒100张图片),比LCM、SDXL Turbo更快,目前No.1
https://colab.research.google.com/github/hewis123/stream-d/blob/main/Untitled2.ipynb 今天我就来介绍一下这个产品
工
具
吧
StreamDiffusion
文生图
开源
6个最佳开源TTS引擎
随着人
工
智能的普及以及数字设备应用的增加,相关系统对
语
音
识别以及文
语
转换技术日益依赖,TTS正在变得越来越重要。
TTS引擎
开源模型
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英
语
在
音
频驱动的视频生成领域,制作普通话视频面临着许多挑战。
JoyHallo
数字人
开源模型
大模型
OpenAI开源大模型调测
工
具
Transformer Debugger:可以在训练大模型之前理解模型的运行情况并干预
但就在刚才,OpenAI开源了一个全新的大模型调测
工
具
:Transformer Debugger。
大模型
调试工具
DeepMusic发布“和弦派”2.0:重塑AI
音
乐创作范式,赋予创作者全方位掌控
4月29日,国内领先的人
工
智能
音
乐服务商DeepMusic,发布了自主研发的AI
音
乐
工
作站——“和弦派”2.0正式版。
和弦派
DeepMusic
音乐创作
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
ChatTTS是专门为对话场景设计的文本转
语
音
模型,例如LLM助手对话任务。
chattts
tts
文生语音
Agent
用了一个月,终于找到点写 AI Agent 的思路
不断尝试落地 AI 应用端不断尝试落地 AI 应用端 基于对运维的认知,我开发了一个开源的运维
工
具
https://github.com/shaowenchen/ops 。
AI
Agent
Ops
运维工具
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI
工
具
都能直接用,UI简直是视觉盛宴!
它开源的
工
具
,UI一样很酷,当然,功能也真的很强,46.6k的星星绝不是虚名。
AI开源
集合
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本文本到
语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验文本到
语
音
转换。
数字人
声音克隆
GPT-SoVITS
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
但随着人
工
智能技术的飞速发展,特别是大
语
言模型(LLM)的兴起,我们似乎站在了一个新的十字路口。
大语音模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
TTS 的英文全名是 Text To Speech,中文译名是“文本转
语
音
”。
声音克隆
教程
鹅厂最新AI
工
具
刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
前脚字节阿里的
工
具
火了,现在腾讯这个新照片生成应用PhotoMaker直接刷屏,瞧这阵仗…… 只需上传一张或以上照片,无需额外LoRA训练,就能快速可定制。
PhotoMaker
图生图
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时转录应用程序,使用 OpenAI Whisper 模型将
语
音
输入转换为文本输出。
OpenAI
Whisper
大模型
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100