首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· Fooocus,webui,comfyui优缺点
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 2024!深入了解 大语言模型(LLM)微调方法(总结)
· YOO简历
· Midjourney AI绘画美女提示词分享三
· stable diffusion如何确保每张图的面部一致?
· Stable Diffusion使用Roop插件一键换脸教程
· AI换脸工具:facefusion使用心得
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
营销Prompt:三分钟
生
成百篇营销
文
案,领先99%的同行!
就拿营销
文
案来说,别人动动手指就可以十分钟
生
产几百篇营销
文
案,你如果还用人工一篇一篇来写,那结果........
写作
营销
prompt
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
文
本到
语
义模型采用非自回归掩码
生
成Transformer,而不使用自回归模型或任何
文
本到
语
音
的对齐信息。
MaskGCT
声音克隆
AIGC
一
文
读懂AIGC产业链:AIGC的前世今
生
和未来展望
(民
生
证券《电子行业专题研究:国产AI算力芯片全景图》) AIGC产业依赖算法、数据和算力的发展 2、中游,技术层: 它侧重核心技术的研发,主包括机器学习、计算机视觉、算法理论、智能
语
音
、自然
语
言处理等
生成式AI
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
Fish Speech是一款由Fish Audio开发的开源的
文
本到
语
音
(TTS)工具,支持英
语
、日
语
、韩
语
、中
文
、法
语
、德
语
、阿拉伯
语
和西班牙
语
。
Fish
Speech
本地搭建
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI
语
音
...
涵盖了 AI 绘画、AI 视频、AI
音
乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
开源
俄罗斯人开源了最大的
文
生
图模型:参数量12B,比SDXL大了3倍多!
,导致模型总参数达到了11.9B,这应该是目前最大的开源
文
生
图模型。
Kandinsky-3
文生图
开源模型
开源
【TTS
语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
在10月24日,趣丸科技&香港中
文
大学提出一种完全非自回归的TTS模型——掩码
生
成编解码器变换器(MaskGCT),它消除了对
文
本和
语
音
监督之间显式对齐信息的需求,以及对
音
素级别持续时间预测的需求
语音克隆
开源模型
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/
音
频/
文
本
为了提高从数据集中
生
成的
音
频
文
本对的质量,作者利用了自家的ASR系统,并结合了多个开源模型来
生
成多个转录版本。
Baichuan-Omni
多模态大模型
Sora
OpenAI Sora视频
生
成模型技术报告中英全
文
+总结+影响分析
、
音
效、视频AI
生
成的可用工具都已齐备,一个人可以无痛carry一个短片,好故事将价值千金,有才华的人更难被埋没。
sora
openai
视频生成
数字人
腾讯开源的数字人MuseTalk到底行不行?
该模型能够根据输入的
音
频信号,自动调整数字人物的面部图像,使其唇形与
音
频内容高度同步。
MuseTalk
数字人
音频
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本
文
本到
语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验
文
本到
语
音
转换。
数字人
声音克隆
GPT-SoVITS
大模型
最佳开源
文
生
图大模型可图:安装与批量出图的完整教程
Kolors可图是快手Kolors团队开发的基于潜在扩散的大规模
文
本到图像
生
成模型。
可图
kolors
ChatGPT
三个大模型(ChatGPT,
文
心一言,Baichuan-13B),帮我
生
成中医《本草纲目》的训练数据
因此,只要把其中以数字(1,2,3等)序号里的
文
本摘出来,处理成JSON格式,然后把它们变成一个问-答 对的形式,模仿病人和医
生
的对话,就可以放到大模型训练了。
大模型
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英
语
在
音
频驱动的视频
生
成领域,制作普通话视频面临着许多挑战。
JoyHallo
数字人
开源模型
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
只需提供一段简短的
音
频样本,它就可以根据该样本
生
成与原始声
音
极其相似的克隆声
音
,并且支持多种
语
言,目前包括中
文
、英
文
、日
语
、韩
语
等,甚至还扩展到了法
语
、德
语
、意大利
语
等16种
语
言,为用户提供了更广泛的应用可能性
clone-voice
声音克隆
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100