首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· LangChain Agent 原理解析
· 无需翻墙,可合法使用的8款国内AI大模型产品
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· SD入门教程零:应用场景
· 教会AI画汉字(ComfyUI篇)
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
视频魔法
开源
网易(TTS)EmotiVoice:开源语音合成,支持2000多音色
你是否曾经想过,如果你能用自己喜欢的声音来朗读任何文本,那该多好? 你是否曾经想过,如果你能用不同的情感和语气来表达你的想法,那该多有趣? 你是否曾经想过,如果你能用一句简单的提示来控制你的语音合成器,那该多方便? 如果你对以上问题的答案是肯定的,那么你一定会对EmotiVoice项目感兴趣。
EmotiVoice
语音合成
2024-01-26
2024-01-26
语音
语音克隆又又又又又升级了
之前在前面的文章中有介绍,克隆你的声音,只需要你三秒的录音,声音克隆又进化了!,时隔几个月Meta又推出了最新的语音生成技术,不仅能可能声音,还能通过对声音的描述来生成独特的音色,同时还能通过描述来生成各种各样的音效,甚至能通过文字描述来编辑声音,整体来说,这项技术几乎囊括了现在人们对语音生成技术的所有的需求。
Meta
语音生成
2024-01-25
2024-01-25
ComfyUI
ComfyUI进阶前必备插件们续
本文介绍了ComfyUI工具的生态和插件系统,重点介绍了6款必备插件和5款必装插件,以及ControlNet预处理器等重要工具。文章还提到了ComfyUI-Impact-Pack、ComfyUI_UltimateSDUpscale、abg-comfyui和comfyui-dynamicprompts等插件的使用方法和效果。最后,文章还介绍了B航线的安装方式,并预告了接下来的进阶操作。文章内容丰富,适合ComfyUI用户参考和学习。
ComfyUI
文生图
2024-01-24
2024-01-24
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
阿里AI黑科技大揭秘:包括通义千问大模型、AnyText、Animate Anyone、Replace Anything、Outfit Anyone、FaceChain、I2VGen-XL和Animate 3D Motion,展示了阿里在AI领域的强大实力和广泛应用
阿里云
视频
音频
2024-01-19
2024-01-19
数字人
一款构建AI数字人项目开源了!自动实现音视频同步!
本周GitHub项目圈选: 主要包含音视频同步、多代理框架、3D对象模型、适用于开发者的演示文档构建工具、网页程序打包、自构建CRUD应用等热点项目。
AI数字人
音视频同步
2024-01-18
2024-01-18
视频
AI视频新技能!这套流程教你打造视频人物和声音完美同步!
AI视频新技能!这套流程教你打造视频人物和声音完美同步!
AI视频
2024-01-16
2024-01-16
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
前不久小圈为大家介绍过 Coqui 文本转语音(Text-to-Speech,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐。 但是近期,网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Sta
EmotiVoice
语音库
2024-01-16
2024-01-16
OpenAI
OpenAI大动作:Whisper large-v3重塑语音识别技术
在最近的OpenAI首届开发者大会上,一个引人注目的技术亮点是Whisper large-v3的发布。这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。今天,我们就来深入了解这个技术突破,并探讨它如何改变我们与机器的交流方式。
Whisper
语音识别
2024-01-15
2024-01-15
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
Translatotron
语音识别
2024-01-11
2024-01-11
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转换为视频。您可以将其视为文本到图像的轻微概括:它不是生成图像,而是生成视频。
AnimateDiff
视频
训练
2024-01-10
2024-01-10
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,语音识别技术的突破性进展尤为引人瞩目。由Sanchit Gandhi开发的Whisper JAX就是这一创新旅程中的新星。它是OpenAI的Whisper模型的JAX版本,实现了在TPU上高达70倍的速度提升,这不仅是对现有技术的重大突破,更是对未来潜力的一次展现。
Whisper
语音识别
2024-01-08
2024-01-08
Stable Diffusion
[Stable Diffusion]AnimateDiff :最稳定的文本生成视频插件
在小视频风靡的时代,稳定的文本生成短视频成为了迫切需求。今天向大家介绍一款相对稳定且与其他插件兼容的工具——AnimateDiff。 .
AnimateDiff
视频
训练
2024-01-08
2024-01-08
数字人
AI数字人:重构人货场的新力量
随着人工智能技术的飞速发展,生成式AI正在深刻改变着电商行业的运作模式。AI数字人作为生成式AI的一个重要应用领域,正在逐渐成为电商人货场重构的主导力量。
数字人
AI
商业
2024-01-06
2024-01-06
什么是极限、导数、微分与积分(通俗易懂)
微积分,看似深奥,实则与日常紧密相连。它是工程、物理、经济学的基础工具。从天体到手机图像,微积分的运用无处不在。本文将解释微积分的四大基石:极限、导数、微分和积分,带你领略其魅力与实用性。
数学
微积分
科学
2024-01-06
2024-01-06
借题发挥下最近几例声音克隆的应用案例
声音克隆和数字人大有应用前景,很多跟民生直接相关,比如周围存在大量失去亲人而生活在精神煎熬状态的人,只是没有人去关注他们。但是这个对该服务提供者也提出了要求:哪些服务能做,哪些不能做,应该着重去解决哪些问题。服务提供者是需要带着一种很多行业和生活场景都需要,只是目前受限于技术限制,还难以做到很逼真的程度,但是相信在元宇宙时代,这一切都会变成现实。
声音克隆
数字人
2024-01-06
2024-01-06
<
1
2
3
4
5
6
7
8
9
>
1
2
4
5
6
7
8
9
100