首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 揭秘DeepSeek:一个更极致的中国技术理想主义故事
· ComfyUI官方使用手册【官网直译+关键补充】
· OpenAI真的开源了!这波「实时语音」操作,让万物开口说话,我爱了
· 全新换脸工具ReActor,比roop更强!
· 改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
· Stable Diffusion|背景替换只需要两分钟!
· OpenAI大动作:Whisper large-v3重塑语音识别技术
· AI换脸工具:facefusion使用心得
· Stable Diffusion真实人物转卡通证件照(2.0版)
· 一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
视频制作
开源
网易(TTS)EmotiVoice:开源语音合成,支持2000多音色
你是否曾经想过,如果你能用自己喜欢的声音来朗读任何文本,那该多好? 你是否曾经想过,如果你能用不同的情感和语气来表达你的想法,那该多有趣? 你是否曾经想过,如果你能用一句简单的提示来控制你的语音合成器,那该多方便? 如果你对以上问题的答案是肯定的,那么你一定会对EmotiVoice项目感兴趣。
EmotiVoice
语音合成
2024-01-26
2024-01-26
语音
语音克隆又又又又又升级了
之前在前面的文章中有介绍,克隆你的声音,只需要你三秒的录音,声音克隆又进化了!,时隔几个月Meta又推出了最新的语音生成技术,不仅能可能声音,还能通过对声音的描述来生成独特的音色,同时还能通过描述来生成各种各样的音效,甚至能通过文字描述来编辑声音,整体来说,这项技术几乎囊括了现在人们对语音生成技术的所有的需求。
Meta
语音生成
2024-01-25
2024-01-25
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
阿里AI黑科技大揭秘:包括通义千问大模型、AnyText、Animate Anyone、Replace Anything、Outfit Anyone、FaceChain、I2VGen-XL和Animate 3D Motion,展示了阿里在AI领域的强大实力和广泛应用
阿里云
视频
音频
2024-01-19
2024-01-19
数字人
一款构建AI数字人项目开源了!自动实现音视频同步!
本周GitHub项目圈选: 主要包含音视频同步、多代理框架、3D对象模型、适用于开发者的演示文档构建工具、网页程序打包、自构建CRUD应用等热点项目。
AI数字人
音视频同步
2024-01-18
2024-01-18
视频
AI视频新技能!这套流程教你打造视频人物和声音完美同步!
AI视频新技能!这套流程教你打造视频人物和声音完美同步!
AI视频
2024-01-16
2024-01-16
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
前不久小圈为大家介绍过 Coqui 文本转语音(Text-to-Speech,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐。 但是近期,网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Sta
EmotiVoice
语音库
2024-01-16
2024-01-16
OpenAI
OpenAI大动作:Whisper large-v3重塑语音识别技术
在最近的OpenAI首届开发者大会上,一个引人注目的技术亮点是Whisper large-v3的发布。这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。今天,我们就来深入了解这个技术突破,并探讨它如何改变我们与机器的交流方式。
Whisper
语音识别
2024-01-15
2024-01-15
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
Translatotron
语音识别
2024-01-11
2024-01-11
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转换为视频。您可以将其视为文本到图像的轻微概括:它不是生成图像,而是生成视频。
AnimateDiff
视频
训练
2024-01-10
2024-01-10
Stable Diffusion
AnimateDiff:一篇文章教你学会用Stable Diffusion制作GIF动图
使用 AnimateDiff创建令人惊叹的 GIF 动画!了解如何使用这个强大Stable Diffusion工具,释放你的创造力。
AnimateDiff
视频
训练
2024-01-09
2024-01-09
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,语音识别技术的突破性进展尤为引人瞩目。由Sanchit Gandhi开发的Whisper JAX就是这一创新旅程中的新星。它是OpenAI的Whisper模型的JAX版本,实现了在TPU上高达70倍的速度提升,这不仅是对现有技术的重大突破,更是对未来潜力的一次展现。
Whisper
语音识别
2024-01-08
2024-01-08
Stable Diffusion
[Stable Diffusion]AnimateDiff :最稳定的文本生成视频插件
在小视频风靡的时代,稳定的文本生成短视频成为了迫切需求。今天向大家介绍一款相对稳定且与其他插件兼容的工具——AnimateDiff。 .
AnimateDiff
视频
训练
2024-01-08
2024-01-08
数字人
AI数字人:重构人货场的新力量
随着人工智能技术的飞速发展,生成式AI正在深刻改变着电商行业的运作模式。AI数字人作为生成式AI的一个重要应用领域,正在逐渐成为电商人货场重构的主导力量。
数字人
AI
商业
2024-01-06
2024-01-06
借题发挥下最近几例声音克隆的应用案例
声音克隆和数字人大有应用前景,很多跟民生直接相关,比如周围存在大量失去亲人而生活在精神煎熬状态的人,只是没有人去关注他们。但是这个对该服务提供者也提出了要求:哪些服务能做,哪些不能做,应该着重去解决哪些问题。服务提供者是需要带着一种很多行业和生活场景都需要,只是目前受限于技术限制,还难以做到很逼真的程度,但是相信在元宇宙时代,这一切都会变成现实。
声音克隆
数字人
2024-01-06
2024-01-06
数字人
数字人:从科幻走向现实的技术革命
数字人,这一曾被视为科幻领域独有的概念,如今正逐渐走入我们的日常生活。随着科技的飞速发展,尤其是人工智能、虚拟现实、增强现实等技术的突破,数字人已经从单纯的想象变为触手可及的现实。它们不仅为我们带来了前所未有的娱乐体验,还在教育、医疗、社交等多个领域展现出了广阔的应用前景。本文将探讨数字人的技术原理、发展历程、现状及应用前景,并分析其对社会和个人产生的影响。
数字人
语音
2024-01-03
2024-01-03
<
1
2
3
4
>
1
2
4
5
6
7
8
9
100