首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
数
字
人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本
文
本到
语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验
文
本到
语
音
转
换。
数字人
声音克隆
GPT-SoVITS
开源
开源
语
音
大
语
言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
与以往主要迎合单一类型的
音
频(如人声)的工作不同,或者专注于特定任务(如
语
音
识别和
字
幕),或者将模型限制在单一
语
言上,我们扩大了训练规模,涵盖了超过30个任务、八种
语
言和各种
音
频类型,以推进通用
音
频理解能力的发展
大模型
语音
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时
转
录应用程序,使用 OpenAI Whisper 模型将
语
音
输入
转
换为
文
本输出。
OpenAI
Whisper
大模型
Insanely Fast Whisper:超快的Whisper
语
音
识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转
录模型的超快速能力。
音频
Whisper
阿里
企业数
字
化
转
型的“阿里阿德涅之线”在哪?
然而,企业数
字
化
转
型的成功率却不高。
大模型
用户
Prompt
超级
转
化!5个让销售数
字
飙升的顶级 Prompts!
这些Prompts不仅简单易懂,还能让你的销售策略
转
换成现实成果。
Prompt
提示
开源
从声纹模型到
语
音
合成:
音
频处理 AI 技术前沿 | 开源专题 No.45
,使用各种
语
音
转
换 AI (VC,Voice Conversion) 进行操作。
AudioCraft
音频
ChatGPT
ChatGPT+
文
字
转
视频工具,让1个人1天轻松生产100条原创视频(内附全部工具)
今天给大家分享一个 ChatGPT+
文
字
转
视频AI工具,批量跑原创视频的玩法。
生成式AI
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本
文
将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现
语
音
驱动唇部运动的!
wav2lip
语音
开源
网易有道强力开源中英双
语
语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
开源
【开源项目】Flow Matching
语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中
文
情感端 - 端
语
音
交互大模型
在当今数
字
化时代,人工智能技术正以前所未有的速度发展,深刻地改变着我们的生活和工作方式。
Westlake
-
Omni
语音
开源
开源免费离线
语
音
识别神器whisper如何安装
whisper介绍 Open AI在2022年9月21日开源了号称其英
文
语
音
辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种
语
言的自动
语
音
辨识。
wisper
翻译
免费
开源
有道开源的国产
语
音
库EmotiVoice爆火了!具有情绪控制功能的
语
音
合成引擎!
前不久小圈为大家介绍过 Coqui
文
本
转
语
音
(Text-to-Speech,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
开源
[中
文
开源震撼首发]33B QLoRA大
语
言模型Anima真的太强大了!QLoRA技术可能是AI
转
折点!
我们开源了第一个中
文
QLoRA 33B大
语
言模型——Anima。
开源模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100