首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语
音
克隆又又又又又升级了
,时隔几个月Meta又推出了最新的
语
音
生
成
技术,不仅能可能声
音
,还能通过对声
音
的描述来生
成
独特的
音
色,同时还能通过描述来生
成
各种各样的
音
效,甚至能通过文字描述来编辑声
音
,整体来说,这项技术几乎囊括了现在人们对
语
音
生
成
技术的所有的需求
Meta
语音生成
开源
语
音
、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的
语
音
识别模型,它是一种通用的
语
音
识别模型,可以用于
语
音
识别、
语
音
翻译和
语
言识别等任务。
人工智能
大模型
wisper
开源
Chinese-LLM开源中文大
语
言模型
合
集
书生·浦
语
地址:https://github.com/InternLM/InternLM-techreport 简介:商汤科技、上海AI实验室联
合
香港中文大学、复旦大学和上海交通大学发布千亿级参数大
语
言模型
大模型
中文
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整
合
AI绘画、AI视频、AI
语
音
...
涵盖了 AI 绘画、AI 视频、AI
音
乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识别技术
这款最新的自动
语
音
识别模型不仅在多
语
言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生
成
产品是如何诞生的?
用户可以通过简单的文本提示进行创作,生
成
多种
音
乐风格的高质量
音
乐和
语
音
。。
suno
音乐
视频
栩栩如生,
音
色克隆,Bert-vits2文字转
语
音
打造鬼畜视频实践
BERT的出现对自然
语
言处理领域带来了重大影响,
成
为了许多最新研究和应用的基础。
Bert-vits
语音
开源
开源
语
音
大
语
言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
与以往主要迎
合
单一类型的
音
频(如人声)的工作不同,或者专注于特定任务(如
语
音
识别和字幕),或者将模型限制在单一
语
言上,我们扩大了训练规模,涵盖了超过30个任务、八种
语
言和各种
音
频类型,以推进通用
音
频理解能力的发展
大模型
语音
Insanely Fast Whisper:超快的Whisper
语
音
识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转录模型的超快速能力。
音频
Whisper
大模型
苏秦(suqin)
语
言大模型全工具链 WebUI 整
合
包
项目简介 本项目目标是实现目前各大
语
言模型的全流程工具 WebUI 整
合
包。
大模型
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本文将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现
语
音
驱动唇部运动的!
wav2lip
语音
工具
惊艳推荐!8款好用又免费的文本转
语
音
TTS工具
在早期,TTS技术主要依赖于预录制的声
音
样本,通过组
合
这些样本来生
成
语
音
。
TTS
Maker
语音
开源
网易有道强力开源中英双
语
语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
OpenAI
基于 OpenAI Whisper 模型的实时
语
音
转文字工具
,用于实时
音
频处理、效果制作和声
音
合
成
。
WhisperLive
音频
开源软件
打造
音
乐传奇:Suno推出
音
乐生
成
模型Suno V3,让每个人都能
成
为作曲家
用国内爆火的kimi生
成
歌词 在歌曲作词过程中,有许多专业术
语
和词汇用于描述不同的元素和技巧。
suno
歌曲
音乐
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100