首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Stable Diffusion|提示词高阶用法(二)双人同图
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· Suno音乐新手指南(手把手完整版教程)
· 必看!阿里通义千问完整技术报告
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
· MCP服务介绍及应用场景报告-来自Manus
· 理解 o3 及其技术分析
· 腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
阿里出品自动化视频剪辑工具FunClip!
FunClip的特色功能包括集成高精度的中文
ASR
模型、支持热词定制化、说话人识别,以及提供Gradio交互界面,大大简化了视频剪辑的复杂度。
FunClip
视频
阿里
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
GitHub:https://github.com/mli/autocut 项目采用的是 OpenAI 开源的自动化语音识别(
ASR
)系统,使用从网络收集的 68 万小时的多语言和多任务监督数据进行训练
开源模型
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
语音识别(
ASR
)是指将人类的语音转换为文本的技术,然而,目前的语音识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
这个模型是在whisper的large-v2模型上针对中文进行了微调,以增强中文语音识别能力, Belle-whisper-large-v2-zh 在中国
ASR
基准测试(包括 AISHELL1、AISHELL2
Whisper
语音优化
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
WebUI 工具:集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(
ASR
)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。
语音克隆
开源模型
大模型
达摩院SPACE对话大模型:知识注入与知识利用
对话是对语言的高级应用,主要有以下几个特点: ①口语化,表述随意,不一定符合语法、句子不完整、噪音较多、有很多
ASR
错误。
大模型
大模型
AI+智能客服:大模型可落地的最成熟场景之一
无聊、同情、平静、烦恼、激动、嫌弃、懊悔、羞愧、解恨、犹豫、思念、感动、敬佩、心慌、低落、骄傲、心虚、羡慕、辱骂 ) 阿里小蜜团队 (2)智能语音技术 智能语音技术包括语音识别(
ASR
ai
客服
<
1
2
>
1
2
4
5
6
7
8
9
100