文章列表-AI魔法学院

文章列表

阿里出品自动化视频剪辑工具FunClip！

FunClip的特色功能包括集成高精度的中文ASR模型、支持热词定制化、说话人识别，以及提供Gradio交互界面，大大简化了视频剪辑的复杂度。

FunClip 视频阿里

3 个令人惊艳的 GitHub 开源项目，诞生了！

GitHub：https://github.com/mli/autocut 项目采用的是 OpenAI 开源的自动化语音识别（ASR）系统，使用从网络收集的 68 万小时的多语言和多任务监督数据进行训练

开源模型

AI“同声传译”新进展！Google发布，无监督，语音识别：Translatotron 3！

语音识别（ASR）是指将人类的语音转换为文本的技术，然而，目前的语音识别技术还面临着一些挑战，其中最大的一个就是如何支持更多的语言。

Translatotron 语音识别

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

这个模型是在whisper的large-v2模型上针对中文进行了微调，以增强中文语音识别能力， Belle-whisper-large-v2-zh 在中国 ASR 基准测试（包括 AISHELL1、AISHELL2

Whisper 语音优化

【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比，等你来评!

WebUI 工具：集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注，协助初学者创建训练数据集和 GPT/SoVITS 模型。

语音克隆开源模型

达摩院SPACE对话大模型：知识注入与知识利用

对话是对语言的高级应用，主要有以下几个特点： ①口语化，表述随意，不一定符合语法、句子不完整、噪音较多、有很多 ASR 错误。

大模型

AI+智能客服：大模型可落地的最成熟场景之一

无聊、同情、平静、烦恼、激动、嫌弃、懊悔、羞愧、解恨、犹豫、思念、感动、敬佩、心慌、低落、骄傲、心虚、羡慕、辱骂 ) 阿里小蜜团队（2）智能语音技术智能语音技术包括语音识别（ASR

ai 客服

<12>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1