FunClip是阿里达摩院开源的本地部署视频剪辑工具,依托FunASR模型实现语音自动识别,支持热词定制、说话人识别、视频裁剪与多段剪辑,自动生成SRT字幕,提供Gradio交互界面和命令行操作,简化视频剪辑流程。一键启动包避免复杂环境配置,适用于Windows10/11 64位系统,需8G以上英伟达显卡。
FunClip Logo
FunClip是由阿里达摩院精心打造的一款完全开源、本地部署的自动化视频剪辑工具。它依托于阿里巴巴通义实验室的FunASR
Paraformer系列模型,实现了视频中语音的自动识别。FunClip让用户能够根据识别结果,轻松选择文本片段或特定说话人,从而快速裁剪出所需视频片段。FunClip的特色功能包括集成高精度的中文ASR模型、支持热词定制化、说话人识别,以及提供Gradio交互界面,大大简化了视频剪辑的复杂度。此外,FunClip还支持多段剪辑,并且能够自动为视频生成SRT字幕文件。
使用流程如下:
FunClip Usage
FunClip的主要功能
·
自动化语音识别:通过使用阿里巴巴通义实验室的FunASR Paraformer系列模型,FunClip能将视频中的语音内容转换为文本。
·
热词定制化:利用集成的SeACo-Paraformer模型,用户可以自定义一些专业术语、品牌名称或人名等作为热词,提高这些词汇的识别准确性。
·
说话人识别:通过集成的CAM++说话人识别模型,FunClip可以识别视频中不同说话人的ID,方便用户剪辑出特定说话人的视频片段。
·
视频裁剪:用户可以基于识别的文本片段或特定说话人,一键裁剪出目标视频片段。
·
Gradio交互界面:FunClip提供了基于Gradio的交互式界面,用户只需通过浏览器即可轻松完成视频剪辑。
·
多段剪辑支持:FunClip不仅支持单段剪辑,还允许用户进行多段视频剪辑,提升了编辑效率。
·
自动生成字幕:剪辑完成的视频将自动配有SRT字幕文件,既适用于全视频,也适用于剪辑出的特定段落,为字幕编辑提供便利。
·
命令行调用:除了图形化界面,FunClip还提供了命令行操作方式,为高级用户提供更多灵活性。
学术Fun为这款工具提供了一键启动包,避免了繁复的Python环境配置问题。点击即可使用,下载地址(电脑浏览器访问):https://xueshu.fun/4411/,在此页面右侧区域点击下载即可。
⚠️ 注意电脑配置要求如下:
- windows 10/11 64位操作系统
- 8G显存以上英伟达显卡
·
下载压缩包
下载地址(电脑浏览器访问):https://xueshu.fun/4411/,在此页面右侧区域点击下载。
·
解压安装
解压后,请确保路径中不含中文。如下图所示,双击启动.exe
文件运行。
·
Unzip and Install
·
启动与使用
在浏览器中访问http://127.0.0.1:7860/,即可开始在浏览器中使用FunClip。
·
1. 上传你的视频文件(或使用下方提供的视频示例)。
2. (可选)设置热词,并勾选是否启用说话人识别功能。
3. 点击“识别”按钮,获取视频的语音识别结果。
4. 将识别结果中的选定文本片段复制到对应位置,或输入说话人ID。
5. (可选)根据需要配置剪辑参数,如偏移量和字幕设置等。
6. 点击“裁剪”或“裁剪并添加字幕”按钮,完成视频剪辑。
FunClip Tutorial
出自:https://mp.weixin.qq.com/s/ganwr6QMNp3Ua0FwPTVALA
本文档由网友提供,仅限参考学习,如有不妥或产生版权问题,请联系我们及时删除。
客服请加微信:skillupvip