文章列表-AI魔法学院

文章列表

火山写作：一款助力写作能力提升的AI助手

这是由字节跳动的火山引擎团队精心打造的AI创作辅助工具，无论是修改毕业论文、精炼个人简历，还是进行全文修订、检查语法拼写错误，添加生动词汇及灵活修改等，火山写作都能为您提供全方位的协助。

火山写作工具文章

13.5K Star ! Fish Speech Windows本地搭建，能否达到官方的级别？强烈推荐

Fish Speech是一款由Fish Audio开发的开源的文本到语音（TTS）工具，支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。

Fish Speech 本地搭建

语音克隆又又又又又升级了

早在今年6月，Meta曾经推出过VoiceBox，能直接从文本生成高质量语音，不需要任何音频样本作为训练数据，可能是基于对音频Deepfake的担忧，一向秉承开源的Meta并未向工作开放VoiceBox

Meta 语音生成

OpenAI大动作：Whisper large-v3重塑语音识别技术

这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步，而且还将很快在OpenAI的API中得到支持。

Whisper 语音识别

一文带你看懂OpenAI-Sora生成视频的原理

OpenAI在X上发布消息在此之前，尽管Runway、Pika、Kreadoai、Moonvalley、Pixverse等早已推出了各具特色的视频生成工具，但OpenAI的Sora视频生成模型如同一颗新星

视频生成 sora

Suno音乐新手指南（手把手完整版教程）

Suno是当前全球音乐创作领域的头部工具，地位堪比GPT、Midjourney和Sora等巨头。

suno 歌曲教程

AI拟声: 5秒内克隆您的声音

源代码： http://www.gitpp.com/godan/mockingbird MockingBird是一个人工智能开源项目，它可以在仅仅5秒钟内克隆你的声音。

声音克隆开源

淘宝模特全体注意！阿里AnyDoor AI换装神器出来了，年度最强AIGC重制绘图工具，重塑电商模特产业

但近日，阿里和港大联手推出了一个工具，可以轻松实现一键换衣，更重要的是，操作简单，实现效果惊人。

AnyDoor 换装文生图

四木测评｜让教父唱《野狼disco》、恶搞《甄嬛传》，火遍全网的阿里明星项目EMO正式开放

这也意味着用户无法自行上传音频内容，只能通过官方创建好的模板来上传图片，生成固定音频内容的视频。

EMO 阿里全民演唱

实时语音克隆

在第一阶段，人们从几秒钟的音频中创建声音的数字表示。

语音克隆

中学生也能看懂的Sora视频生成原理解读

具体到Sora的实现，这个过程开始于一段与目标视频同样时长、但是内容完全是随机噪声的视频。

视频生成 sora

Stability AI开源上新：3D生成引入视频扩散模型

也就是说，此番登场的SV3D首次将视频扩散模型应用到了3D生成领域。

sv3d 建模

被高估的Pika，被低估的多模态AI

从 GPT-4V 的“惊艳亮相”，到 AI 视频生成工具 Pika 1.0 的“火爆出圈”，再到谷歌 Gemini 的“全面领先”，多模态 AI 都是其中的关键词。

大模型多模态

字节跳动推出MagicVideo-V2：引领AI视频生成新时代。

MagicVideo-V2的工作原理分为四个步骤：首先，T2I（Text-to-Image）模块根据文字描述生成图像；然后，I2V（Image-to-Video）模块将生成的静态图像动画化

MagicVideo-V2 视频生成

AI自动生成视频全流程干货

AI自动剪辑短视频本文工具集合：https://shorturl.at/kuU78 1.

AI 视频

<...5 6 7 8910 11 12 13 14 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2024 AI魔法学院

京ICP备20027199号-1