文章列表-AI魔法学院

文章列表

Prompt | 抖音视频脚本

复制脚本并访问 https://beta.elevenlabs.io/speech-synthesis 以生成文本转语音。

prompt

BGE M3-Embedding：智源最新发布的text embedding模型，多语言检索效果超过微软跟openai

从实验结果上看，在多语言跟跨语种检索任务上，BGE M3-Embedding的效果超过之前提及的微软E5-mistral-7b微软E5-mistral-7b-instruct: 站在LLM肩膀上的text

BGE M3-Embedding 多语音检索

各个语种互相翻译：Meta推出NLLB-200 AI模型，可实现200种语言互译

这其中，中文分为简体繁体和粤语三种，而除了中英法日语等常用语种外，还包括了许多小众语言。

翻译大模型

AI绘画：InstantID Win11本地安装记录！

Windows11+Conda+git 1.克隆代码打开CMD工具，通过CD命令进入到指定目录，然后克隆代码。

InstantID Win11 安装

AI虚拟主播数字人技术实现Wav2Lip

本文主要实现图片说话（如下图的蒙娜丽莎）、视频融合语音（这里的核心都是人物口型与音频中的语音唇形同步）。

数字人视频

【进阶】-文生图术语解释

黑话# 缩写/术语解释 oneshot 一张图

文生图

Stable Diffusion

详解Stable Diffusion提示词prompt语法

详解Stable Diffusion提示词prompt语法

SD prompt 文生图提示词

用so-vits-svc-4.1进行音色转换的极简教程

其实歌声转换不仅仅适用于歌声，普通讲话也可以，只是歌唱的音调基本能覆盖到低、中、高全域声音类型，而正常说话可能无法做到全域覆盖，但是如果在录制声音的时候能够做到覆盖多种音调类型，也可以实现声音转换。

声音 sovits

6个最佳开源TTS引擎

TTS引擎用于实现文本到语音的转换。

TTS引擎开源模型

开源大语言模型完整列表

Large Language Model (LLM) 即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。

开源模型大语言模型

用so-vits-svc-4.1进行音色转换的极简教程！

其实歌声转换不仅仅适用于歌声，普通讲话也可以，只是歌唱的音调基本能覆盖到低、中、高全域声音类型，而正常说话可能无法做到全域覆盖，但是如果在录制声音的时候能够做到覆盖多种音调类型，也可以实现声音转换。

so-vits-svc 音色转换教程

RAG 2.0来了，它能成为生产落地的福音吗？

在典型的RAG系统中，通常会采用现成的通用嵌入模型来实现数据的嵌入处理，利用向量数据库进行高效的信息检索，并结合大型的黑盒语言模型来完成内容的生成。

RAG 大模型

6个AI音乐软件推荐，让你学会人工智能AI作曲

在当下的应用中，AI已经可以影响音乐制作过程的各个方面，包括音乐生成、音频掌握等。

训练音乐

胎教级SO-VITS-SVC使用教程：人工智能生成歌曲

learning for end-to-end Text-to-Speech）是一种结合变分推理（variational inference）、标准化流（normalizing flows）和对抗训练的高表现力语音合成模型

音乐

通往 AGI 之路：走进大语言模型

这篇文章就带你从三个方面认识目前最火热的大语言模型 ChatGPT。

AGI ChatGPT 大语言模型

<...2 3 4 567 8 9 10 11 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1