文章列表-AI魔法学院

文章列表

马斯克怒告OpenAI案解密：Ilya看到了什么？125万亿参数Q*细节曝光，53页PDF全网疯转

但传闻中的Q*和AGI，已经让全世界谈之色变。

OpenAI 大模型

RVC和SVC声音模型难找？推荐这个网站

本篇文章介绍：1，声音数据集训练到模型的过程 2 ，SVC和RVC声音模型网站推荐一、声音数据集训练到模型的过程 AI声音模型训练是通过分析大量音频数据来学习声音特性，生成与目标声音相似的新音频

声音克隆数字人

AI音乐热潮下，“神曲工作室”率先失业

有些人在不知道音乐是AI制作前，会给予较高评价，一旦得知是AI做的，态度就会大转弯了。

音乐音频

胎教级SO-VITS-SVC使用教程：人工智能生成歌曲

说明服务已经正常启动了，这里so-vits-svc会在后台运行一个基于Flask框架的web服务，端口号是7860，此时访问本地的网址：127.0.0.1:7860：孙燕姿无损音色模型

音乐

玩转大模型必备：milvus向量数据库私有化安装部署及使用介绍

将容器名称替换为你自己的。

向量数据库

GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装

然而，大多数模型在流利地切换语言、理解口语查询的细微差别以及提供高质量响应方面仍然面临挑战。

GLM-4-Voice 9B 语音安装

OpenAI 开源语音识别 Whisper 的使用体验怎么样？

快速转换：Buzz 的模型在本地离线运行，无需互联网连接，因此转换速度非常快，适用于大量语音转换。

生成式AI

网易有道强力开源中英双语语音克隆

其中的音素（phonemes）可以这样得到： python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.

语音开源

从 GPT-4o 到 LiveKit：实时语音交互的开源实现

今天我们来聊聊OpenAI 发布会提到的实时对话语音技术。

GPT-4o 语音交互

生成式AI领域拓展！MetaAI开源AudioCraft：一个支持AudioGen、MusicGen等模型的音频生成开发框架

然而，音频生成领域的进展却相对滞后。

开源模型

Stable Diffusion

Stable Diffusion基础：ControlNet之图片高仿

我们将通过几个实例来加深体会，比如照片转二次元风格、名画改造、AI减肥成功图片制作、绘本小故事等等。

文生图

4种通过LLM进行文本知识图谱的构建方法对比介绍

我们在以前的文章中已经介绍了使用大语言模型将非结构化文本转换为知识图谱。

知识图谱大模型

OpenAI真的开源了！这波「实时语音」操作，让万物开口说话，我爱了

以前，智能玩具里只能播放预设的程序和声音，顶多就是进行一两轮简单提问，你可以理解成是“单向输出”，现在有了这个 openAI 的实时语音软件开发包，就变成了“双向交互”，能和你进行实时的语音对话。

OpenAI 嵌入式实时语音 SDK

AI大模型LLM可以帮助企业做什么？

通过语音交互、图像处理等技术，辅助企业内部运营。

大模型

ReplaceAnything：阿里最新项目！重绘图片里的任何元素，商用价值极高！用最简单的部署创造最大的价值！

摘要 ReplaceAnything是阿里团队即将开源的项目，针对图像里的人物替换、服装替换、背景替换等方面做了极大的优化，使用户上传图片可以指定部分区域生成新内容，并且做到了严格保留遮挡区域，这对AIGC

ReplaceAnything 文生图

<...6 7 8 91011 12 13 14 15 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1