文章列表-AI魔法学院

文章列表

MindChat心理大模型

模型介绍心理大模型——漫谈(MindChat)期望从心理咨询、心理评估、心理诊断、心理治疗四个维度帮助人们纾解心理压力与解决心理困惑, 提高心理健康水平.

心理大模型

深入探秘：百川7B大模型的训练代码解析，揭秘巨无霸语言模型背后的奥秘

之前几期讲了大模型的一些部署相关，非常基础，感兴趣的同学可以参考下：手把手教你部署和理解大模型，超详细步骤，包教包会！

大模型

百模大战，谁是大模型的裁判员？

定义了树-邻接语法（TAG）的阿拉文德·乔西（Aravind Joshi）教授，曾提出过“如果没有基准来评估模型，就像不造望远镜的天文学家想看星星。”

大模型

解读wav2lip：探究语音驱动唇部动作的技术原理！

二、本文方法介绍 wav2lip模型的训练分为两个阶段，第一阶段是专家音频和口型同步判别器预训练；第二阶段是GAN网络训练。

wav2lip 语音

网易有道强力开源中英双语语音克隆

torchaudio pip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin 准备模型文件

语音开源

【开源项目】Flow Matching 语音合成

CFM是一种新技术，已被证明可以改进扩散模型，Meta的Voicebox模型将CFM引入语音合成领域，下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional

音视频 Flow Matching

从零开始学习大模型-第二章-大模型学习路线

随着技术的进步，大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及视频。

大模型学习

大语言模型的拐杖——RLHF基于人类反馈的强化学习

这些模型使用大规模的神经网络，可以生成自然语言文本，例如对话和文章。

大模型训练

一文汇总大语言模型LLM所有prompt提示词框架的论文出处

能够让大模型推理结果变得更好的基础优化手段已经非常多了，这里梳理了常见的提示技术手段和对应的论文： - Zero-shot（零样本提示）：https://arxiv.org/abs/2109.01652

prompt 提示词

大语言模型定制化应用的三种方式：Prompt engineering、Fine tuning、Pre-trainning的区别

在实现大语言模型的定制化应用中，的确有几种常用的方式：Prompt Engineering（提示工程）、Fine-tuning（微调）和Pre-training（预训练）。

大模型

「语音转换新速度」— 探秘Whisper JAX的70倍速提升

在AI的众多分支中，语音识别技术的突破性进展尤为引人瞩目。

Whisper 语音识别

【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比，等你来评!

MaskGCT模型介绍大型文本到语音（TTS）系统通常被分为自回归和非自回归系统。

语音克隆开源模型

开源免费离线语音识别神器whisper如何安装

Whisper系统所提供的自动语音辨识（Automatic Speech Recognition，ASR）模型是被训练来运行语音辨识与翻译任务的，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文

wisper 翻译免费

「语音识别的未来已来」——探索Distil-Whisper，轻量级AI的强大力量

在AI技术的浪潮中，一款新型的语音识别模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。

Distil-Whisper 语音识别

RVC和SVC声音模型难找？推荐这个网站

本篇文章介绍：1，声音数据集训练到模型的过程 2 ，SVC和RVC声音模型网站推荐一、声音数据集训练到模型的过程 AI声音模型训练是通过分析大量音频数据来学习声音特性，生成与目标声音相似的新音频

声音克隆数字人

<1 2 3 456 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1