文章列表-AI魔法学院

文章列表

语音、视频转文字神器：开源whisper介绍

OpenAI的Whisper是一种基于深度学习的语音识别模型，它是一种通用的语音识别模型，可以用于语音识别、语音翻译和语言识别等任务。

人工智能大模型 wisper

Chinese-LLM开源中文大语言模型合集

它采用Transformer自回归架构（auto-regressive），在超万亿（trillion）高质量语料上进行预训练，拥有强大的基础能力。

大模型中文

GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装

然而，大多数模型在流利地切换语言、理解口语查询的细微差别以及提供高质量响应方面仍然面临挑战。

GLM-4-Voice 9B 语音安装

ChatGPT羊驼家族全沦陷！CMU博士击破LLM护栏，人类毁灭计划脱口而出

CMU和人工智能安全中心的研究人员发现，只要通过附加一系列特定的无意义token，就能生成一个神秘的prompt后缀。

开源模型

9.4k Star！MemGPT：伯克利大学最新开源、将LLM作为操作系统、无限上下文记忆、服务化部署自定义Agent

MemGPT 允许你使用长期记忆和自定义工具构建 LLM Agent 最近有个新项目MemGPT，这个东西真的挺有意思，它可以让大型语言模型，比如让GPT-4这样的llm处理比原生更长的上下文窗口

MemGPT 大语言模型

【开源项目】Flow Matching 语音合成

CFM是一种新技术，已被证明可以改进扩散模型，Meta的Voicebox模型将CFM引入语音合成领域，下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional

音视频 Flow Matching

一文带你认识ELMo

，语法；单词在不同语境下的变化，即一词多义。

embedding

Insanely Fast Whisper：超快的Whisper语音识别脚本

项目简介这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。

音频 Whisper

国内外开源大语言模型一览表

这些模型在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练，进一步提升了中文基础语义理解能力。

大模型

感受恐惧的力量：用 ChatGPT 分析288 篇 10w+ 公众号文章标题的情感分布

上一篇文章中，我介绍了一篇研究 ChatGPT 做定性研究质量如何的文章，结果发现 ChatGPT 做文本分类的质量与人类一致。

大模型

OpenAI大动作：Whisper large-v3重塑语音识别技术

这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步，而且还将很快在OpenAI的API中得到支持。

Whisper 语音识别

请收好这12种Prompt编写模式，让不可靠的模型生成可交付的可靠结果

“ 不管是ChatGPT、Claude、Bard、Llama、文心一言、盘古、通义、星火还是ChatGLM这些大语言模型不总是可靠，总会出现幻觉，答非所问甚至胡编乱造。

prompt

哈工大科大讯飞联合推出中文LLaMA-2 & Alpaca-2大语言模型

这些模型在原版Llama-2的基础上扩充并优化了中文词表，使用了大规模中文数据进行增量预训练，进一步提升了中文基础语义和指令理解能力，相比一代相关模型获得了显著性能提升。

训练

阿里云开源通义千问多模态大模型Qwen-VL，持续推动中国大模型生态建设

通义千问开源第二波！

大模型

BGE M3-Embedding：智源最新发布的text embedding模型，多语言检索效果超过微软跟openai

其一是没有标注信息的弱监督数据，来自于从网上挖掘得到的各种有语义关联的数据，并过滤掉其中低质量的内容。

BGE M3-Embedding 多语音检索

<...5 6 7 8910 11 12 13 14 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1