首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
语
音、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的
语
音识别模型,它是一种通用的
语
音识别模型,可以用于
语
音识别、
语
音翻译和
语
言识别等任务。
人工智能
大模型
wisper
开源
Chinese-LLM开源中文大
语
言模型合集
它采用Transformer自回归架构(auto-regressive),在超万亿(trillion)高质
量
语
料上进行预训练,拥有强大的基础能力。
大模型
中文
GLM-4-Voice 9B——实时多
语
言
语
音对话 AI——几分钟内即可在本地安装
然而,大多数模型在流利地切换
语
言、理解口
语
查询的细微差别以及提供高质
量
响应方面仍然面临挑战。
GLM-4-Voice
9B
语音
安装
ChatGPT
ChatGPT羊驼家族全沦陷!CMU博士击破LLM护栏,人类毁灭计划脱口而出
CMU和人工智能安全中心的研究人员发现,只要通过附加一系列特定的无意
义
token,就能生成一个神秘的prompt后缀。
开源模型
开源
9.4k Star!MemGPT:伯克利大学最新开源、将LLM作为操作系统、无限上下文记忆、服务化部署自定
义
Agent
MemGPT 允许你使用长期记忆和自定
义
工具构建 LLM Agent 最近有个新项目MemGPT,这个东西真的挺有意思,它可以让大型
语
言模型,比如让GPT-4这样的llm处理比原生更长的上下文窗口
MemGPT
大语言模型
开源
【开源项目】Flow Matching
语
音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
一文带你认识ELMo
,
语
法;单词在不同
语
境下的变化,即一词多
义
。
embedding
Insanely Fast Whisper:超快的Whisper
语
音识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音转录模型的超快速能力。
音频
Whisper
开源
国内外开源大
语
言模型一览表
这些模型在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练,进一步提升了中文基础
语
义
理解能力。
大模型
ChatGPT
感受恐惧的力
量
:用 ChatGPT 分析288 篇 10w+ 公众号文章标题的情感分布
上一篇文章中,我介绍了一篇研究 ChatGPT 做定性研究质
量
如何的文章,结果发现 ChatGPT 做文本分类的质
量
与人类一致。
大模型
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音识别技术
这款最新的自动
语
音识别模型不仅在多
语
言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
Prompt
请收好这12种Prompt编写模式,让不可靠的模型生成可交付的可靠结果
“ 不管是ChatGPT、Claude、Bard、Llama、文心一言、盘古、通
义
、星火还是ChatGLM这些大
语
言模型不总是可靠,总会出现幻觉,答非所问甚至胡编乱造。
prompt
科大讯飞
哈工大科大讯飞联合推出中文LLaMA-2 & Alpaca-2大
语
言模型
这些模型在原版Llama-2的基础上扩充并优化了中文词表,使用了大规模中文数据进行增
量
预训练,进一步提升了中文基础
语
义
和指令理解能力,相比一代相关模型获得了显著性能提升。
训练
大模型
阿里云开源通
义
千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
通
义
千问开源第二波!
大模型
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多
语
言检索效果超过微软跟openai
其一是没有标注信息的弱监督数据,来自于从网上挖掘得到的各种有
语
义
关联的数据,并过滤掉其中低质
量
的内容。
BGE
M3-Embedding
多语音检索
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100