首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 读取大脑重建高清视频,Stable Diffusion还能这么用
· AI绘画 | Midjourney高质量肖像提示词的写法(附50+肖像提示词prompt)
· 百度智能云的Prompt模板
· stable diffusion API 调用,超级详细代码示例和说明
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 产品运营全流程SOP
· 测评了8个国产AI大模型,差点崩溃……
· 阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 国产视频制作之光-可灵:提示词大全整理
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
24年首篇离奇论文:加点噪声,RAG效果翻倍?
论文:《The Power of Noise: Redefining Retrieval for RAG Systems》 这篇论文探讨了基于
检
索
增强的
语
言模型(RAG)系统中的信息
检
索
(IR)组件对系统性能的影响
RAG
检索增强
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
其中,这个
语
音
转文字的 Whisper 模型非常好用。
语音
HeyGen
SQL
RLHF 在 Text2SQL 领域中的探
索
本文主要介绍了 Text2SQL 的基本概念,以及 RLHF 的概念和框架,最后结合 DB-GPT-Hub 项目,将 RLHF 方法应用于 Text2SQL 任务进行实践探
索
。
Text2SQL
RLHF
OmniVision - 968M:小巧精悍的视觉
语
言模型,释放
多
模态边缘计算强大潜能
多
层感知器(MLP)作为投影层,起到了桥梁的作用,将视觉编码器生成的图像嵌入与基础
语
言模型的标记空间进行对齐,使模型能够实现端到端的视觉
语
言理解。
OmniVision
-
968M
多模态模型
工具
惊艳推荐!8款好用又免费的文本转
语
音
TTS工具
TTS Maker TTS Maker 是一个文本到
语
音
(TTS)服务,支持
多
种
语
言和不同的声
音
选项(包括:中文、英
语
、日
语
、法
语
、阿拉伯
语
、韩
语
等等,甚至转换成方言:包括东北话、粤
语
、闽南话等等
TTS
Maker
语音
开源
GPT-4o实时
语
音
方案提供商Livekit开源voice agent:轻松处理
音
视频流
该框架包括用于常见工作流程的插件,例如
语
音
活动
检
测和
语
音
转文本。
voice
agent
开源
音视频
大模型
中文版开源Llama 2同时有了
语
言、
多
模态大模型,完全可商用
语
音
到文本
多
模态开源对话模型 (LLaSM) LinkSoul.AI 开源了可商用的中英文双
语
语
音
-
语
言助手 LLaSM 以及中英文
语
音
SFT 数据集 LLaSM-Audio-Instructions
开源模型
开源
OpenAI 开源
语
音
识别 Whisper 的使用体验怎么样?
近期,AI 领域异常热门,众
多
惊人且令人担忧的工具不断涌现。
生成式AI
开源
从 GPT-4o 到 LiveKit:实时
语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话
语
音
技术。
GPT-4o
语音交互
RAG
RAG从入门到精通-RAG简介
前言 RAG(Retrieval Augmented Generation,
检
索
增强生成)是一个将大规模
语
言模型(LLM)与来自外部知识源的
检
索
相结合的框架,以改进问答能力的工程框架。
rag
大模型
大模型
炸裂!百川开源第1个7B
多
模态大模型 Baichuan-Omni | 能够同时分析图像/视频/
音
频/文本
探
索
了自然
多
模态人机交互的初期研究。
Baichuan-Omni
多模态大模型
Python
Whisper对于中文
语
音
识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的
语
音
做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
RAG
你真的会写 Prompt ? 剖析 RAG 应用中的指代消解
着 ChatGPT 等大
语
言模型(LLM)的不断发展,越来越
多
的研究人员开始关注
语
言模型的应用。
Prompt
大语言模型
RAG
RAG
一文看懂RAG:大
语
言模型落地应用的未来
其中一些主要限制包括: 不适应
多
模态数据:基础RAG主要关注文本数据的
检
索
和生成,对于
多
模态数据(例如图像、
音
频)的处理能力有限。
rag
检索增强
RAG
24年首篇离奇论文:加点噪声,RAG效果翻倍?!
论文:《The Power of Noise: Redefining Retrieval for RAG Systems》 这篇论文探讨了基于
检
索
增强的
语
言模型(RAG)系统中的信息
检
索
(IR)组件对系统性能的影响
RAG
检索
论文
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100