首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· prompt必须知道的26条军规
· 全球学术界知名学者教授信息大盘点(全)
· RAG 领域的新宠:为什么 AI 圈都在谈论 Jina ColBERT?
· QAnything:网易有道最新开源的“本地化部署知识库”AI问答系统
· 两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
· 做大模型需要的环境设置
· 「长文」可能是目前最全的LangChain AI资源库之一
· 大模型微调应用实践,没那么简单,看看曾经踩过的坑
· 挑战真实影像!Stable Diffusion超越摄影师的光影模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
一文彻底搞懂
多
模
态
-
多
模
态
推
理
多
模
态
推
理
多
模
态
推
理
涉及至少两种不同的感知
模
态
,最常见的是视觉和语言。
多模态推理
大模型
Sora
OpenAI视频
模
型Sora的
推
理
生成成本
多
高?
(Video Encoder/Decoder 的计算量相比 DiT 可以忽略不计) Sora 的
模
型
多
大呢?
Sora
推理
算力
开源
阿里云开源通义千问
多
模
态
大
模
型Qwen-VL,持续
推
动中国大
模
型生
态
建设
Qwen-VL以通义千问70亿参数
模
型Qwen-7B为基座语言
模
型研发,支持图文输入,具备
多
模
态
信息
理
解能力。
大模型
开源
GLM4 开源了!!!还有
多
模
态
今天,我们要分享一个令人震撼的消息:智谱 AI
推
出的最新一代预训练
模
型 GLM-4 系列中的开源版本——GLM-4-9B,现已全面开源!
智普
ChatGLM
多模态
开源
构建开源
多
模
态
RAG系统
什么是
多
模
态
?
RAG
大模型
OCR
OCR的终极解法——传统算法VS
多
模
态
大
模
型
多
模
态
大
模
型做 OCR 上面介绍了传统的大
模
型分两步处
理
才能获取识别后的名片信息,那么有没有可能一步识别出结果呢?
OCR
大模型
文字识别
【AI代
理
】
多
代
理
模
式之
多
任务分配&信息传递
昨天探索了
多
任务
模
式,让系统根据用户的输入信息自动找到对应的代
理
进行处
理
。
多任务模式
分配
传递
开源
中文版开源Llama 2同时有了语言、
多
模
态
大
模
型,完全可商用
Llama 2
模
型系列包含 70 亿、130 亿和 700 亿三种参数变体,相比上一代的训练数据增加了 40%,在包括
推
理
、编码、精通性和知识测试等许
多
外部基准测试中展示出了优越的表现,且支持
多
个语种
开源模型
被高估的Pika,被低估的
多
模
态
AI
多
模
态
AI 正处于爆发前夜。
大模型
多模态
【AI代
理
】扣子,开始探索
多
代
理
模
式
而
多
代
理
模
式又有什么作用呢?
多代理模式
大模型
微软
【全文翻译】微软166页论文解读 GPT-4V:
多
模
态
大
模
型的黎明
多
模
态
模
型的通用性不可避免地要求系统能够处
理
不同输入
模
态
的任意组合。
多模态大模型
GPT-4V
文生图
大
模
型
推
理
能力增强方法总结
CoT 就是把一个
多
步骤
推
理
问题,分解成很
多
个中间步骤,分配给更
多
的计算量,生成更
多
的 token,再进行求解。
推理能力
大模型
开源
最强国产开源
多
模
态
大
模
型MiniCPM-V:可识别图片、视频,还可在端侧部署
MiniCPM-V是面向图文
理
解的端侧
多
模
态
大
模
型系列。
minicpm
面壁
微调
LLM每周速递!大
模
型最前沿:
多
模
态
RAG、RAG加速、大
模
型Agent、
模
型微调/对齐
终于又有时间更新文章了,今天继续总结最近一周的研究动
态
,梳
理
了10篇有关大
模
型(LLMs)的最新研究进展,其中涉及涉及
多
模
态
RAG、
推
理
时对齐、
多
模
态
模
型、大
模
型微调、大
模
型Agent等热门研究。
大模型
研究
LLM
LLM大
模
型
推
理
输出生成方式总结
参数设置:do_sample = False, num_beams = 1 缺点: 1、生成文本重复 2、不支持生成
多
条结果。
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100