首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· Fooocus,webui,comfyui优缺点
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 2024!深入了解 大语言模型(LLM)微调方法(总结)
· YOO简历
· Midjourney AI绘画美女提示词分享三
· stable diffusion如何确保每张图的面部一致?
· Stable Diffusion使用Roop插件一键换脸教程
· AI换脸工具:facefusion使用心得
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OCR
OCR的终极解法——传统算法VS
多
模
态大
模
型
这些
模
型通常是大型的神经网络,它们经过大量数据的训练,能够捕捉不同
模
态之间的关联,并执行跨
模
态的
任
务
。
OCR
大模型
文字识别
LLM
LLM大
模
型推理输出生成方
式
总结
Greedy Search 方
式
:每一时间步都选择概率最大的词。
大模型
XX来信: 智能体设计
模
式
2:Reflection
亲爱的朋友们, 之前我介绍了AI智能体工作流的四种设计
模
式
,我相信它们将在今年推动重大进展:Reflection, Tool use, Planning and
Reflection
智能体
被高估的Pika,被低估的
多
模
态AI
“之前很
多
公司都在卷文本大
模
型,GPT-4V 的出现代表
多
模
态大
模
型可落地,毫无疑问明年大家都会卷
多
模
态 AI ,原因很简单,因为 OpenAI 说明这条路是能够走得通
大模型
多模态
清华
清华、面壁智能发布:主动
式
Agent 2.0
· 目前大
多
数Agent是被动
式
的,限制了它们在需要预见性和自主决策的场景中的有效性。
Agent
2.0
大模型
LLM
自己电脑上跑大语言
模
型(LLM)要
多
少内存?
我到底要
多
少内存才够?
大语言模型
运行
医疗
惊艳!2.77亿参数锻造出Agent+GPT-4V
模
型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
这个
模
型能处理文本、图像、动作输入,轻松应对
多
任
务
挑战,甚至跨界在机器人、游戏、医疗等领域展现强大实力。
Agent+GPT-4V
大模型
开源
OCR终结了?旷视提出可以文档级OCR的
多
模
态大
模
型框架Vary,支持中英文,已开源!
以往这一
任
务
需要文本识别、布局检测和排序、公
式
表格处理、文本清洗等
多
个步骤—— 这一次,只需一句话命令,
多
模
态大
模
型 Vary 直接端到端输出结果: 无论是中英文的大段文字
OCR
手写
文字识别
开源
阿里云开源通义千问
多
模
态大
模
型Qwen-VL,持续推动中国大
模
型生态建设
在主流的
多
模
态
任
务
评测和
多
模
态聊天能力评测中,Qwen-VL取得了远超同等规
模
通用
模
型的表现。
大模型
微调
总结!大
模
型微调(Tuning)的常见方法
这是通过在与
任
务
相关的数据集上训练
模
型来完成的。
微调
大模型
LLM
LLM Agent最常见的九种设计
模
式
(图解+代码)
如果说 ReAct更适合 完成“厨房拿胡椒粉”的
任
务
,那么 Plan & solve 更适合完成“西红柿炒鸡蛋”的
任
务
:你需要计划,并且过程中计划可能会变化(比如你打开冰箱发现没有西红柿时,你将购买西红柿作为新的步骤加入计划
LLM
Agent
图解
开源
中文版开源Llama 2同时有了语言、
多
模
态大
模
型,完全可商用
据项目介绍,Chinese-Llama-2-7b 开源的内容包括完全可商用的中文版 Llama2
模
型及中英文 SFT 数据集,输入格
式
严格遵循 llama-2-chat 格
式
,兼容适配所有针对原版 llama
开源模型
生成
式
AI与大语言
模
型的区别
采用生成
式
人工智能的艺术家可以尝试调整
多
种技术。
生成式AI
大语言模型
区别
聊天大
模
型的输出速度应该是
多
少?单张显卡最
多
可以支持
多
少个人同时聊天?来自贾扬清最新的讨论~
尤其是作为聊天应用来说,在用户输入之后,大
模
型可以在
多
短的时间内给出回应对于用户体验来说影响巨大。
大模型
微调
LLM每周速递!大
模
型最前沿:
多
模
态RAG、RAG加速、大
模
型Agent、
模
型微调/对齐
此外,OmniGen可以处理经典的计算机视觉
任
务
,将其转换为图像生成
任
务
。
大模型
研究
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100