首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
医疗
惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用
智
能
时代你准备好了吗?
这个模型
能
处理文本、图像、动作输入,轻松应对
多
任务挑战,甚至跨界在机器人、游戏、医疗等领域展现强大实力。
Agent+GPT-4V
大模型
开源
俄罗斯人开源了最大的文生图模型:参数量12B,比SDXL大了3倍
多
!
Diffusion模型,架构如下所示: 其中text encoder采用的是谷歌的Flan-UL2,这个模型的参数量是20B,它和谷歌的T5采用同样的架构,但是比最大的T5模型T5-XXL大了近两倍,当然性
能
有一个提升
Kandinsky-3
文生图
开源模型
ChatGLM
可
能
是国产最强AI,ChatGLM-4来了!
二、
智
能
体
最让我感到惊艳的,是定制化功
能
:创建
智
能
体
。
ChatGLM
智普
ChatGPT
爆肝两天!ChatGPT+提示词解决知识库目录混乱
- 每年文章的增长速度是
多
少?
智能分类
大模型
知识库
工具
做自媒
体
消息闭塞很致命,巨好用的工具分享
新榜10W+,实时提供各种爆文,对想要入行自媒
体
,不知道做选题的,可以查看上面的选题,进行模仿创作。
自媒体
工具
一位芯片投资人的十年复盘:谁是中国的英伟达|AI光年
2015年,杨光和前同事白宗义一起创立了耀途资本,布局半导
体
领域围绕消费电子、汽车电子、数据中心与云计算等应用场景,投资了壁仞科技、瀚博半导
体
、爱芯元
智
、云豹
智
能
、Hailo、Vayyar和星宸科技(301536
AI光年
芯片投资
大模型
阿里云开源通义千问
多
模态大模型Qwen-VL,持续推动中国大模型生态建设
在主流的
多
模态任务评测和
多
模态聊天
能
力评测中,Qwen-VL取得了远超同等规模通用模型的表现。
大模型
大模型
LLM每周速递!大模型最前沿:
多
模态RAG、RAG加速、大模型Agent、模型微调/对齐
随着当前
多
模态模型的发展,它可以同时处理文本和图像,「那么
能
否将
多
模态模型应用到RAG系统呢?」
大模型
研究
写作
AI写作:一步到位,如何用 AI 生成整篇文章?做自媒
体
必看!
话不
多
说,直接上干货!
结构化提示词
写作
Agent
AI Agent新对决:LangGraph与AutoGen的技术角力
,于是一款新的技术框架:LangGraph应运而生,正式宣布 LangChain 进入
多
智
能
体
框架领域。
LangGraph
AutoGen
对决
大模型
最强国产开源
多
模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
总参数量 8B,单图、
多
图和视频理解性
能
超越了 GPT-4V。
minicpm
面壁
Nvidia发布Llama3-ChatQA-1.5: 提升对话问答和表格推理
能
力,平均性
能
超越GPT-4
该模型在对话式问答和检索增强型生成等
能
力方面表现出色,在综合评测指标上甚至超越了当前业界顶尖的GPT-4模型。
Llama3-ChatQA-1.5
对话问答模型
大模型
AI+大模型在金融行业的应用场景
AI技术之于现有金融行业的赋
能
是
多
领域、
多
环节的。
AI大模型
金融
大模型
OCR终结了?旷视提出可以文档级OCR的
多
模态大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等
多
个步骤—— 这一次,只需一句话命令,
多
模态大模型 Vary 直接端到端输出结果: 无论是中英文的大段文字
OCR
手写
文字识别
Sora
中学生
能
看懂:Sora 原理解读
这就像你在查看世界名胜相册时,尽管照片
多
种
多
样,但你依然
能
通过相同的方式去理解和欣赏它们。
Sora
原理
<
...
7
8
9
10
11
12
13
14
15
16
...
>
1
2
4
5
6
7
8
9
100