首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
生成式AI与大语言模型的区
别
同样,音乐和文本生成模型分
别
在庞大的音乐或文本数据集上进行训练。
生成式AI
大语言模型
区别
知
识
树:一个方法,教你构建「终身知
识
体系」
——《认知红利》 看过的每一本书、每一条知
识
,写的每一篇笔记,如果都能被分门
别
类地永久储存,还能有一键搜索功能,等需要用的时候,还能有个图书管理员帮我迅速找到,那该多好。
大模型
SEO知
识
点入门
想要真是真正提升SEO能力和知
识
,一定要有网站,个人建议SEOer最好要有自己的个人网站。
大模型
达摩院SPACE对话大模型:知
识
注入与知
识
利用
②分角色多轮次,至少两个参与主体,轮次间存在省略、指代、状
态
继承、状
态
遗忘等。
大模型
大模型
OCR的终极解法——传统算法VS多模
态
大模型
命名实体
识
别
命名实体
识
别
(Named Entity Recognition, NER)是自然语言处理(Natural Language Processing, NLP)的一个分支,它的任务是
识
别
文本中具有特定意义的实体
OCR
大模型
文字识别
大模型
阿里云开源通义千问多模
态
大模型Qwen-VL,持续推动中国大模型生
态
建设
在主流的多模
态
任务评测和多模
态
聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。
大模型
AIGC
《构建个人知
识
图谱》:让 AIGC 帮你自动构建知
识
图谱
还记得我们的知
识
图谱节点上有一个「描述」字段吧,这个是为了记录这个知
识
结点的介绍信息。
提示词
文生图
AIGC
大模型
OCR终结了?旷视提出可以文档级OCR的多模
态
大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本
识
别
、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模
态
大模型 Vary 直接端到端输出结果: 无论是中英文的大段文字
OCR
手写
文字识别
开源
GLM4 开源了!!!还有多模
态
多模
态
能力,视觉与语言的融合 GLM-4V-9B 是基于 GLM-4-9B 的多模
态
模型,具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在多模
态
评测中表现超越了多个竞争对手
智普
ChatGLM
多模态
数字人
Threejs: 数字人生成金色动
态
粒子效果
昨天的文章提到通过修改数字人的材质做全息投影仪的动
态
效果,今天分享一下生成金色动
态
粒子人的代码,效果图如下: 效果中还包含多个粒子效果的动
态
转换,有了这个,再加上摄像头,就可以完全模拟亚运会的数字人效果了
Threejs
数字人
阿里
体验完阿里的EMO模型,我emo了
简单来说,EMO(Emote Portrait Alive)是一个AI肖像视频生成系统,能够通过输入单一的参考图像,生成具有一定表现力的面部标签和各种头部
姿
态
。
EMO
文生图
开源
构建开源多模
态
RAG系统
RAG通过整合检索机制解决了这个问题,从外部知
识
库中提取相关事实,确保回答在语言上正确且在事实上准确。
RAG
大模型
大模型
中文版开源Llama 2同时有了语言、多模
态
大模型,完全可商用
Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体,相比上一代的训练数据增加了 40%,在包括推理、编码、精通性和知
识
测试等许多外部基准测试中展示出了优越的表现,且支持多个语种
开源模型
视频
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音
识
别
,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
实时语音
识
别
:听写文本并获得即时转录。
AI语音克隆
实时语音识别
Stable Diffusion
Stable Diffusion基础:ControlNet之身份标
识
本文给大家分享一个新的ControlNet类型:Instant ID,翻译为身份标
识
,核心能力是由国内的小红书团队开发的。
ControlNet
文生图
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100