首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OCR
完全指南——使用
python
提取PDF中的文本信息(包括表格和图片OCR)
机
器生成的pdf文件:这些pdf文件是在计算
机
上使用W3C技术(如HTML、CSS和Javascript)或其他软件(如Adobe Acrobat
大语言模型
python
AI落地里那些假的
机
会
不具备跨越可能的使用价值就是假的
机
会。
大模型
Google
Google 模型解读 | MoveNet-SinglePose:自底向上做单人姿
态
估计
前言 说起业务落地级别的姿
态
估计算法方案,大家基本上的共识都是top-down范式,也就是det+pose的形式,先由一个轻量级的目标检测模型提供bbox,再依次送入pose模型进行单人姿
态
估计
MoveNet-SinglePose
Google
模型
教程
openpose原理及安装教程(姿
态
识别)
OpenPose基于深度学习和计算
机
视觉技术,采用了卷积神经网络(CNN)来实现对人体姿
态
的准确识别。
行为识别
姿态识别
实现聊天
机
器人打字
机
形式输出内容:SSE原理介绍及Post实现方式
SSE默认支持断线重连
机
制,在连接断开时会 触发EventSource的error事件,同时自动重连。
大模型
大模型
阿里云开源通义千问多模
态
大模型Qwen-VL,持续推动中国大模型生
态
建设
在主流的多模
态
任务评测和多模
态
聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。
大模型
伦敦出租车司
机
的遭遇,暗示了程序员的未来
伦敦的出租车司
机
,特别是那些驾驶传统的黑色出租车的司
机
,可能是世界上最厉害的。
人工智能
伦理
AI撬开小县城的万元商
机
还有智能教育
机
器人进入了课堂,为学生提供个性化的学习辅导,提高了学习效果。
AI
商机
LLM
收藏!万字长文聊聊LLM Agents的现
状
,问题与未来
三个模块也描述了一个Agent自身
状
态
的全部组成。
LLM
Agents
开源
GLM4 开源了!!!还有多模
态
多模
态
能力,视觉与语言的融合 GLM-4V-9B 是基于 GLM-4-9B 的多模
态
模型,具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在多模
态
评测中表现超越了多个竞争对手
智普
ChatGLM
多模态
数字人
Threejs: 数字人生成金色动
态
粒子效果
昨天的文章提到通过修改数字人的材质做全息投影仪的动
态
效果,今天分享一下生成金色动
态
粒子人的代码,效果图如下: 效果中还包含多个粒子效果的动
态
转换,有了这个,再加上摄像头,就可以完全模拟亚运会的数字人效果了
Threejs
数字人
语音
国内厂商语音识别与Whisper评测:现
状
与概况对比
本文旨在通过对国内几家主要厂商的语音识别技术与 Whisper 技术进行评测和对比,以期更全面地了解国内语音识别技术的现
状
与概况。
语音识别
Faster-Whisper
WeChaty:强大的微信个人号
机
器人SDK
本文将介绍 WeChaty 及其
Python
接口,探讨如何通过 WeChaty 在
Python
环境中构建智能微信
机
器人。
微信
接口
开源
构建开源多模
态
RAG系统
换句话说 想象你有一个超级聪明的
机
器人朋友。
RAG
大模型
大模型
中文版开源Llama 2同时有了语言、多模
态
大模型,完全可商用
首先通过模
态
编码器编码不同模
态
数据特征,紧接着在多模
态
特征对齐的预训练阶段学习模
态
适配器(Adaptor),将不同模
态
的输入特征与大语言模型对齐。
开源模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100