首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
如何修复GPT幻觉、及
评
估
数据集的挑战
评
估
幻觉的其他基准 知识导向的LLM
评
估
基准(KoLA) TruthfulQA:衡量模型如何模仿人类的谎言 大型语言模型的医学领域幻觉测试 HaluEval:LLM的幻觉
评
估
基准 5、降温
大模型
大模型
大模型能力
评
估
体系
IDC发布的《AI大模型技术能力
评
估
报告,2023》等。
大模型
评估
大模型
评
论能力强于GPT-4,上交开源13B
评
估
大模型Auto-J
为此,上海交通大学生成式人工智能实验室迅速响应,推出了一款全新的价值对齐
评
估
工具:Auto-J,旨在为行业和公众提供更加透明、准确的模型价值对齐
评
估
。
Auto-J
大模型
心理
心理健康AI应用空白:LLM
评
估
基准震撼出炉(附Prompt模板)
研究团队认为,现有的
评
估
基准不能全面
评
估
LLMs在心理健康领域的能力,因此提出了PsyEval基准。
大模型
心理
被高
估
的Pika,被低
估
的多模态AI
公司初创团队只有 4 个人,创始人兼 CEO 郭文景有“女学霸”“斯坦福退学创业”“上市公司创始人女儿”等个人标签; Pika 三轮融资已筹款 5500 万美元,
估
值在 2-3 亿美元之间
大模型
多模态
大模型
大模型RAG检索增强问答如何
评
估
:噪声、拒答、反事实、信息整合四大能力
评
测任务探索
不过,我们需要注意的是,每种
评
测都是有偏的,取决于
评
测数据,
评
测模型本身,变量太多,其真正的有效性如何,并不好说,我们关注这种
评
估
方法,才是最大的意义所在。
大模型
RAG检索增强
大模型
技术布道 | Prompt
评
估
与优化,让魔法打败魔法,通过大模型获得更优质的Prompt进而获得更优质的内容
我们可以让大模型来帮着优化Prompt,今天我们选择在百度千帆大模型平台对Prompt进行
评
估
和优化。
prompt
大模型
目前大语言模型的
评
测基准有哪些?
ChatbotArena以众包方式让不同的大模型产品进行匿名、随机的对抗测
评
,其
评
级基于国际象棋等竞技游戏中广泛使用的Elo
评
分系统,Elo是一种计算玩家相对技能水平的方法,通过两名玩家之间的
评
分差异可以预测比赛的结果
人工智能评测
大模型
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
自动
评
估
指标的开发 研究者提出了一套自动
评
估
指标,通过计算参考网页截图和生成网页截图之间的相似度来自动
评
估
生成的网页。
设计转代码
大模型
Google
Google 模型解读 | MoveNet-SinglePose:自底向上做单人姿态
估
计
前言 说起业务落地级别的姿态
估
计算法方案,大家基本上的共识都是top-down范式,也就是det+pose的形式,先由一个轻量级的目标检测模型提供bbox,再依次送入pose模型进行单人姿态
估
计
MoveNet-SinglePose
Google
模型
大模型
中文通用大模型
评
测基准发布,全方位解析
评
价维度,助你选出最优秀的模型!
中文通用大模型综合性
评
测基准SuperCLUE正式发布。
大模型
训练
中文
大模型
大模型能力快速测
评
极简题目
请从编辑以下文本开始:{article} 我希望你充当一个电影
评
论家。
大模型
社区供稿|GPT-4 与国产模型,大!横!
评
!
在上海人工智能实验室上周刚刚公布的测
评
榜单上,GPT-4依旧独领风骚,排名第一,不过国产阵营已经大踏步追了上来,差距逐步缩小。
GPT-4
大模型
大模型
测
评
了8个国产AI大模型,差点崩溃……
本次测
评
主要是从一个普通用户的角度,围绕用户体验(交互界面、响应速度、稳定性)、基础能力(理解、生成、逻辑、记忆)、多模态输出能力以及场景模型(支持的数量丰富度以及质量)作为测
评
方向,目的是帮大家找到更适合自己使用的大模型
大模型
测评
数据库
点
评
:六大向量数据库
这一波gpt热潮,90%的企业开发,都是llm+本地知识库集成。而这也推动:向量数据库成了热点科技。AI研究院,推出的各种模块库构架图,为国内众多AI初创企业,快速掌握各种AI模块库底层核心算法,提供了一个超级神器。
向量数据库
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100