首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 盘点数据安全合规方向的热门证书【快来了解一下】
· Agent : 一文读懂LLM Agent架构,详解Profile,Memory,Planning,Action模块作用
· 硬核解读Stable Diffusion(系列一)
· RAG模型的主要痛点和解决方案
· 6个最佳开源TTS引擎
· 用so-vits-svc-4.1进行音色转换的极简教程!
· TreeMind
· TrOCR——基于transformer模型的OCR手写文字识别
· 《OpenAI官方:GPT 最佳实践》大白话编译解读版本
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
中学生也能看懂的Sora视频生成原理解读
通过在原生比例上进行训练,Sora可以更好地掌握视频的构图和框架设计,与那些将所有训练视频裁
剪
成正方形的模型相比,Sora能够更加准确地保持视频主题的全貌。
视频生成
sora
耗时7天,终于把15种ControlNet模型搞明白了
ensp; 首先处理动漫照片记得要换二次元的大模型 然后关键词可以写一些质量词,然后描述一下照片里面有什么东西 另外需要注意的是,图片的分辨率大小要设置的和原先的比例一样不然照片会自动裁
剪
放大
文生图
大模型
大模型RAG检索增强问答如何评估:噪声、拒答、反事实、信息整合四大能力评测任务探索
指标公式为: 其中#tt为正确答案的数量,考虑到模型可能并不完全符合拒绝率和错误检测率的结构化要求,还使用ChatGPT对答案进行了额外的评估,即使用说明和演示来评估模型的回答,以确定它们是否能反
映
出文档中不存在的信息或识别出任何事实错误
大模型
RAG检索增强
大模型
大模型应用中大部分人真正需要去关心的核心——Embedding
由于CNN的空间不变特性,无论边缘或直线出现在图像的哪个位置,这些特征都将始终
映
射到相同的桶。
大模型
RAG
忘掉 RAG,未来是 RAG-Fusion!搜索的下一个前沿:检索增强生成遇上倒数排名融合和生成查询
搜索的过度简化:我们普遍的搜索范式是将查询线性
映
射到答案,缺乏理解人类查询的多维性。
RAG-Fusion
检索增强
大模型
大模型推理能力增强方法总结
从数学形式上讲,每个这样的变换都可以建模成 T (G, p_θ),其中 G = (V, E) 是反
映
推理当前状态的图,p_θ 是所使用的 LLM。
推理能力
大模型
大模型
大模型的研究新方向:混合专家模型(MoE)
为了缓解通信宽带瓶颈,可以考虑以下策略: - 模型
剪
枝和量化:减小模型的大小,包括专家模型和门控网络的参数数量,以降低通信开销。
MoE
大模型
LLM
收藏!万字长文聊聊LLM Agents的现状,问题与未来
句向量是将整个句子
映
射到向量空间,而计算句子语义相似度最常见的方式则是计算其text embedding之间的余弦相似度。
LLM
Agents
Agent
RPA终极发展方向瞄准AI Agent,超自动化智能体时代已经开启
这两个绰号,恰恰反
映
了RPA不够稳定的缺点。
RPA
自动化
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
这种差异表明,人类评估者通常更关注高层次的视觉效果和布局,而不是详细内容,这反
映
了人类的自上而下处理方式。
设计转代码
大模型
Agent
十篇高质量的AI-Agents相关论文,让AI教你认识AI-Agents
令人惊讶的是,我们发现,获得模型的内部状态——其对前k个预测的信心、明确或隐含的注意力
映
射(突出显示模型在回答有关图像的问题时正在查看(和聆听)的图像区域和问题中的单词)——并不能帮助人们更好地预测其行为
开源模型
Stable Diffusion
Stable Diffusion WebUI v1.8.0重大更新!
· 避免在修复中进行双重放大 · 修复#14591使用翻译内容进行类别
映
射的错误
SD
画图
一招让你的 AI 图像更惊艳!DALL-E 3 自定义指令魔法
2.对峙: 这是一个充满悬念的场景,我们的武士啮齿动物与另一只生物对峙,两只啮齿动物的身影都
映
衬在一轮冉冉升起的巨大红日之下,给人一种行动迫在眉睫的感觉。
DALL-E3
文生图
开源
中文开源OCR框架对比及介绍
先看下效果: 整体的压缩流程就是集成模型
剪
枝、量化(包括量化训练和离线量化)、蒸馏和神经网络搜索等业界常用且领先的模型压缩功能。
OCR
大模型
大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
这种代理的设计优先考虑直接的输入输出
映
射,而不是复杂的推理和符号操作。
大模型
<
...
12
13
14
15
16
17
18
19
20
21
>
1
2
4
5
6
7
8
9
100