首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· GitHub上很火的RPA框架:一款用于验收测试和 RPA 的通用自动化框架robotframework
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· AI声音克隆 | 最全最简教程(权威版)
· Stable Diffusion|提示词高阶用法(二)双人同图
· DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好
· 80多个罕见的论文prompt,让你起飞!
· 14.4K Star,一款漂亮、快速、现代化的开源免费UI组件库
· 达摩院SPACE对话大模型:知识注入与知识利用
· 大模型微调应用实践,没那么简单,看看曾经踩过的坑
· 【ComfyUI】爽玩必备,6大插件汇总推荐 !
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
角色,背景,任务,产出内容与形式:如何写出优雅的prompt? - 通用的万能框
架
在ChatGPT3-Free-Prompt-List的项目上,他总结了一套prompt的方-法-论框
架
。
提示词
prompt
大模型
基于大模型(LLM)的Agent 应用开发
这种流程的潜在设计空间可能是巨大而复杂的,《如何
构
建基于大模型的App》一文给出了一种探索中的大模型应用开发基础框
架
,基本可以适用于RAG 和Agent。
大模型
Agent
工具
AIGC工具提示词技巧
比如写一篇命题作文,或者回答一个政治题,用什么样的框
架
、什么样的方向、什么样的开场,内容如何填充,用怎样的结
构
性语言?
AIGC
提示词
开源
[开源]面向中小团队的轻量化知识管理应用,
构
建知识库和知识社区
二、开源协议 使用BSD-3-Clause开源协议 三、界面展示 产品截图 四、功能概述 “知了”以知识管理的全生命周期为核心,围绕知识的分享再利用,
构
建中小团队的知识库和知识分享社区
大模型
Agent
LangChain Agent 原理解析
LangChain 是一个基于 LLM(大型语言模型)的编程框
架
,旨在帮助开发人员使用 LLM
构
建端到端的应用程序。
大模型
提示词
你要牢记的四个常用AI提示词框
架
:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
ICIO 框
架
ICIO 框
架
主要关注任务的明确性和输出的格式,它特别适用于那些需要明确指导 AI 完成特定任务的场景。
大模型
提示词
RAG
检索增强生成 (RAG):What, Why and How?
检索增强生成(简称 RAG)是 Meta 于 2020 年推广的一种
架
构
,旨在通过将相关信息与问题/任务细节一起传递给模型来提高 LLM 的性能。
检索增强
大模型
SDXL
【分享】SDXL模型最佳拍档!COMFY UI上手指南
SDXL 1.0 特点建立在由 3.5B 参数BASE模型和 6.6B 参数REFINE模型组成的两阶段创新
架
构
之上。
大模型
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框
架
Vary,支持中英文,已开源!
通过 LLM 极强的语言先验,这种
架
构
还可以避免 OCR 中的易错字,比如“杠杆”和“杜杆”等, 对于模糊文档,也有望在语言先验的帮助下实现更强的 OCR 效果。
OCR
手写
文字识别
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框
架
让AI生成的人物活起来丨GenAICon 2024
四大框
架
玩转AI人物视频生成,已落地通义千问APP。
通义
文生视频
新模型Cascade你真的用对了吗?!
Cascade 模型最大的优点是 § 是能生成带有文字的图片,文字出错率相比以前模型少很多; § § 其次是硬件要求降低,甚至与sd1.5相比,该
架
构
比之前版本实现了
Stable
Cascade
模型
开源
RAGFlow:开源的RAG引擎,专注于深入的文档理解,支持处理各种复杂格式的非结
构
化数据
支持处理各种复杂格式的非结
构
化数据,包括文本、图片、扫描副本、结
构
化数据和网页等。
RAGFlow
RAG
开源
开源
阿里巴巴语音实验室发布开源语音处理框
架
ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
因此,市场急需一套能够应对这些挑战并适应现代应用需求的语音处理框
架
,例如虚拟助手、视频会议和创意媒体制作。
ClearerVoice-Studio
语音
4秒惊艳!Stable Cascade AI绘画神器,设计师和普通用户的无限创意新选择
任何人都可以在Stability的GitHub页面上找到用于微调、ControlNet和LoRA训练的脚本,进一步挖掘这个全新
架
构
的潜力。
文生图
绘画
OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
在此背景下,OmniVision - 968M模型应运而生,它以紧凑的
架
构
、创新的技术设计,为边缘设备的多模态智能应用带来了新的曙光。
OmniVision
-
968M
多模态模型
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100