首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· Stable Diffusion 必装插件查缺补漏,你还有哪个没装?(下)
· Prompt屠龙术-少样本示例
· 【AI代理】扣子,开始探索多代理模式
· AI开源 - LangChain UI 之 Flowise
· ComfyUI初学者指南
· Midjourney AI绘画美女提示词分享一
· 【一步一步引导】从零详细地梳理一个完整的 LLM 训练流程
· RVC和SVC声音模型难找?推荐这个网站
· 4秒惊艳!Stable Cascade AI绘画神器,设计师和普通用户的无限创意新选择
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
那么对于现在基于 CLIP 视觉词表的多模大模型也是一样的,遇到 “foreign language image”,如一页论文密密麻麻的文字,很难高效地将图片 token
化
,Vary 提出就是解决这一问题
OCR
手写
文字识别
Nvidia发布Llama3-ChatQA-1.5: 提升对话问答和表格推理能力,平均性能超越GPT-4
相比之前的ChatQA 1.0版本,其训练方法和数据集都进行了优
化
,尤其增强了对表格数据和算术计算的理解能力。
Llama3-ChatQA-1.5
对话问答模型
写作
AI 爆文写作:如何用GPT写出10万+?这篇五千字长文给你答案
这样的结构还可以进一步优
化
吗?
AI写作
GPT
LLM
Agent : 一文读懂LLM Agent架构,详解Profile,Memory,Planning,Action模块作用
还可以利用数据库存储,或组织为结构
化
列表表示内存语义。
大模型
LLM
Agent
ComfyUI
Comfyui工作流管理插件,再也不用保存本地了!
2.模块
化
,现代软件开发项目都是模块
化
的,整个系统被分解为不同的模块。
Comfyui
工作流
插件
Sora
Sora懂不懂物理世界?
一方面因为临界态样本的稀缺,另一方面因为扩散模型将稳恒态数据流形的边界模糊
化
,消弭了临界态的存在,生成的视频出现了不同稳恒态之间的跳跃。
文生视频
视频生成
sora
Stable Diffusion
深入浅出学习Stable diffusion之线稿转效果图
在sd的左上角我们看到秋叶包中加载的暂时只有一个anything的模型,这是一个大体模型,就是很多风格集中在一起的模型,不论是景观、建筑、动漫人物还是什么,但是当你需要出独特的风格图时候就需要更优
化
的模型
Stable
Diffusion
文生图
大模型
爬虫
微信搜狗爬虫WechatSogou - 从微信公众号获取文章的利器
它能够获取文章的标题、摘要、发布时间、阅读量等信息,并将其保存为结构
化
数据。
WechatSogou
微信
搜狗
阿里
阿里最近推出AI项目的动作太过频繁,脑子跟不上了,事出反常必有妖,盘点一下
这个框架利用了 Stable Difusion 模型的文生图功能并结合人像风格
化
LORA 模型训练及人脸相关感知理解模型,将输入的图片进行训练后推理输出生成为个人写真图像。
阿里
大模型
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
主要功能包括: · 支持多种声音变
化
AI § MMVC § so-vits-svc § RVC(Retrieval-based-Voice-Conversion
AudioCraft
音频
ChatGPT
ChatGPT丨一次性修改全文的提示语!
- 简
化
或重新安排句子,以提升段落间的过渡和连贯性。
写文章
ChatGLM
玩一玩ChatGLM3,1660s即可流畅运行!
可以看到一张3090就可以轻松玩转不同量
化
等级的模型。
大模型
ChatGLM
大模型
回望做大模型一年后的感悟
不过,当时也看到了OpenAI内部对于AGI和商业
化
的追求是有明显的差异
化
的,因为在microsoft的时候有不少research team和product team合作的痛苦经验,深知两个方向所优
化
的目标是高度不
大模型
感悟
盘点来自工业界的GPU共享方案
在接入K8s方面,AWS开源的device-plugin[16]没有考虑资源的二维关系,实现了非常简
化
的资源allocate。
大模型
开源
开源版妙鸭相机来了,无限出个人写真图(阿里达摩院出品)
image 训练阶段 输入:用户上传的包含清晰人脸区域的图像 输出:人脸LoRA模型 描述:首先,我们分别使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细
化
旋转方法处理用户上传图像
妙鸭相机
<
...
59
60
61
62
63
64
65
66
67
68
...
>
1
2
4
5
6
7
8
9
100