首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· LLM大模型推理输出生成方式总结
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 大模型:泛化即智能,压缩即一切!
· Coze多智能体(Multi-Agents)模式体验!
· 揭秘DeepSeek:一个更极致的中国技术理想主义故事
· 长窗口大战要终结了?谷歌魔改Transformer,推出了“无限注意力”
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 实战:如何用AI Agent实现ChatGPT流程化写作,产能翻倍
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
6.
训
练
定制:PaddleOCR支持用户根
据
自己的需求进行模型
训
练
和定制,满足特定场景下的OCR需求。
PaddleOCR
文字识别
学会这招,一个头像变100种风格!
在 Mijdourney 里,如何根
据
一张图随意切换风格?
Remix
文生图
开源
截至2023年5月份业界支持中文大语言模型开源总结及商用协议分析
OPT模型本身并没有特意针对多语言进行
训
练
,不过他们的
数
据
集
很大,因此也能在简单的中英文翻译中获得不错的结果。
大模型
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
为此,我们提出了一种两阶段的
训
练
策略,以分离人体动作和外观(例如面部表情、肤色和着装),包括对同一
数
据
集
的人舞姿势的外观控制块的预
训
练
和对外观-姿势-联合控制块的精细调整。
MagicPose
视频
Nvidia发布Llama3-ChatQA-1.5: 提升对话问答和表格推理能力,平均性能超越GPT-4
相比之前的ChatQA 1.0版本,其
训
练
方法和
数
据
集
都进行了优化,尤其增强了对表格
数
据
和算术计算的理解能力。
Llama3-ChatQA-1.5
对话问答模型
语音
语音识别的未来已来:深入了解faster-whisper的突破性进展
faster-whisper的核心优势在于其能够在保持原有模型准确度的同时,大幅提升处理速度,这使得它在处理大规模语音
数
据
时更加高效。
语音识别
Faster-Whisper
人工智能
生成式人工智能的“经济学”,The Economic Case for Generative AI
它可以根
据
输入的信息,生成出与之相关的文字、图片、甚至是音乐!
生成式人工智能
经济学
ChatGPT
清华智能体「XAgent」比ChatGPT4.0还好用!
数
据
分析:展示双环机制的有效性 我们将使用一个简单的
数
据
集
iris.zip上传到XAgent,然后让XAgent分析
数
据
集
并生成一个报告。
ChatGPT
智能体
Agent
教程
用so-vits-svc-4.1进行音色转换的极简教程!
主要是因为孙燕姿的音色独特,吐词清晰,网络上存在她的大量歌曲,非常便于
训
练
。
so-vits-svc
音色转换
教程
大模型
中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生
早在去年五月中旬,经过
数
十版模型
训
练
与优化,中国电信就完成了百亿参
数
星辰AI大模型稳定版本的
训
练
。
开源大模型
电信
开源
Embedding开源模型重磅玩家:北京智源人工智能研究院最新Embedding模型发布!登顶MTEB,免费商用授权!
BGE模型的
训
练
有2个阶段:分别是预
训
练
阶段和微调阶段。
开源模型
开源
爆火!腾讯开源PhotoMaker:高效地定制化生成任意风格的逼真人类照片!
· · 此外,为了驱动PhotoMaker的
训
练
,提出了一个面向id的
数
据
构建管道来组装
训
练
数
据
。
PhotoMaker
文生图
开源
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
光
集
成的工具就有这么多,比如NLP、语音、视觉、多模态等多种模型,以及默认
集
成知识检索、API检索等方案。
大模型
工具
使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
RAG(Retrieval Augmented Generation)是一种检索增强生成技术,它利用大型语言模型来处理用户查询,RAG 技术的主要组成包括
数
据
提取—embedding—创建索引—检索—
RAG
大语言模型
Stable Diffusion
Stable Diffusion 必装插件查缺补漏,你还有哪个没装?(上)
Stable Diffusion 的强大很大一部分来源于整个社区提供的免费插件,通过
集
成不同的插件实现各种炸裂的效果。
Stable
Diffusion
文生图
<
...
23
24
25
26
27
28
29
30
31
32
...
>
1
2
4
5
6
7
8
9
100