首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· AI声音克隆 | 最全最简教程(权威版)
· ComfyUI官方使用手册【官网直译+关键补充】
· Coze多智能体(Multi-Agents)模式体验!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了
· 从第一性原理看大模型Agent技术
· 精通百种语言的翻译AI来了!Meta推出,免费、开源!
· 6个最佳开源TTS引擎
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
爆火「视频版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
这就是由全华人团队
打
造的最新视频处理算法CoDeF,发布才几天,迅速在网上爆火。
ControlNet
开源
中文开源OCR框架对比及介绍
为了让计算
机
更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。
OCR
RVC和SVC声音模型难找?推荐这个网站
AI声音模型训练是通过分析大量音频数据来学习声音特性,生成与目标声音相似的新音频。这包括数据预处理、模型构建、训练、评估和优化。为了达到逼真、自然的声音效果,需要大量高质量音频数据和计算资源,并且需要精细调整和优化模型。
声音克隆
数字人
Prompt
Prompt全攻略(四):强力Prompt带来出色的AI应用
这是基于对ChatGPT
机
制的透彻解析,以及对用户痛点的精准锁定,专为广大AI产品开发者与内容创作者设计的Prompt优化指南。
prompt
开源
玩一玩阿里通义千问开源版,Win11 RTX3060本地安装记录
虽然是低配版,但是在各类测试里面都非常能
打
。
大模型
ChatGPT
你是否发现ChatGPT甚至不能按
字
数要求回复问题?有人做了评测并讨论了可能的原因
Evaluating Large Language Models on Controlled Generation Tasks 你是否发现ChatGPT甚至不能按
字
数要求回复问题
大模型
控制
大模型
OCR的终极解法——传统算法VS多模态大模型
· 文
字
后处理。
OCR
大模型
文字识别
阿里
阿里出品自动化视频剪辑工具FunClip!
FunClip Logo FunClip是由阿里达摩院精心
打
造的一款完全开源、本地部署的自动化视频剪辑工具。
FunClip
视频
阿里
借题发挥下最近几例声音克隆的应用案例
某父亲痛失爱子,因为儿子托梦告知人是可以复活的,于是这位父亲到处寻找让人复活的办法,于是他关注到了最新的人工智能技术,开始找人咨询和学习技术,通过摸索,他知道通过ChatGPT可以训练儿子的过去的说话,文
字
等语料
声音克隆
数字人
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是中英文的大段文
字
:
OCR
手写
文字识别
大模型
大模型实践总结
对于以Transformer、MOE结构为代表的大模型来说,传统的单
机
单卡训练模式肯定不能满足上千(万)亿级参数的模型训练,这时候我们就需要解决内存墙和通信墙等一系列问题,在单
机
多卡或者多
机
多卡进行模型训练
大模型
训练
大模型
腾讯开源混元AI绘画大模型
最近大厂的大模型竞争激烈,百度的文心一言主
打
闭源和付费路线,阿里的通义千问主
打
开源免费路线,而腾讯的混元大模型,则不温不火。
腾讯
混元
文生图
大模型
玩转大模型必备:milvus向量数据库私有化安装部署及使用介绍
1.安装 目前官方提供 单
机
模式、集群模式、离线模式三种安装方式,目前milvus都是基于docker 容器方式按照,其中单
机
模式使用docker-compose方式,集群模式主要是依托K8S实现的。
向量数据库
Stable Diffusion
stable diffusion如何确保每张图的面部一致?
Compatible Image Prompt Adapter for Text-to-Image Diffusion Models,翻译成中文就是:用于文本到图像扩散模型的文本兼容图像提示适配器,名
字
很长很拗口
图生图
文生图
sd
大模型
全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万
字
论文理解力接近人类
再举个例子,要求Claude 3 Opus将难以阅读的手写
字
迹的照片转换为文本。
claude
大模型
<
...
7
8
9
10
11
12
13
14
15
16
...
>
1
2
4
5
6
7
8
9
100