首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
尽管这个项目专注于财经领域,但他们认
识
到
音
频AI在更广泛的
音
乐创作领域内的潜力。
suno
音乐
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本
识
别
、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是中英文的大段文字
OCR
手写
文字识别
大模型
OCR的终极解法——传统算法VS多模态大模型
命名
实
体
识
别
命名
实
体
识
别
(Named Entity Recognition, NER)是自然
语
言处理(Natural Language Processing, NLP)的一个分支,它的任务是
识
别
文本中具有特定意义的
实
体
OCR
大模型
文字识别
大模型
使用大模型自动回复小红书/抖
音
/快手评论:通过RAG 优化LLMs
实
现
大型
语
言模型(LLMs)已经展示出了令人印象深刻的能力,可以存储和部署大量知
识
以响应用户查询。
RAG
大模型
自动回复
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
然后,它可以生成听起来自然的
语
音
,以多种
语
言模仿该
语
音
,同
时
为用户提供对情感、口
音
、节奏和
语
调等参数的精细控制。
OpenVoice
声音克隆
开源
数字人
数字人:从科幻走向现
实
的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合成以及人工智能算法等。
数字人
语音
大模型
使用知
识
图谱提高RAG的能力,减少大模型幻觉
在使用大型
语
言模型(llm)
时
,幻觉是一个常见的问题。
RAG
大语言模型
ChatGPT
AI 绘画新
时
代:ChatGPT + DALL-E 3
用户以自由表达的
语
言解释生成图像的问题,为模型的优化提供精细注释。
文生图
图生图
chatGPT
DALL-E
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字化
时
代,文本转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
通过对10万小
时
的自然
语
音
进行
实
验,结果表明MaskGCT在质量、相似度和可理解性等方面是业内领先的零样本TTS系统。
MaskGCT
声音克隆
数字人
AI虚拟主播数字人技术
实
现Wav2Lip
本文主要
实
现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口型与
音
频中的
语
音
唇形同步)。
数字人
视频
Agent
Agent具体
实
现
如果需要自己
实
现工具,则需要继承 BaseTool 类,并
实
现 run 方法。
Agent
大模型
Stable Diffusion
Stable Diffusion基础:ControlNet之身份标
识
本文给大家分享一个新的ControlNet类型:Instant ID,翻译为身份标
识
,核心能力是由国内的小红书团队开发的。
ControlNet
文生图
Python
Python入门与
语
法速查
特
别
是人工智能的火热,再加之它的
语
法简洁且优美,
实
乃初学者入门AI必备的编程
语
言。
python
编程
一文彻底搞懂多模态 - 多模态推理
这两种模态的信息可以是图片和文本、视频和
语
音
等。
多模态推理
大模型
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100