首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级
别
?强烈推荐
通过约70万小
时
的多
语
种数据训练,
实
现了接近人类水平的
语
音
合成效果,目前已更新到1.4版本。
Fish
Speech
本地搭建
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本
识
别
、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是中英文的大段文字
OCR
手写
文字识别
ChatGPT
使用ChatGPT6小
时
写出高分论文
同
时
,它还会提供一些学术用
语
和连接词,以赋予你的论文更浓厚的学术气息。
ChatGPT
写作
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端
语
音
交互大模型
模型评估与优化 为了确保模型的性能和质量,使用了多种评估指标来评估Westlake - Omni的性能,如
语
音
识
别
准确率、情感分类准确率、
语
音
合成自然度等。
Westlake
-
Omni
语音
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
尽管这个项目专注于财经领域,但他们认
识
到
音
频AI在更广泛的
音
乐创作领域内的潜力。
suno
音乐
大模型
使用大模型自动回复小红书/抖
音
/快手评论:通过RAG 优化LLMs
实
现
大型
语
言模型(LLMs)已经展示出了令人印象深刻的能力,可以存储和部署大量知
识
以响应用户查询。
RAG
大模型
自动回复
大模型
OCR的终极解法——传统算法VS多模态大模型
命名
实
体
识
别
命名
实
体
识
别
(Named Entity Recognition, NER)是自然
语
言处理(Natural Language Processing, NLP)的一个分支,它的任务是
识
别
文本中具有特定意义的
实
体
OCR
大模型
文字识别
数字人
数字人:从科幻走向现
实
的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合成以及人工智能算法等。
数字人
语音
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字化
时
代,文本转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
ChatGPT
AI 绘画新
时
代:ChatGPT + DALL-E 3
用户以自由表达的
语
言解释生成图像的问题,为模型的优化提供精细注释。
文生图
图生图
chatGPT
DALL-E
大模型
使用知
识
图谱提高RAG的能力,减少大模型幻觉
在使用大型
语
言模型(llm)
时
,幻觉是一个常见的问题。
RAG
大语言模型
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
通过对10万小
时
的自然
语
音
进行
实
验,结果表明MaskGCT在质量、相似度和可理解性等方面是业内领先的零样本TTS系统。
MaskGCT
声音克隆
Agent
Agent具体
实
现
如果需要自己
实
现工具,则需要继承 BaseTool 类,并
实
现 run 方法。
Agent
大模型
Stable Diffusion
Stable Diffusion基础:ControlNet之身份标
识
本文给大家分享一个新的ControlNet类型:Instant ID,翻译为身份标
识
,核心能力是由国内的小红书团队开发的。
ControlNet
文生图
Python
Python入门与
语
法速查
特
别
是人工智能的火热,再加之它的
语
法简洁且优美,
实
乃初学者入门AI必备的编程
语
言。
python
编程
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100