首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· CLiB中文大模型能力评测榜单(持续更新)
· 社区供稿|GPT-4 与国产模型,大!横!评!
· AI换脸:FaceFusion和Roop在线版修复,支持手机,平板,低配电脑!
· 九问中国大模型掌门人,万字长文详解大模型进度趋势
· 分析了数百万ChatGPT用户会话后发现的秘密
· 【ComfyUI】使用ComfyUI玩SDXL的正确打开方式
· 【Stable Diffusion】SD迎来动画革命,AnimateDiff快速出图
· 45个 DALL-E 3 使用案例 (附提示词) ,人人都是设计师
· SadTalker数字人常见问题3
· 图片生成速度最高提升10倍!可以做到“实时”生成!清华推出LCM/LCM-LoRA!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
腾讯开源的数字人MuseTalk到底行不行?
该模型能够根据输入的
音
频信号,自动调整数字人物的面部图像,使其唇形与
音
频内容高度同步。
MuseTalk
数字人
音频
写作
15个
中
文
AI写作提示词帮你覆盖所有主流写作场景!!!
请确保推
文
内容
中
不包含任何有争议或不适当的信息,并尽可能使用流畅、自然的
语
言。
写作
prompt
提示词
Sora
OpenAI Sora视频生成模型技术报告
中
英全
文
+总结+影响分析
、
音
效、视频AI生成的可用工具都已齐备,一个人可以无痛carry一个短片,好故事将价值千金,有才华的人更难被埋没。
sora
openai
视频生成
开源
6个最佳开源TTS引擎
种
语
言(包括
中
文
)。
TTS引擎
开源模型
大模型
OCR终结了?旷视提出可以
文
档级OCR的多模态大模型框架Vary,支持
中
英
文
,已开源!
以往这一任务需要
文
本识别、布局检测和排序、公式表格处理、
文
本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是
中
英
文
的大段
文
字
OCR
手写
文字识别
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
SenseVoice模型具有的功能特点: 多
语
言
语
音
识别:SenseVoice 支持包括
中
文
、英
文
、粤
语
、日
语
和韩
语
在内的多
语
言识别。
asr
tts
声音
大模型
姜子牙大模型系列 | 为知识检索而生,Ziya-Reader开源,多个长
文
本
中
文
任务第一
因此,关于检索增强的大模型的研究如火如荼,为了能从多个
文
档或超长
文
档
中
找到答案,各种超长上下
文
窗口的模型已经陆续发布。
大模型
Ziya
OCR
中
文
OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
此外,MiniCPM-V 2.0 还具备了独家的跨
语
言多模态泛化技术,让大模型可以用
中
文
解读英
文
菜单并给出推荐。
MiniCPM
大模型
开源
昆仑万维携Skywork-13B打造AI新纪元:600GB
中
文
数据集全球开源
它不仅开源了130亿参数的大模型,更罕见地配套开源了600GB、150B Tokens的超大高质量
中
文
数据集,为全球AI研究者提供了前所未有的资源。
Skywork
开源
数据
ComfyUI
手把手教你用上SDXL——SDXL 1.0 模型资源/comfyUI
中
文
一键包下载
本
文
将着重介绍在你自己的电脑上部署SDXL1.0,因为各类在线使用网站
中
,虽然体验有了较大的优化,但是多多少少还是需要你掏出一定的经济代价。
SDXL
下载
请以“亮相”为题目写一篇记叙
文
,要求不少于700字。
文
心一言: “亮相”是一个瞬间,一个舞台上的演员在掌声雷动
中
,优雅地走到台前,向观众鞠躬致意,展示自己的风采。
中文
大模型
训练
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
非自回归系统在训练过程
中
需要显式的
文
本与
语
音
对齐信息,并预测
语
言单元(如
音
素)的持续时间,这可能会影响其自然度。
MaskGCT
声音克隆
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本
文
本到
语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验
文
本到
语
音
转换。
数字人
声音克隆
GPT-SoVITS
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
具体来说,TSAC可以将3.5分钟的立体声歌曲压缩为192KB 的
文
件。
TSAC
音频工具
大模型
九问
中
国大模型掌门人,万字长
文
详解大模型进度趋势
因此,我们从头开始训练,对
中
文
语
料进行更好的理解,同时也会输入掌握英
文
知识。
大模型
详解
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100