首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 本地部署Manus+DeepSeek保姆级教程!
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· GPU 性能(数据表)快速参考
· 盘点数据安全合规方向的热门证书【快来了解一下】
· YOO简历
· 五大AI工具自动生成PPT效果对比
· 实测:本地跑llama3:70B需要什么配置
· 划重点!全网最全AI数字人工具合集!
· 阿里Outfit Anyone实现真人百变换装
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
精通百种语言的翻译AI来了!Meta推出,免费、开源!
这个模型可以实现近101种语言之间的文本、
音
频
、
视
频
等多种形式的翻译,而且只需要一个模型就可以完成所有任务。
大语言模型
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语
音
交互大模型
例如,CNNs可以从语
音
频
谱图中提取出关键的声学特征,而Transformer模型则可以对长文本进行深入理解,从而实现准确的情感分析和语
音
合成。
Westlake
-
Omni
语音
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
AI 实现
视
频
自动剪切 近几年,短
视
频
的风口一直在持续,各大社交网站也都针对短
视
频
流量进行大力扶持。
开源模型
数字人
划重点!全网最全AI数字人工具合集!
· 编辑
视
频
:添加各种特效、背景
音
乐、字幕,让
视
频
更富有看点。
AI
数字人
详解 Diffusion (扩散) 模型
目前,它们主要用于图像和
音
频
生成。
Diffusion
开源模型
开源
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
写一篇关于Vision Pro VR眼镜的20字宣传文案,并用女声读出来,同时生成个
视
频
看看。
大模型
「语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
短
视
频
内容分类 解析短
视
频
语义进行场景分类 video-detecction
视
频
检测 对
视
频
信息进行内容解析
开源
数字人
揭秘数字人困境:代理商亏钱、直播屡被封、刘润也不用了
做短
视
频
是数字人最大用处吗?
数字人
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI工具都能直接用,UI简直是
视
觉盛宴!
用户可以上传各种类型的文件,包括文档、图片、
音
频
和
视
频
,同时还可以创建知识库,方便用户管理和搜索文件,还可以在对话中使用文件和知识库功能。
AI开源
集合
智谱AI静悄悄的上线了一大波新模型,过年了,真的
图像和
视
频
理解模型GLM-4V-Plus。
智谱AI
大模型
【提前体验GPT-5】吴恩达AI智能体工作流详细解读
当时他只是文本简单介绍了一下,现在他在斯坦福大学对此内容的演讲
视
频
已经发布。
GPT-5
智能体
数字人
数字人:从科幻走向现实的技术革命
数字人,这一曾被
视
为科幻领域独有的概念,如今正逐渐走入我们的日常生活。
数字人
语音
盘点来自工业界的GPU共享方案
进年来工业界一直孜孜不倦地寻求提升GPU利用率的方案,能被更多用户理解和使用的GPU共享走进工程师的
视
野中。
大模型
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语
音
克隆工具!
其核心功能是通过提供发言者的短
音
频
片段(参考语
音
),实现声
音
的高效克隆。
tts
文本转语音
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100