首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开发语
音
产品时设计唤醒词和命令词的技巧
在实际开发语
音
产品过程中,要达到好的语
音
识别效果,除了语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
数字人
数字人直播哪家强?中国数字人平台分析大全
另一类是应用广泛的数字人软件,主要用于直播和短视
频
等领域。
数字分身
数字人
工具
4K star!录屏好帮手,超酷的实时按键显示工具
两种情况下会很实用,比如电脑画面中颜色和显示风格接近,不容易区分,可以换一种风格或者颜色;又或者是要适配品牌风格,设置一个合适的样式,能让视
频
更专业。
Keyviz
录频
ComfyUI
ComfyUI初学者指南
ComfyUI 管理器 要安装此自定义节点,请转到PowerShell (Windows) 或终端(Mac) 应用程序中的自定义节点文件夹: cd ComfyUI/custom_nodes 并将节点
克
隆
到本地存储
文生图
comfyui
开源
爆火「视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
“视
频
版ControlNet”来了!
ControlNet
懒人福
音
!用AI生成会议纪要,让你的工作更高效!
会议
音
频
一般有几种,手机或录
音
笔的
音
频
,腾讯会议的
音
频
等,那如何把
音
频
转成文本呢?
会议纪要
AI工具
工具
惊艳推荐!8款好用又免费的文本转语
音
TTS工具
在早期,TTS技术主要依赖于预录制的声
音
样本,通过组合这些样本来生成语
音
。
TTS
Maker
语音
教程
用AI做郭德纲说英文相声的爆款视
频
(详细教程)
郭德纲用英文说相声的短视
频
火爆全网,单条视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
教程
openpose原理及安装教程(姿态识别)
OpenPose是一个用于实时多人姿态估计的开源库,它可以检测图像或视
频
中的人体关键点,并且能够识别不同的身体部位和动作。
行为识别
姿态识别
大模型
惊了,ChatGLM、Vicuna 等热门大模型丝滑 input,跟所有的下载上传说拜拜
public/datasets 公共教程 「公共教程」模版汇聚超过 100 个经典及流行教程,用户只需点击「
克
隆
下载
Python
Whisper对于中文语
音
识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语
音
做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
Sora
OpenAI Sora视
频
生成模型技术报告中英全文+总结+影响分析
ensp;Sora发布的潜在影响 ▎C端 / 对于普通人 •这或许是独立创作者最好的年代,Sora发布之后,文案、
音
效
sora
openai
视频生成
了解Kimi必看的26个问题 | Kimi系列文(二)
了解到,目前的GenAI有文本类、视
频
类、绘图类、
音
频
类、编程类、PPT、数字人、AI搜索等形式。
Kimi
大语言模型
人工智能
【AI科技大创意】2024年人工智能10大趋势
人工智能最终将在来年解锁语
音
优先的应用程序,特别是在伴侣和生产力类别中。
人工智能
趋势
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、视
频
,还可在端侧部署
总参数量 8B,单图、多图和视
频
理解性能超越了 GPT-4V。
minicpm
面壁
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100