首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 从第一性原理看大模型Agent技术
· ComfyUI官方使用手册【官网直译+关键补充】
· 芯片拼接技术:英伟达新核弹,站在苹果的肩膀上
· AI声音克隆 | 最全最简教程(权威版)
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 生成式AI与大语言模型的区别
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 深入解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI
音
乐热潮下,“神曲
工
作室”率先失业
“在我看来,AI它其实只是一个
工
具
,至少目前来说他做的那些歌。
音乐
音频
掌握这10个AI
工
具
用1小时完成别人1周的
工
作
本文强烈推荐10个非常好用的AI
工
具
。
AI
工具
Midjourney
【
工
具
书】文生图Midjourney最全prompt提示词分类对照表
;soldier 啦啦队 cheerleader 男演员 actor 女演员 actress 间谍 spy 特
工
&
提示词
prompt
文生图
4K star!录屏好帮手,超酷的实时按键显示
工
具
今天我就帮你找到了一个好用的
工
具
,它开源免费效果还超酷,帮你完成实时可视化键盘按键的效果,它就是:Keyviz。
Keyviz
录频
Python
Whisper对于中文
语
音
识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的
语
音
做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
OCR
OCRmyPDF—可智能识别PDF文本和图片信息的
工
具
动机 我在网上搜索了一个免费的命令行
工
具
来对PDF文件进行OCR:我找到了很多,但没有一个真正令人满意: •要么它们生成的PDF文件中的文本放置错误(使得无法复制/粘贴)•
OCRmyPDF
工具
懒人福
音
!用AI生成会议纪要,让你的
工
作更高效!
下面我会把已经在用的流程和经验分享给大家,包括
语
音
转文本
工
具
的用法,AI总结会议的提示词等等。
会议纪要
AI工具
视频
开箱即用的图像增强、视频增强AI
工
具
,Upscapl、Topaz Video AI
图像和视频领域使用较多的AI
工
具
,免安装,无需会员,开箱即用!
图像增强
视频增强
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
懂技术的小伙伴也可以寻找其他替代方案,比如
语
音
转文字模型 Whisper、文字翻译 GPT、声
音
克隆 + 生成
音
频 so-vits-svc、生成符合
音
频的嘴型视频 GeneFace++dengdeng。
语音
HeyGen
开源
GPT-4o实时
语
音
方案提供商Livekit开源voice agent:轻松处理
音
视频流
轻松访问 LiveKit WebRTC 会话并处理或生成
音
频、视频和数据流。
voice
agent
开源
音视频
6个AI
音
乐软件推荐,让你学会人
工
智能AI作曲
跟AI绘画一样,
音
乐产业正在将AI作为一种辅助
工
具
,而不是代替人类艺术家。
训练
音乐
Prompt
【
工
具
书】基于角色和思维链的人
工
智能中文Prompt提示词,涵盖几乎所有场景
您应该利用您在 UX/UI 设计原则、编码
语
言、网站开发
工
具
等方面的知识,以便为项目制定一个全面的计划。
prompt
提示词
开源
OpenAI 开源
语
音
识别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动
语
音
识别模型的软件
工
具
,能够将
音
频或视频中的
语
音
自动识别为带有时间戳的文本字幕。
生成式AI
开源
从 GPT-4o 到 LiveKit:实时
语
音
交互的开源实现
在人
工
智能技术日益普及的今天,GPT-4o 的实时
语
音
功能吸引了大量关注。
GPT-4o
语音交互
Github
GitHub上的RPA小
工
具
,可以将重复、繁琐的任务自动化
通过使用RPA
工
具
,可以将重复、繁琐的任务自动化,从而提高
工
作效率和准确性。
RPA
自动化
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100