首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 你的下一个浏览器,可以是豆包电脑版!
· MCP服务介绍及应用场景报告-来自Manus
· DeepMusic发布“和弦派”2.0:重塑AI音乐创作范式,赋予创作者全方位掌控
· 【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
· Stable Diffusion | SD腾讯云3步部署,全程五分钟,附价格费用清单
· 提示词框架:BROKE
· AI写作:如何用AI一键提炼文章要点,10倍提效(含提示词)
· Suno音乐新手指南(手把手完整版教程)
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ChatGPT
Ollama的
本
地化又一图形工具ChatOllama,让你轻松玩
转
ollama,ChatGPT
2.2.安装
本
项目有两种安装方式,这里是使用离线下载安装方式,另外还有docker安装方式。
ChatOllama
安装
开源
[中
文
开源震撼首发]33B QLoRA大
语
言模型Anima真的太强大了!QLoRA技术可能是AI
转
折点!
我们开源了第一个中
文
QLoRA 33B大
语
言模型——Anima。
开源模型
国内厂商
语
音
识别与Whisper评测:现状与概况对比
本
文
旨在通过对国内几家主要厂商的
语
音
识别技术与 Whisper 技术进行评测和对比,以期更全面地了解国内
语
音
识别技术的现状与概况。
语音识别
Faster-Whisper
开源
有感情的
语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的
语
音
生成模型,专门用于大型
语
言模型(LLM)助手的对话任务、对话
语
音
和视频介绍等应用。
ChatTTS
语音合成
【进阶】-
文
生图术
语
解释
念咒 提示词组合 (prompts) 施法/吟唱/t2i
文
本
转
图像 (txt2img) i2i
文生图
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生成视频插件
huggingface.co/guoyww/animatediff 如果无法下载,公众号回复 animatediff 获取下载链接,找到 mm_sd_v15_v2.ckpt 放到
本
地的目录中即可
动画
视频
AnimateDiff
开发
语
音
产品时设计唤醒词和命令词的技巧
在实际开发
语
音
产品过程中,要达到好的
语
音
识别效果,除了
语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生成视频插件库
huggingface.co/guoyww/animatediff 如果无法下载,公众号回复 animatediff 获取下载链接,找到 mm_sd_v15_v2.ckpt 放到
本
地的目录中即可
动画
视频
AnimateDiff
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段时间,「霉霉大秀中
文
」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字化时代,
文
本
转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
Stable Diffusion
Stable Diffusion图生图(真人
转
动漫)
一、简介 今天给大家分享使用Stable Diffusion图生图进行真人
转
动漫,木木共使用了五种模型进行真人
转
动漫测试,重绘幅度在0.45~0.6之间,如果重绘幅度过大,会导致生成的图片偏离主体样貌
StableDiffusion
图生图
大模型
Stability AI开年首个大模型:专写代码,支持18种编程
语
言,上下
文
100K,苹果笔记
本
离线就能跑
Stable Code 3B可理解处理18种不同的编程
语
言,上下
文
长度100K token。
Stability
AI
大模型
开源
GPT-4o实时
语
音
方案提供商Livekit开源voice agent:轻松处理
音
视频流
该框架包括用于常见工作流程的插件,例如
语
音
活动检测和
语
音
转
文
本
。
voice
agent
开源
音视频
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于
文
生图、图生
文
、
语
音
转
文
字、
文
字合成
语
音
等),从而让LLM能驱动其他智能Agent,实现多模态能力。
提示词
prompt
用AI轻松玩
转
年度总结PPT
使用提示词与 AI 沟通,提示词就用日常说话的 方式 ,专业术
语
叫 自然
语
言!
PPT
年终总结
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100