首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
有道开源的国产语
音
库EmotiVoice爆火了!具有情绪控制功能的语
音
合成引擎!
前不久小圈为大家介绍过 Coqui 文本
转
语
音
(Text-to-Speech,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
ChatGPT
Ollama的本地化又一图形工具ChatOllama,让你轻松玩
转
ollama,ChatGPT
4.基本聊天4.基本聊天 创建系统指令,也就是聊天中system角
色
,比如让它做为你的翻译助手,可以在instrucions选create new instruction创建指令,保存: 最上面选
ChatOllama
安装
打造
音
乐传奇:Suno推出
音
乐生成模型Suno V3,让每个人都能成为作曲家
古典、爵士、Hiphop、电子……自由变
换
,随心所欲,满足各种人群需求,远超期待!
suno
歌曲
音乐
开源
有感情的语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语
音
生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语
音
和视频介绍等应用。
ChatTTS
语音合成
借题发挥下最近几例声
音
克隆的应用案例
最近接连接到几个客户找我订制声
音
的案例: 1.某父亲痛失爱子,因为儿子托梦告知人是可以复活的,于是这位父亲到处寻找让人复活的办法,于是他关注到了最新的人工智能技术,开始找人咨询和学习技术,通过摸索,他知道通过
声音克隆
数字人
Stable Diffusion
小白设计师福
音
:Stable Diffusion 16款插件测评,好用不?推荐吗?
其中包含,中文输入自动
转
英文、自动保存使用描述词、描述词历史记录、快速修改权重、收藏常用描述词、翻译接口可以多种选择、一键粘贴删除描述词等。
SD
插件
文生图
开发语
音
产品时设计唤醒词和命令词的技巧
在实际开发语
音
产品过程中,要达到好的语
音
识别效果,除了语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
这为前端开发带来了一场自动化革命,其中多模态大型语言模型(LLMs)有望直接将视觉设计
转
换
为代码实现。
设计转代码
大模型
开源
开源语
音
大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
为了预处理
音
频数据,Whisper将其重新采样为16kHz的频率,并使用25ms的窗口大小和10ms的跳跃大小将原始波形
转
换
为80通道的Mel频谱图。
大模型
语音
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语
音
识别数倍加速
懂技术的小伙伴也可以寻找其他替代方案,比如语
音
转
文字模型 Whisper、文字翻译 GPT、声
音
克隆 + 生成
音
频 so-vits-svc、生成符合
音
频的嘴型视频 GeneFace++dengdeng。
语音
HeyGen
Stable Diffusion
Stable Diffusion 喂饭教程来啦!价值上万的模特AI
换
装方法
在电商领域,最近AI模特
换
装特别火,结合网上的教程和实战,总结了一个最简单性价比最高的方法。
Stable
Diffusion
文生图
懒人福
音
!用AI生成会议纪要,让你的工作更高效!
会议
音
频一般有几种,手机或录
音
笔的
音
频,腾讯会议的
音
频等,那如何把
音
频
转
成文本呢?
会议纪要
AI工具
数字人
一款构建AI数字人项目开源了!自动实现
音
视频同步!
本周GitHub项目圈选: 主要包含
音
视频同步、多代理框架、3D对象模型、适用于开发者的演示文档构建工具、网页程序打包、自构建CRUD应用等热点项目。
AI数字人
音视频同步
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
想将一份文档图片
转
换
成 Markdown 格式?
OCR
手写
文字识别
VividTalk:用一张照片和一段
音
频让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段
音
频结合起来,创造出仿佛真人在说话的视频的技术。
VividTalk
视频
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100