首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
马斯克怒告OpenAI案解密:Ilya看到了什么?125万亿参数Q*细节曝光,53页PDF全网疯
转
但传闻中的Q*和AGI,已经让全世界谈之
色
变。
OpenAI
大模型
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程 AI声
音
模型训练是通过分析大量
音
频数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
AI
音
乐热潮下,“神曲工作室”率先失业
有些人在不知道
音
乐是AI制作前,会给予较高评价,一旦得知是AI做的,态度就会大
转
弯了。
音乐
音频
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
说明服务已经正常启动了,这里so-vits-svc会在后台运行一个基于Flask框架的web服务,端口号是7860,此时访问本地的网址:127.0.0.1:7860: 孙燕姿无损
音
色
模型
音乐
大模型
玩
转
大模型必备:milvus向量数据库私有化安装部署及使用介绍
将容器名称替
换
为你自己的。
向量数据库
GLM-4-Voice 9B——实时多语言语
音
对话 AI——几分钟内即可在本地安装
然而,大多数模型在流利地切
换
语言、理解口语查询的细微差别以及提供高质量响应方面仍然面临挑战。
GLM-4-Voice
9B
语音
安装
开源
OpenAI 开源语
音
识别 Whisper 的使用体验怎么样?
快速
转
换
:Buzz 的模型在本地离线运行,无需互联网连接,因此
转
换
速度非常快,适用于大量语
音
转
换
。
生成式AI
开源
网易有道强力开源中英双语语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
开源
从 GPT-4o 到 LiveKit:实时语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话语
音
技术。
GPT-4o
语音交互
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的
音
频生成开发框架
然而,
音
频生成领域的进展却相对滞后。
开源模型
Stable Diffusion
Stable Diffusion基础:ControlNet之图片高仿
我们将通过几个实例来加深体会,比如照片
转
二次元风格、名画改造、AI减肥成功图片制作、绘本小故事等等。
文生图
LLM
4种通过LLM进行文本知识图谱的构建方法对比介绍
我们在以前的文章中已经介绍了使用大语言模型将非结构化文本
转
换
为知识图谱。
知识图谱
大模型
开源
OpenAI真的开源了!这波「实时语
音
」操作,让万物开口说话,我爱了
以前,智能玩具里只能播放预设的程序和声
音
,顶多就是进行一两轮简单提问,你可以理解成是“单向输出”,现在有了这个 openAI 的实时语
音
软件开发包,就变成了“双向交互”,能和你进行实时的语
音
对话。
OpenAI
嵌入式实时语音
SDK
大模型
AI大模型LLM可以帮助企业做什么?
通过语
音
交互、图像处理等技术,辅助企业内部运营。
大模型
阿里
ReplaceAnything:阿里最新项目!重绘图片里的任何元素,商用价值极高!用最简单的部署创造最大的价值!
摘要 ReplaceAnything是阿里团队即将开源的项目,针对图像里的人物替
换
、服装替
换
、背景替
换
等方面做了极大的优化,使用户上传图片可以指定部分区域生成新内容,并且做到了严格保留遮挡区域,这对AIGC
ReplaceAnything
文生图
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100