首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
GLM-4-Voice 9B——实时多
语
言
语
音
对话 AI——几分钟内即可在本地安装
从虚拟助手到客户服务机器人,
语
音
人工智能已
成
为各个行业的重要工具。
GLM-4-Voice
9B
语音
安装
数字人
开源!数字人资源大集
合
!
AGORA 在 CVPR 2021论文中提出,由涵盖 350 多个独特主题的 4240 个扫描组
成
,全部与 SMPL-X 拟
合
配对。
数字人
开源
Python
Whisper对于中文
语
音
识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造
成
了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的
语
音
做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
一文读懂GPT-1:生
成
式预训练如何提升
语
言理解
为了深入探索大
语
言模型的发展历程,我们精心挑选了一系列经典论文进行分享,希望能与大家共同学习和理解大
语
言模型背后的技术。
GPT
开源
【TTS
语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
今天给大家同时展示5款(Fish、F5、GPT、CosyVoice、MaskGCT)爆火的
语
音
克隆-文本
合
成
的效果展示。
语音克隆
开源模型
开源
OpenAI真的开源了!这波「实时
语
音
」操作,让万物开口说话,我爱了
简单点说,就是一个“大脑”,能装进各种小玩意儿里,能让各种设备(比如毛绒玩具)具备实时
语
音
交互的能力。
OpenAI
嵌入式实时语音
SDK
RAG
忘掉 RAG,未来是 RAG-Fusion!搜索的下一个前沿:检索增强生
成
遇上倒数排名融
合
和生
成
查询
向量搜索融
合
:RAG通过将向量搜索功能与生
成
模型相结
合
,引入了一种新颖的范式。
RAG-Fusion
检索增强
开源
通过声
音
生
成
逼真的全身形象?!Meta开源AI工具:audio2photoreal
audio2photoreal的全称是From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations,意思是从
音
频到逼真的人体表现
合
成
对话中的人类
audio2photoreal
开源工具
LLM
如何
成
为LLM提示词大师!「大
语
言模型的底层心法」
生
成
(扩展)操作与缩减和转换任务涉及操作现有文本不同,生
成
操作从头开始
合
成
全新的内容。
大模型
提示词
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
近日,Google研究团队在其博客上发布了一篇文章,介绍了他们的最新研究
成
果:无监督
语
音
到
语
音
(Unsupervised Speech-to-Speech,简称USS)AI模型。
Translatotron
语音识别
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
2303.17580.pdf HuggingGPT是近期非常火热的Agents方向的一个代表,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于文生图、图生文、
语
音
转文字
提示词
prompt
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生
成
歌曲
(variational inference)、标准化流(normalizing flows)和对抗训练的高表现力
语
音
合
成
模型 应用so-vits-svc快速生
成
AI歌曲,仓库地址: https
音乐
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
RAG
RAG——使用检索增强生
成
构建特定行业的大型
语
言模型
towardsdatascience.com/build-industry-specific-llms-using-retrieval-augmented-generation-af9e98bb6f68 使用检索增强生
成
构建特定行业的大型
语
言模型
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100