首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 2023年人工智能行业总结
· GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
· 各个语种互相翻译:Meta推出NLLB-200 AI模型,可实现200种语言互译
· AI领域的agent是什么意思?
· 「长文」可能是目前最全的LangChain AI资源库之一
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
· 它来了!SDXL + ControlNet 终于强强联合!
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· 如何将 GPT 幻觉发生率从 20% 以上降低到 2% 以下
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
大模型外挂知识库
优
化
技巧-如何更有效的利用召回的文档
文档片段长度最好别超过100,不然会影响embedding模型向量
化
效果,进而使得召回精度降低。
大模型
Prompt
Prompt 策略:代码库 AI 助手的
语
义
化
搜索设计
代码库 AI 助手是一种智能工具,通常使用自然
语
言处理和机器学习技术,旨在帮助开发者更有效地管理和理解大型代码库。
prompt
开发
语
音
产品时设计唤醒词和命令词的技巧
在实际开发
语
音
产品过程中,要达到好的
语
音
识别效果,除了
语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
其中,这个
语
音
转文字的 Whisper 模型非常好用。
语音
HeyGen
工具
惊艳推荐!8款好用又免费的文本转
语
音
TTS工具
虽然这种方法能够产生可理解的
语
音
,但由于样本数量的限制,很难达到完全自然的
语
音
合成效果。
TTS
Maker
语音
开源
GPT-4o实时
语
音
方案提供商Livekit开源voice agent:轻松处理
音
视频流
该框架包括用于常见工作流程的插件,例如
语
音
活动检测和
语
音
转文本。
voice
agent
开源
音视频
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程 AI声
音
模型训练是通过分析大量
音
频数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
开源
OpenAI 开源
语
音
识别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动
语
音
识别模型的软件工具,能够将
音
频或视频中的
语
音
自动识别为带有时间戳的文本字幕。
生成式AI
开源
从 GPT-4o 到 LiveKit:实时
语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话
语
音
技术。
GPT-4o
语音交互
GLM-4-Voice 9B——实时多
语
言
语
音
对话 AI——几分钟内即可在本地安装
GLM-4-Voice作为一款端到端的
语
音
模型,推动了多
语
言对话人工智能的边界,支持英
语
和中文的实时对话,同时提供可适应且类人
化
的响应生成。
GLM-4-Voice
9B
语音
安装
大
语
言模型的拐杖——RLHF基于人类反馈的强
化
学习
**字面翻译:**RLHF (Reinforcement Learning from Human Feedback) ,即以强
化
学习方式依据人类反馈
优
化
语
言模型。
大模型
训练
Prompt
大
语
言模型定制
化
应用的三种方式:Prompt engineering、Fine tuning、Pre-trainning的区别
在实现大
语
言模型的定制
化
应用中,的确有几种常用的方式:Prompt Engineering(提示工程)、Fine-tuning(微调)和Pre-training(预训练)。
大模型
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还
优
化
了内存使用效率。
语音识别
Faster-Whisper
Prompt
结构
化
Prompt必备基础:5分钟学会Markdown
语
法,实现提示词创作自由!
可能有些新同学还不知道结构
化
Prompt是什么,那么请看前两篇关于结构
化
Prompt的文章了解。
Prompt
提示词
Markdown
开源
OpenAI真的开源了!这波「实时
语
音
」操作,让万物开口说话,我爱了
就像直播里的那只麋鹿,它能听懂你的问题,然后用自然流畅的
语
音
跟你聊天,就是这个 SDK 的功劳!
OpenAI
嵌入式实时语音
SDK
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100