文章列表-AI魔法学院

文章列表

RAG与Long-Context之争—没必要争

为什么RAG是粗排，Long-Context是精排从计算量角度来看，目前RAG是靠检索系统来进行相关内容过滤，一般采用ES、向量匹配等方法，可以理解计算量较小，也就是文本之间交互较少；而Long-Context

RAG Long-Context 大模型

基于秋叶整合包-StableDiffusionWebUI启动器快速安装ComfyUI

这种界面设计方式不仅美观大方，还能够提高用户的操作效率，使得使用ComfyUI的过程更加轻松愉快。

秋叶整合包

用了一个月，终于找到点写 AI Agent 的思路

即使，你有好的想法和执行力，互联网团队也很难容忍太长时间的人力投入，而看不到任何效果。

AI Agent Ops 运维工具

数字人直播哪家强？中国数字人平台分析大全

同时，目前极少有评测机构、自媒体或个人对它们去做中立的评测，可以参考的有效资料也非常少，很多时候需要自己用真金白银去验证。

数字分身数字人

clone-voice：一键克隆声音，开源AI技术让声音创作更便捷、更个性化

4、波形生成：最后，利用WaveNet或其他类似的声码器将Mel-spectrogram转换回自然的语音波形。

clone-voice 声音克隆

两天star量破千：OpenAI的Whisper被蒸馏后，语音识别数倍加速

好在，这并不是唯一的制作方法。

语音 HeyGen

AI进化的新纪元：AI AIgents时代（1/9）——什么是Agent？

OpenAI联合创始人Andrej Karpathy在一个开发者活动上发表讲话，谈及了他和OpenAI对AI Agents的看法。

大模型

基于大模型（LLM）的Agent 应用开发

定义Agent之间的交互行为，例如，当一个代理从另一个代理接收到消息时应该回复什么。

大模型 Agent

AI声音克隆 | 最全最简教程（权威版）

开始前准备，注册 OpenBayes 平台账号新用户注册 OpenBayes即可获得3小时免费RTX4090使用时长，用下方注册链接你我都可以多加一个小时免费时长哈

声音克隆教程

【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声！！

细粒度控制: 该模型能够预测和控制细粒度的韵律特征，包括笑声、停顿和插入词等。

chattts tts 文生语音

解读wav2lip：探究语音驱动唇部动作的技术原理！

Need for Speech to Lip Generation In the Wild 代码开源：https://github.com/Rudrabha/Wav2Lip 一、现有方法不足

wav2lip 语音

天塌了，Scaling Law 已撞收益递减墙？OpenAI 在内，所有大模型都正遭遇巨大瓶颈

测试代号为 Orion 的新模型的 OpenAI 员工发现，尽管它的性能超过了 OpenAI 的现有模型，并且只完成了 20% 的训练就达到了 GPT-4 的水平，但与从 GPT-3 到 GPT-4

Scaling Law AI大模型

Fastwhisper + Pyannote 实现 ASR + 说话者识别

同时在CPU和GPU上进行8位量化，可以进一步提高算法效率。

faster-whisper 语者识别 ASR

爆肝两天！ChatGPT+提示词解决知识库目录混乱

因此，寻找一个有效的方法来优化和管理知识库结构显得尤为重要。

智能分类大模型知识库

大语言模型LLM和知识图谱KG增强的企业搜索应用

将LLM应用于搜索的真正力量不是为了搜索本身，而是为了方便——将结果总结为简洁、易于阅读的格式。

开源模型

<...59 60 61 626364 65 66 67 68 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2024 AI魔法学院

京ICP备20027199号-1