首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 张嘴就能生图?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
· 炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 如何构建基于大模型的App
· Ollama 与 Dify:AI 应用开发的强强联合
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· Suno音乐新手指南(手把手完整版教程)
· 回望做大模型一年后的感悟
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
RAG与Long-Context之争—没必要争
为什么RAG是粗排,Long-Context是精排 从计算量角度来看,目前RAG是靠检索系统来进行相关内容过滤,一般采用ES、向量匹配等
方
法
,可以理解计算量较小,也就是文本之间交互较少;而Long-Context
RAG
Long-Context
大模型
ComfyUI
基于秋叶整合包-StableDiffusionWebUI启动器快速安装ComfyUI
这种界面设计
方
式不仅美观大
方
,还能够提高用户的操作效率,使得使用ComfyUI的过程更加轻松愉快。
秋叶
整合包
Agent
用了一个月,终于找到点写 AI Agent 的思路
即使,你有好的想
法
和执行力,互联网团队也很难容忍太长时间的人力投入,而看不到任何效果。
AI
Agent
Ops
运维工具
数字人
数字人直播哪家强?中国数字人平台分析大全
同时,目前极少有评
测
机构、自媒体或个人对它们去做中立的评
测
,可以参考的有效资料也非常少,很多时候需要自己用真金白银去验证。
数字分身
数字人
开源
clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
4、波形生成:最后,利用WaveNet或其他类似的声码器将Mel-spectrogram转换
回
自然的语音波形。
clone-voice
声音克隆
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
好在,这并不是唯一的制作
方
法
。
语音
HeyGen
Agent
AI进化的新纪元:AI AIgents时代(1/9)——什么是Agent?
OpenAI联合创始人Andrej Karpathy在一个开发者活动上发表讲话,谈及了他和OpenAI对AI Agents的看
法
。
大模型
大模型
基于大模型(LLM)的Agent 应用开发
定义Agent之间的交互行为,例如,当一个代理从另一个代理接收到消息时应该
回
复什么。
大模型
Agent
教程
AI声音克隆 | 最全最简教程(权威版)
开始前准备,注册 OpenBayes 平台账号 新用户注册 OpenBayes即可获得3小时免费RTX4090使用时长,用下
方
注册链接你我都可以多加一个小时免费时长哈
声音克隆
教程
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
细粒度控制: 该模型能够预
测
和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
chattts
tts
文生语音
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
Need for Speech to Lip Generation In the Wild 代码开源:https://github.com/Rudrabha/Wav2Lip 一、现有
方
法
不足
wav2lip
语音
大模型
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
测
试代号为 Orion 的新模型的 OpenAI 员工发现,尽管它的性能超过了 OpenAI 的现有模型,并且只完成了 20% 的训练就达到了 GPT-4 的水平,但与从 GPT-3 到 GPT-4
Scaling
Law
AI大模型
Fastwhisper + Pyannote 实现 ASR + 说话者识别
同时在CPU和GPU上进行8位量化,可以进一步提高算
法
效率。
faster-whisper
语者识别
ASR
ChatGPT
爆肝两天!ChatGPT+提示词解决知识库目录混乱
因此,寻找一个有效的
方
法
来优化和管理知识库结构显得尤为重要。
智能分类
大模型
知识库
企业
大语言模型LLM和知识图谱KG增强的企业搜索应用
将LLM应用于搜索的真正力量不是为了搜索本身,而是为了
方
便——将结果总结为简洁、易于阅读的格式。
开源模型
<
...
59
60
61
62
63
64
65
66
67
68
...
>
1
2
4
5
6
7
8
9
100