首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· LangChain Agent 原理解析
· 无需翻墙,可合法使用的8款国内AI大模型产品
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· SD入门教程零:应用场景
· 教会AI画汉字(ComfyUI篇)
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
训练魔法
大模型
大模型:泛化即智能,压缩即一切
本文总结了关于机器学习模型泛化能力的理解,强调了通过大量不同数据训练高容量模型的重要性,以追求长期泛化能力而非短期模型微调。文章从孔子对泛化能力的阐述引入,类比到机器学习领域,提出模型泛化能力类似于孩子通过多样化学习建立坚实认知基础。探讨了监督学习和无监督学习在提升模型泛化能力中的作用,特别是无监督学习通过分布匹配捕捉数据内在结构。此外,讨论了涌现现象,即模型在长时间训练后突然理解数据深层数学结构并实现泛化。文章最后总结了泛化能力的关键要素,并提到压缩与预测等价,大模型可视为对世界信息的压缩表示。
大模型
泛化
2024-08-01
2024-08-01
DeepMusic发布“和弦派”2.0:重塑AI音乐创作范式,赋予创作者全方位掌控
4月29日,DeepMusic发布AI音乐工作站“和弦派”2.0,贯穿音乐创作全过程,支持多种AI生成及创作方式、轻松编辑、一键导出多种格式文件,确保专业品质,且为移动端应用,便捷高效。创始人刘晓光称这是打破创作边界、提升生产力的重要一步,标志着DeepMusic服务能力的拓展,开启AI音乐创作新篇章。
和弦派
DeepMusic
音乐创作
2024-08-01
2024-08-01
阿里
阿里RAG新框架R4:增强检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!
R4框架通过增强检索器-重排序-响应器机制解决大型语言模型生成文本时的“幻觉”问题,通过图注意力学习和强化学习动态调整检索文档顺序,并细化文档表示,显著提升在知识密集型任务上的性能,且对不同检索器和语言模型具有良好适应性。
RAG
检索
大型语言模型
2024-07-30
2024-07-30
Transformer
图解 transformer——逐层介绍
文章总结了Transformer模型的整体架构及关键组件,包括词嵌入层、位置编码、编码器堆栈(含多头注意力和前馈层)、解码器堆栈(含两个多头注意力和前馈层)、输出层(线性层和Softmax层)。深入解释了注意力机制(自注意力和编码器-解码器注意力)及多头注意力的重要性,并介绍了注意力掩码在编码器和解码器中的应用。最后,描述了模型如何生成输出,包括通过线性层和Softmax层将解码器输出转换为概率分布,并使用交叉熵损失函数进行训练。
Transformer
大模型
图解
2024-07-29
2024-07-29
Ollama 与 Dify:AI 应用开发的强强联合
Ollama和Dify是两个开源项目,分别用于本地部署LLM和AI应用开发管理。Ollama提供本地推理框架简化LLM部署,Dify则提供AI应用开发、管理和部署的全套工具。结合使用这两个工具,开发人员可以快速开发、部署和优化AI应用,如问答系统,并通过Dify进行性能监控和优化。
Ollama
Dify
大型语言模型
2024-07-29
2024-07-29
开源
30 多年前被 Windows、Linux “灭掉”的操作系统 MS-DOS 4.0,微软在 GitHub 上开源了!
微软与IBM决定将36年前的MS-DOS 4.0版本开源,并在GitHub上发布源代码、二进制文件等,供学习研究。此举得益于前微软CTO Ray Ozzie和研究员Connor Hyde的推动。MS-DOS 4.0曾在历史上引起争议,虽功能增强但兼容性不佳。如今开源引发操作系统爱好者的关注,仓库已获大量Star和Fork。此前微软已开源过MS-DOS其他版本。
MS-DOS
4.0
开源模型
微软
2024-07-29
2024-07-29
大模型
京沪“中国大模型第一城”争夺战爆发|钛媒体·封面
北京和上海在AI大模型领域竞争激烈,两地分别发布超过115个和33个大模型产品,预计到2025年AI产业总规模将达7000亿元。北京注重基础研究和原始创新,上海则聚焦算力和应用落地。两地政府均出台多项扶持政策,吸引企业入驻并加大投资。京沪在AI大模型领域的竞争将围绕资金、人才、算力等方面展开,谁将赢得“中国大模型第一城”尚待观察。
大模型
钛媒体
2024-07-26
2024-07-26
Fastwhisper + Pyannote 实现 ASR + 说话者识别
文章介绍了使用faster-whisper和pyannote.audio结合实现语者识别的技术流程,包括两者工具简介、代码实现及注意事项。faster-whisper是Whisper模型的快速推理实现,适用于多语言ASR。pyannote.audio是扬声器分割和识别的开源工具包。文章展示了将两者结合进行语者识别的步骤和代码示例,并提醒了网络问题、模型加载问题及解决方案,包括离线加载模型和替换模型来源的建议。
faster-whisper
语者识别
ASR
2024-07-26
2024-07-26
ChatGPT
ChatGPT 的对话框过时了?这款 AI 产品提供了一种很新的聊天方式
文章介绍了Flowith这款新型AI内容生成工具,它通过类似在线白板的动态画布形式,将ChatGPT等聊天式AI的线性交互转变为更直观、灵活和具有创造力的画布式交互。Flowith支持多种模式,如思维导图发散、自动决策、联网搜索和生成图片等,适用于不同场景。其动态UI和节点概念使内容生成和思维发散更加直观和高效,同时支持团队协作。文章还讨论了画布式AI与聊天式AI的互补关系,强调创新交互方式对人类思维和AI应用的重要性。Flowith作为初出茅庐的产品,虽有不成熟之处,但展现了AI在内容生成和工作流优化方面的潜力。
ChatGPT
聊天
2024-07-26
2024-07-26
Flowith:革新你的工作方式,体验节点式 AI 的超流畅生产力
Flowith是基于GPT的AI生产力工具,采用节点式交互方式,支持多AI模型选择、文件分析、智能体市场、图像生成、跨终端适配、智能体创建和插件系统。适用于研究、专业、内容创作、学习、企业和技术开发等多个领域,可提升工作效率和创作多样性。
Flowith
GPT
生产力工具
2024-07-25
2024-07-25
Ollama最新更新v0.1.33,实现了多并发可同时与多个模型聊天对话!
Ollama v0.1.33版本更新增强了本地部署的大型语言模型(LLMs)功能,支持多用户并发交互,提升了协作效率。新版本引入了多个新模型,包括Llama 3、Phi 3 Mini等,并修复了API挂起、内存溢出等问题。新增的并发特性允许同时处理多个请求和加载多个模型,通过设置环境变量实现,已在Windows 11和Linux系统上提供设置指南。这一更新显著提升了内网环境下多用户与模型交互的效率。
ollama
语言大模型
聊天
2024-07-25
2024-07-25
开源
Github2.1万星!开发者的“瑞士军刀” 开源!
DevToys是一款专为开发者设计的多功能实用工具集,集合了JSON格式化、文本比较、正则测试等常用功能,支持跨平台,旨在提高编程效率。该工具集在github上广受好评,包含文本、编码、转换、图像、网络等多种类型的实用工具,通过统一的界面减少开发者在不同工具间切换的需要,是开发者的得力助手。
DevToys
工具集
开源
2024-07-24
2024-07-24
开源
17K star!30秒偷走你的声音,开源声音克隆工具
OpenVoice是由openshell开源的一款先进的声音克隆工具,仅需30秒音频样本即可克隆独特音色,并支持多语言、精细控制音色参数。提供在线服务和本地部署选项,目标用户为开发者和研究人员。虽非完美产品,但代表了开源语音克隆技术的最新进展。
OpenVoice
声音克隆
开源
2024-07-24
2024-07-24
开源
9.4k Star!MemGPT:伯克利大学最新开源、将LLM作为操作系统、无限上下文记忆、服务化部署自定义Agent
MemGPT是一个新项目,它允许大型语言模型(如GPT-4)处理比原生更长的上下文窗口,从而提升在复杂任务中的性能。MemGPT通过分层内存系统使LLM能管理自己的内存,并通过特殊函数调用将数据在主上下文和外部上下文之间移动。该技术基于操作系统管理内存的原理,分为“主要上下文”和“外部上下文”,允许模型处理更大数据集和更长对话,并保持交互一致性。MemGPT还提供了与其他开源模型及多Agent框架的整合能力,并通过开发者门户简化创建、编辑和监视LLM代理的过程。
MemGPT
大语言模型
2024-07-24
2024-07-24
Nvidia发布Llama3-ChatQA-1.5: 提升对话问答和表格推理能力,平均性能超越GPT-4
Nvidia推出Llama3-ChatQA-1.5,一款超越GPT-4的对话问答模型,融合会话式问答和表格推理能力,通过高质量数据训练,无需ChatGPT合成数据,检索增强能力强大,小尺寸高性能,适合边缘设备部署,将支撑未来对话式AI应用。模型可在Huggingface和AI快站下载。
Llama3-ChatQA-1.5
对话问答模型
2024-07-23
2024-07-23
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100