首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· LangChain Agent 原理解析
· 无需翻墙,可合法使用的8款国内AI大模型产品
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· SD入门教程零:应用场景
· 教会AI画汉字(ComfyUI篇)
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
训练魔法
大模型
宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家
中国广核集团福建宁德核电有限公司发布了专为核工业领域打造的大语言模型「锦书」,参数规模达720亿,旨在解决核电行业知识管理、低脑力劳动过多、安全分析能力不足等问题。该模型拥有全球最大核工业预训练语料库,开发了多项创新应用,如智能培训系统、个人岗位晋升系统等,显著提升了工作效率并降低了人力成本。项目负责人表示,「锦书」不仅推动了核电行业的数智化转型,也为AI在其他工业领域的应用提供了重要借鉴。
宁德核电
大模型
2024-10-17
2024-10-17
使用 Dify 和 Moonshot API 构建你的 AI 工作流(一):让不 AI 的应用 AI 化
Dify 团队推出了包含 AI Workflow 新功能的 v0.6.0[2],这个功能虽然从去年年底就在做了,但是因为功能复杂,代码变更量巨大,直至今天 v0.6.4[3] 正式发布,才算进入一个相对稳定期,所以适合写一篇新的文章来聊聊啦。
Dify
Moonshot
API
工作流
2024-10-17
2024-10-17
开源
世界上最流行(github排名高)的开源移动机器人的操作系统ROS开源了!!
TurtleBot3是一款小型、低成本、完全可编程的移动机器人,它基于ROS(Robot Operating System)开发,并继承了TurtleBot系列的优秀特性。作为TurtleBot系列的第三代产品,TurtleBot3在二代的基础之上做了一些改进,并增加了一些新功能以满足用户的需求。 这款机器人的主要特点包括开源ROS软件、硬件开源、小尺寸、低价格、模块化驱动以及强大的扩展性。它配备了强悍的传感器,如激光雷达和摄像头,使其具有自主导航、避障、物体识别等功能。此外,TurtleBot3还支持语音识别和语音合成技术,可以与人进行自然语言交互,完成特定任务。 TurtleBot3的目标是在不牺牲功能和质量的情况下,大幅缩小平台的大小和降低价格。它提供了多种定制化的选择,包括不同的底盘、计算机和传感器,以满足用户多样化的需求。同时,它还支持搭载机械手,如OpenManipulator,以扩展其应用范围。 在教育领域,TurtleBot3可以作为一个优秀的教学平台,帮助学生更好地理解和学习机器人技术。对于研究人员来说,它可以作为一个灵活的研究工具,用于测试新的算法和技术。此外,由于其低成本和可扩展性,TurtleBot3还非常适合作为产品原型开发的平台。 总的来说,TurtleBot3是一款功能强大、灵活多变的移动机器人,适用于教育、研究、产品原型和爱好应用等多种场景。
ROS
机器人
开源模型
2024-10-16
2024-10-16
所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用
AlphaFold 3在Nature发表,能以前所未有的精度预测所有生命分子的结构和相互作用,包括蛋白质、DNA、RNA等,通过去噪扩散模型直接生成原子3D坐标,预测准确度大幅提升,成为全球首个超越基于真实结构预测的工具。DeepMind宣布科学家可免费使用AlphaFold 3进行非商业研究,但其商业化途径通过Isomorphic Labs进行。尽管AlphaFold 3有诸多突破,仍存在局限性和错误,但其展示了用深度学习建模复杂生命系统组件相互作用的潜力。
AlphaFold
3
蛋白
预测
2024-10-15
2024-10-15
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
上海交大开源的F5-TTS,一款基于流匹配的全非自回归文本到语音转换系统,以其高效、自然和多语言支持的优势脱颖而出,接近商用水平。其技术亮点包括全非自回归架构、流匹配技术、Diffusion Transformer应用、Sway Sampling策略、简化的训练流程及高性能多语言支持。项目链接已提供。
F5-TTS
音频克隆
2024-10-15
2024-10-15
开源
微软最新模型Phi-3 Mini开源登场!小模型,大未来!!
微软推出开源AI模型Phi-3 Mini,性能超越Llama-3 8B,擅长语言理解、逻辑推理等,且体积小、成本低,便于本地部署和运行。用户可通过LM Studio平台下载并免费使用,确保数据安全。同时提供ChatGPT 4.0和3.5的在线使用链接。
Phi-3
Mini
人工智能
2024-10-14
2024-10-14
Agent
为什么大佬都在说Agent是未来?换个角度来谈一谈
文章指出AI领域看好Agent为未来最具潜力方向,通过“旅游”需求案例说明LLM、RAG、Agent的能力边界:LLM和RAG主要生成内容,Agent则能端到端完成任务。Agent不仅生成内容,还利用工具完成用户任务,满足更完整需求。随着Agent能力提升,将打破现有平衡,带来人与机器竞争,但也孕育巨大机会,可能催生新商业模式,改变社会生活。
Agent
大模型
2024-10-14
2024-10-14
开源
星标破万!小钢炮2.6登顶GitHub,Hugging Face TOP3, 燃爆开源社区!
MiniCPM-V 2.6作为面壁智能多模态大模型的最新成果,以8B参数在单图、多图及视频理解上全面超越主流商用模型,支持多模态理解和实时视频处理,具备高效推理和强大OCR能力,支持多种语言,成为端侧模型的新标杆。其发布后迅速登顶GitHub和HuggingFace趋势榜,引发全球开发者关注与测试,展现出广泛的应用潜力和未来前景。
MiniCPM-V
2.6
大模型
2024-10-11
2024-10-11
大模型
大模型:泛化即智能,压缩即一切!
本文总结了关于机器学习泛化能力的思考,强调了通过大量多样化数据训练高容量模型的重要性。文章将泛化能力比作孔子的“举一反十”,并指出监督学习是优秀的数据海绵,能记住大量数据,通过低训练误差保证对新数据的低预测误差。过度参数化的模型即使训练损失为零也能继续降低风险,表现出更好的泛化能力。无监督学习通过分布匹配学习数据内在结构,类似于压缩过程,实现对数据的深层理解和泛化。文章还讨论了涌现现象,即模型在长时间训练后突然展现出的复杂行为,表明模型学到了数据的数学结构。最后,文章认为追求长期的模型泛化能力比短期微调更重要,并希望这一原则能启发解决其他挑战性问题的思路。
泛化
大模型
2024-10-10
2024-10-10
AI撬开小县城的万元商机
AI技术正快速下沉至四五线城市及县城,带来教育、医疗等多领域革新,并催生AI电商、AI广告、AI自习室等新型商业模式,为下沉市场创造丰富商业机会。AI技术的普及降低了使用门槛,结合当地需求,吸引大厂布局并推动商业化进程。尽管面临认知度和适配性挑战,AI在下沉市场的应用前景广阔,有望改变用户生活方式,为企业和创业者带来新机遇。
AI
商机
2024-10-10
2024-10-10
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
本文介绍了TTS(文本转语音)技术的发展,从早期依赖预录制声音样本到现今基于AI的深度神经网络模型。随后,列举了多个好用且免费的文本转语音工具,包括TTS Maker、微软Azure、PaddleSpeech、VoiceVox、TensorFlowTTS、TTSKit、OpenTTS和eSpeak NG,并简要介绍了它们的特点、使用方式及官方网站或GitHub链接。
TTS
Maker
语音
2024-10-09
2024-10-09
开源
GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
AIPC是微软提出的集成AI于电脑的概念,screenpipe是其部分开源实现,已完全开源并广受欢迎。ScreenPipe全天监控电脑屏幕和麦克风,用户掌控数据,支持搜索和自动化处理。用Rust开发,有灵活插件系统,可协同Ollama等工具。功能包括每日摘要、会议纪要、安全监控等,确保隐私安全。适用于开发个性化AI应用的开发者。
AIPC
ScreenPipe
开源
2024-10-09
2024-10-09
RAG
高级 RAG 技术——图解概览
检索增强生成(RAG)通过结合从数据源检索到的信息,为大语言模型(大语言模型)生成的回答提供依据。简而言之,RAG 结合了搜索和大语言模型提示功能,即在模型回答问题时,以搜索算法发现的信息作为上下文环境。这里,查询请求和检索到的上下文同时被注入发送至大语言模型的提示中。
RAG
检索
图解
2024-10-08
2024-10-08
大模型
Openai 异步客户端接入国产大模型 Kimi
Moonshot AI开发的人工智能助手Kimi Chat具备强大的长文本处理能力,支持长达20万字的上下文处理,提升对话连贯性和准确性。其API设计兼容OpenAI,便于开发者迁移和接入。Moonshot开放平台为新用户赠送API调用额度。文章还介绍了适合大模型调用的webman/openai异步非阻塞客户端,通过流式和非流式返回实现高效的大模型对话功能。
Kimi
Chat
大模型
2024-10-08
2024-10-08
RAG
RAT = CoT + RAG
Retrieval Augmented Thoughts (RAT) 是一种结合协同思维链和检索增强生成的 AI 策略,旨在解决 LLM 在长任务推理中的事实准确性问题,通过迭代修正模型推理步骤,提升输出准确性,广泛适用于代码生成、数学推理、创意写作和任务规划,为 AI 推理能力设定新标准。
RAT
协同思维链
检索增强生成
2024-09-29
2024-09-29
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100