训练魔法-AI魔法学院

训练魔法

开发语音产品时设计唤醒词和命令词的技巧

文章总结了在设计中文、英文和日文语音产品的唤醒词与命令词时，应遵循的原则和最佳实践。包括控制字词长度、提升音节区分度、选择发音清晰且不易误唤醒的词汇、符合用户语言习惯等，以提高语音识别效果并减少误唤醒。不同语言在细节上有所差异，但总体策略相似。

语音产品唤醒词命令词 2024-08-23

微软Phi-3、Mixtral 8x22B等小模型过拟合，三分之二存在数据污染

研究揭示，三分之二的大型语言模型（LLM）存在过拟合问题，主要由于基准测试数据污染。Scale AI通过人工注释创建了GSM1k数据集，测试多个热门LLM，发现许多模型在GSM1k上的表现显著下降，特别是Phi和Mistral系列，显示出系统性过拟合。但前沿模型如Gemini、GPT、Claude和Llama2系列过拟合迹象较少。GSM1k数据集未公开，以防数据污染问题，并计划定期评估主要LLM。研究还指出，过拟合模型仍具推理能力，且数据污染可能不是过拟合的唯一原因。

过拟合小模型 2024-08-22

微软最新模型Phi-3 Mini开源登场！小模型，大未来！

微软推出小型AI模型Phi-3 Mini，性能超越Llama-3 8B，成为新标杆。该模型开源免费，拥有38亿参数和3.3万亿tokens，在多项测试中表现卓越，支持4k和128k tokens上下文长度，便于本地部署，成本仅为同类模型十分之一。用户可通过LM Studio平台下载并运行Phi-3 Mini，实现高效且安全的AI交互体验。

Phi-3 Mini 开源模型微软 2024-08-22

微信为什么使用 SQLite 保存聊天记录!

SQLite常被低估但实则可靠，支持TB级数据但无网络层。本文总结SQLite 2018年新增SQL功能，包括布尔字面量与判断、窗口函数、Filter子句、Insert…on conflict（“Upsert”）、重命名列等，强调SQLite在SQL方言上的强大与现代化特性，同时指出其特有功能如“Upsert”和列重命名非标准SQL部分。

SQLite 微信数据库 2024-08-22

一位芯片投资人的十年复盘：谁是中国的英伟达｜AI光年

“现在中国的创投市场，硬件赛道的融资机会肯定要比软件好。”耀途资本合伙人杨光告诉《AI光年》。杨光在国内已有十年半导体投资经验。2015年，杨光和前同事白宗义一起创立了耀途资本，布局半导体领域围绕消费电子、汽车电子、数据中心与云计算等应用场景，投资了壁仞科技、瀚博半导体、爱芯元智、云豹智能、Hailo、Vayyar和星宸科技（301536）等企业。耀途最近的一次投资是袁进辉的新项目硅基流动（SiliconFlow)。“虽然硅基流动核心是软件，但所处的赛道属于大模型基础设施层，我们也关注生成式AI基础设施变化带来的机会。”与第一次和王慧文合作创业对标OpenAI不同，袁进辉此次创业选择做大模型时代的AI基础设施（AI Infra），降低大模型应用成本和开发门槛。

AI光年芯片投资 2024-08-22

震撼科技界：清华大学与智谱AI联手，引领中文长文智能写作新纪元！

在人工智能的广阔天地中，大型语言模型（LLM）已经证明了它们在多个任务上的卓越能力。然而，它们在创作长篇文本方面似乎遭遇了难以突破的障碍。不过，一项由清华大学携手智谱AI所取得的突破性进展，为这一难题提供了新的解决方案。这项被命名为"LongWriter"的成果，将AI在长文本生成方面的能力显著提升，从2000字一举扩展至超过10000字，同时确保了内容的高质量输出。这一进步得益于创新的数据构建技术、独到的模型训练方法以及严谨的评估流程，为AI在长篇文本创作领域的应用开辟了新天地。

写作长文本 2024-08-20

RAG 2.0来了，它能成为生产落地的福音吗？

RAG 2.0由RAG系统发明者发布，通过预训练、微调和对齐所有组件为单个集成系统，优化语言模型和检索器性能，克服传统分阶段优化局限，显著提升系统整体性能。基准测试显示，RAG 2.0在开放域问答、忠实度、新颖度及长上下文处理上均优于传统RAG系统，为生产级AI应用开发提供新思路。

RAG 大模型 2024-08-20

应用编排的未来是Pipeline，LlamaIndex开发预览版推出Query Pipeline，提升应用开发的灵活性

文章总结了应用程序从流程编排到灵活Pipeline的发展，特别在大模型AI时代，Pipeline成为构建AI应用的关键载体。介绍了FlowEngine和llamaindex的QueryPipeline，强调声明式Pipeline的灵活性和模块化优势，使AI应用开发更加简单、低门槛。展示了如何通过QueryPipeline构建复杂流程，并介绍了运行Pipeline及可视化流程的方法。

Query Pipeline 大模型 2024-08-20

中国首个长时长、高一致性、高动态性视频大模型，Vidu 登场

在中关村论坛，生数科技与清华大学发布中国首个长时长、高一致性、高动态性视频大模型「Vidu」，采用原创U-ViT架构，支持生成16秒1080P高清视频，具备模拟真实与多镜头生成能力，标志着在视频大模型领域的重大突破。

Vidu 大模型视频 2024-08-20

一键部署本地私人专属知识库，开源免费！可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型，零代码集成。

本文介绍了如何在本地搭建MarxKB知识共享系统，该系统支持多种大语言模型，零代码集成，便于个人和小白用户快速上手。通过Docker部署，用户可添加笔记、文档等至本地知识库，并利用大语言模型实现实时搜索与问答。文中详细讲解了Docker安装、MarxKB镜像下载与容器创建步骤，以及如何在MarxKB中创建知识库、配置并关联本地大语言模型（如ollama的llama3），最终构建一个本地文档问答系统。

知识库MaxKB 开源 2024-08-19

白话Embedding：普通人都能懂的科普文

嵌入是将数据对象表示为高维向量，通过编码其属性为向量的几何属性来存储有用信息。这些向量可用于计算距离和角度，从而揭示数据间的相似性和差异性。嵌入模型通过神经网络训练，将高维数据转换为低维向量，以简化分析和应用。嵌入技术广泛应用于图像分类、人脸识别、文本与图像联合分析等领域，是现代AI和机器学习的重要工具。

Embedding 向量 2024-08-19

AIGC工具提示词技巧

文章介绍了提示词在AI创作中的重要性、写法框架、应用范例及编写技巧，并推荐了一些好用的AI工具。提示词需清晰、结构化，包括正向和反向提示词，用于指导AI生成图像、视频等。不同行业和专业人士需掌握专业词汇以提高输出质量。文章还通过示例展示了如何应用提示词进行创作，并推荐了如通义听悟、Suno、Runway等实用的AI工具。

AIGC 提示词 2024-08-19

【手把手带你微调 Llama3】改变大模型的自我认知，单卡就能训

本文介绍了如何微调Llama3模型以使其具备自我认知，通过修改模型回答如“你叫什么名字？”等问题的输出为“我是AI在手”。文章详细步骤包括环境搭建、数据集准备、模型下载、XTuner配置文件设置、模型训练、模型合并以及最终推理验证。此外，还提到了未来计划调整XTuner训练模板以支持英语对话的自我认知微调。

Llama3 对话问答模型 2024-08-19

最强国产开源多模态大模型MiniCPM-V：可识别图片、视频，还可在端侧部署

MiniCPM-V是面向图文理解的端侧多模态大模型系列。该系列模型接受图像和文本输入，并提供高质量的文本输出。

minicpm 面壁 2024-08-06

保姆级教程：Coze 打工你躺平

文章介绍了Coze（扣子），一个由字节推出的下一代AI聊天机器人构建平台。用户无需编写代码即可轻松创建机器人，用于写文章、找资料、画插图等任务。文章通过三个步骤展示了如何使用Coze：首先创建一个基础机器人，然后通过设置回复逻辑使其能够处理特定任务，最后将机器人发布到飞书，实现AI辅助工作的场景。此外，还介绍了如何使用工作流和代码进一步优化机器人的表现。文章强调Coze是当前AI辅助工作的最佳解决方案，并预告了后续将结合Coze API和飞书特性进行更深入的教学。

Coze 教程 2024-08-02

<...5 6 7 8910 11 12 13 14 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1