首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· SD入门教程六:ControlNet基础入门
· 大语言模型的拐杖——RLHF基于人类反馈的强化学习
· 【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
· Stable Diffusion使用Roop插件一键换脸教程
· 10秒换脸,一张图片够了!SD Roop插件教程
· 九个让你成为GPT提示高手的提示词框架
· 大规模中文开源数据集发布!2TB、几十亿条可商用的中文数据集书生·万卷 1.0开源~中文大模型能力可能要更上一层楼了!
· AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动态提示词)
· 会“追问”的Agent,大模型知识库另类实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
GGUF格式详解
在大模型领域,GGUF是一个非常常见的词语,也是非常常见的大模型预训练结果命名方式。很多模型模型,如Yi-34B、Llama2-70B等模型都有对应的GGUF版本,这些版本都模型除了文件名多了GGUF外,其它与原有的模型名称完全一致。那么,GGUF大模型文件格式是什么意思?为什么会有这样的大模型文件,与它一同出现对比的是GGML格式文件,二者的区别是啥?
GGUF
大模型
2024-07-19
2024-07-19
大模型
ollama本地部署自然语言大模型
本文介绍了如何在本地运行大模型,特别推荐使用ollama工具,无需编写代码。测试环境为i5 8400、16G内存和1060 6G显卡。通过下载和安装ollama,用户能够方便地在本地运行大模型,并使用Chatbox作为桌面程序简化模型调用。文章还提供了ollama和Chatbox的下载地址,以及修改模型默认安装位置的方法。此外,还列出了多种可下载的大模型及其安装命令,包括gemma:2b等,并指出了运行不同规模模型所需的最低内存要求。最后,文章还介绍了通过命令行与模型进行交互的方法。
ollama
语言大模型
部署
2024-07-19
2024-07-19
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
本文探讨了生成型人工智能(AI)在前端开发自动化方面的进展,尤其是多模态大型语言模型(LLMs)将视觉设计直接转换为代码实现的能力。通过斯坦福和谷歌等机构的研究,提出了Design2Code任务,并构建了包含484个真实世界网页的基准测试集。测试结果显示,GPT-4V在将设计转换为代码方面表现优异,能在49%的案例中替代原始参考网页,并在64%的案例中被认为设计得更好。研究还揭示了多模态提示方法和微调模型的有效性,为未来自动化前端工程和改进网站设计工具的研究提供了方向。同时,也强调了隐私和双重使用问题的重要性,并建议制定明确的伦理使用指南。
设计转代码
大模型
2024-07-17
2024-07-17
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
阿里推出的EMO项目可使静态人像照片与音频结合生成动态视频,实现了口型同步和人物自然动作。用户可通过通义千问免费体验,但当前版本限制多,如必须使用官方模板、不支持自定义音频、图片要求严格且生成时间长。尽管视频质量较高,但EMO的定制化有限,主要考虑因素包括视频质量、风控、版权和算力消耗。目前,EMO更多作为尝鲜产品,未来需改进才能应用于更广泛场景。
EMO
阿里
全民演唱
2024-07-17
2024-07-17
Google
Google 模型解读 | MoveNet-SinglePose:自底向上做单人姿态估计
MoveNet是Google推出的轻量化单人姿态估计模型,采用bottom-up范式,集成了MobileNetv2和FPN等经典结构,具备快速下采样、残差连接和参数集中等特性。其独特之处在于Head部分包含四个预测头,分别用于检测中心点、回归关节点坐标、检测关键点以及预测偏移值,以消除量化误差。后处理流程通过加权方法选取最相关的关键点,并利用Offset Regression减少误差。MoveNet在特定数据集上表现出色,与top-down模型相当,且经过工程优化加速推理速度。此外,Google还推出了多人姿态估计版本的MoveNet-MultiPose,但变动较大且精度不理想。
MoveNet-SinglePose
Google
模型
2024-07-17
2024-07-17
Deepseek-V2技术报告解读!全网最细!
Deepseek发布了v2版本模型,沿用Deepseek-MoE技术,采用小专家建模与多优化策略。该模型完全开源并支持商用,提供了低成本的API调用方案。v2模型在MMLU上取得第二名,超越V1版本,并显著提升成本效率与推理速度。其核心优化在于多头隐式注意力(MLA),旨在减少显存占用,同时保持模型效果。模型架构包含60层,采用RMSNorm和SiLU激活函数,并通过对话数据进行对齐训练。工程上,v2通过流水线并行和专家并行策略,结合资源感知专家负载均衡方法,实现了训练效率的最优。模型在基座能力和指令遵循能力上表现强劲,得益于数据优化和训练策略的深度整合。
Deepseek-V2
大模型
2024-07-17
2024-07-17
腾讯
AI助手App“腾讯元宝”已上线应用商店
腾讯元宝是一款基于腾讯混元大模型的AI产品,已在部分安卓应用商店上架,但尚未在苹果App Store上线。它支持中英文输入与理解,并允许用户创建个性化智能体,提供AI搜索、解析、写作和多种实用应用功能,旨在提升用户在办公、学习、创作和生活等领域的效率与体验。
腾讯元宝
2024-07-16
2024-07-16
Agent
Coze多智能体(Multi-Agents)模式体验!
文章简要介绍了Coze平台更新的多智能体(Multi-Agents)功能,包括其定义、与单智能体的区别,以及通过实际案例展示如何创建和配置多智能体。文章还提到了著名且开创性的多智能体研究或项目,并提供了体验Coze多智能体的链接和步骤,涵盖了从确定应用场景、构建公司架构到创建、配置、调试和发布多智能体的整个过程。
Coze
多智能体
2024-07-16
2024-07-16
AIGC
AIGC系列之一-一文理解什么是Embedding嵌入技术
文章介绍了嵌入技术(Embedding)的基本概念、原理及其在人工智能与图形计算(AIGC)和实际应用场景中的应用。Embedding是一种将高维数据映射到低维空间的技术,广泛应用于机器学习和自然语言处理中,通过训练得到的Embedding向量可以更准确地表示数据的内在含义。文章列举了Word2Vec、GloVe、FastText等几种常见的Embedding模型,并解释了它们的工作原理和优势。此外,还阐述了Embedding的降维、捕捉语义信息、适应性、泛化能力和可解释性等价值。在应用场景方面,文章指出Embedding在文本分类、推荐系统以及AIGC等领域具有广泛的应用,特别是在处理隐私风险和长文本任务时,通过内容向量化存储在向量数据库中,能有效提升数据处理效率和准确性。
AIGC
Embedding
嵌入技术
2024-07-16
2024-07-16
工具
3.5k star!一款万能的 SQL 分析工具,厉害了!
dsq是一款强大的SQL分析工具,支持Excel、JSON、CSV等本地文件格式,使用标准SQL语法进行查询、分析和处理,功能全面且性能卓越,在GitHub上获得近3.5k星标。项目开源免费,安装简便,支持正则表达式、缓存、函数和脚本等高级功能,可通过命令行轻松使用,适用于各种数据处理场景。
dsq
开源项目
SQL
2024-07-16
2024-07-16
AI绘画:InstantID 一键运行包和在线Colab脚本!
InstantID是一个强大的AI绘画工具,支持一键生成多变图片。文章提供了两种使用方法:本地一键运行包和Colab脚本在线体验。本地运行需下载解压特定压缩包,并配置显卡等硬件;在线体验则需通过Github上的TonyColab项目,在Colab平台上使用A100 GPU进行创作,无需配置,出图速度快且稳定性高。
InstantID
文生图
2024-07-15
2024-07-15
RAG
24年首篇离奇论文:加点噪声,RAG效果翻倍?!
本文探讨了基于检索增强的语言模型(RAG)系统中信息检索组件对性能的影响。研究发现,包括不相关文档反而能提高系统准确性,强调整合检索与生成模型的重要性。通过密集检索和基于语言模型的生成器,RAG框架解决了复杂查询问题,实验表明,正确放置无关文档能提高准确率,为优化RAG系统提供了新见解。该研究为进一步发展信息检索技术以适应生成组件提供了基础。
RAG
检索
论文
2024-07-15
2024-07-15
【AI代理】扣子,开始探索多代理模式
文章总结: 代理模式可增强大模型功能并规避其弱点。多代理模式则通过分配任务给多个机器人或模型,实现更精细化和准确化的处理。扣子智能体系统已上线多代理模式,并允许通过角色设定和全局跳转条件等方式优化用户体验和任务处理。多代理模式在丰富场景和精细化处理上展现出巨大潜力。
多代理模式
大模型
2024-07-15
2024-07-15
【AI代理】多代理模式之多任务分配&信息传递
文章总结了通过代理模式探索多任务分配和代理间信息传递的过程。设置了四个角色代理,包括一个总代理和三个负责不同任务的代理(刘备、关羽、张飞)。通过任务分配和代理间信息传递,模拟了群体会话场景,展示了无信息依赖和有信息依赖的多任务处理。强调了代理模式在模型差异化情况下的优势,并探讨了专用模型调优的可能性。
多任务模式
分配
传递
2024-07-15
2024-07-15
大模型
最佳开源文生图大模型可图:安装与批量出图的完整教程
Kolors是快手Kolors团队开发的文本到图像生成模型,具备高质量图像、精准语义和出色的中英文文本渲染能力。其开源特性及ComfyUI插件支持,使其在图像生成领域表现突出。Kolors在专家测评中满意度和画面质量均领先,并超越了MidJourney-v6。安装Kolors需满足特定软硬件要求,并涉及多个步骤,包括源码下载、依赖安装、模型权重下载和推理测试。目前,Kolors支持中英文输入,并能生成含中文的图片。
可图
kolors
2024-07-12
2024-07-12
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100