首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· SD入门教程六:ControlNet基础入门
· 分享使用SDXL 1.0模型的一些技巧和心得
· 国内厂商语音识别与Whisper评测:现状与概况对比
· RAG模型的主要痛点和解决方案
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 国内外开源大语言模型一览表
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
模型压缩:量化、剪枝和蒸馏
本文介绍了针对预训练语言模型BERT的压缩方法,主要包括量化、剪枝和蒸馏等技术。BERT模型由于其庞大的参数规模和推理速度,使得其难以在算力受限的移动终端上部署。因此,对BERT模型进行压缩变得至关重要。 首先,文章对BERT模型的结构进行了深入分析,包括Embedding层、Linear层、Multi-Head Attention层和Feed Forward层等。通过对BERT模型的结构拆分,可以更深入地理解其各部分的功能和特性,为后续的压缩方法提供基础。 接下来,文章介绍了量化技术。量化是一种将模型权重参数用更少的比特数存储的方法,可以减少模型的存储空间和算力消耗。常见的量化方法包括均匀量化和均值聚类等。通过量化,可以将BERT模型的存储空间减少一半,同时运行速度也可以得到显著提升。 然后,文章介绍了剪枝技术。剪枝是通过去除模型参数中冗余或不重要的部分,以减小模型的存储空间和推理时间。对于BERT模型,剪枝可以分为元素剪枝和结构剪枝两类。元素剪枝通过置零较小的参数来减小存储空间,而结构剪枝则通过去除冗余的模型结构来精简模型。剪枝操作会对模型带来精度损失,但可以通过训练时剪枝和后剪枝等方法来缓解。 最后,文章介绍了蒸馏技术。蒸馏是一种基于教师-学生网络思想的训练方法,通过让一个小型的学生模型学习一个大型的教师模型的知识,从而实现模型的压缩。在BERT的蒸馏中,可以选择不同的蒸馏目标,如输出概率、隐层特征或Attention层等。蒸馏可以与量化和剪枝等技术结合使用,以达到更高的压缩比。 除了上述三种主要的压缩方法外,还有一些与模型结构强依赖的压缩方法,如参数共享、低秩分解和注意力解耦等。这些方法虽然不会改变模型的结构,但也可以在一定程度上减小模型的存储空间和推理时间。 总的来说,BERT模型的压缩是一个复杂而重要的任务。通过量化、剪枝和蒸馏等技术,可以在保证一定精度的前提下,实现对BERT模型的有效压缩,使其能够在算力受限的移动终端上顺利部署和运行。
BERT
语言模型
2024-05-08
2024-05-08
视频
绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,音乐、视频、图像、文件等!
文章介绍了AixDownloader这款万能的内容下载与管理工具,它能从各种网站轻松下载视频、音乐、图片等文件,并具有强大的下载管理功能。文章还详细说明了AixDownloader的使用方法和使用场景,以及它的优势和特点。总结来说,AixDownloader是一款功能强大、简单易用、完全免费的下载工具,适用于各种下载需求,是用户获取网络资源的得力助手。
AixDownloader
下载
2024-05-07
2024-05-07
一张照片秒生不同风格图像!小红书InstantID来了!
InstantID是一个图像生成工具,利用零样本学习技术从单张面部图像提取身份特征,生成高保真度、不同风格的个性化图像。该工具即插即用,兼容多种预训练模型,具有高效性和风格灵活性。用户可通过上传人物图片和输入文本提示,轻松定制个性化图像。使用InstantID,无需大量训练数据,即可实现精确的人物身份保持和多样化风格生成。
InstantID
文生图
2024-05-07
2024-05-07
Sora
Sora物理悖谬的几何解释
本文分析了Sora视频生成模型的技术路线和缺陷。Sora声称是“作为世界模拟的视频生成模型”,但其技术路线无法正确模拟世界的物理规律。文章指出,Sora存在以下几个问题: 1. 用概率统计的相关性无法精确表达物理定律的因果性。虽然Sora将视频分解成时空令牌并学习它们之间的连接概率,但这种相关性无法精确表达物理定律的因果性。因此,在生成视频时,Sora无法准确模拟物理过程的因果关系,导致生成的视频在某些情况下出现悖谬。 2. Sora缺乏全局观念。虽然Transformer可以学习临近时空令牌间的连接概率,但无法判断全局的合理性。这导致Sora生成的视频在局部上可能很合理,但在整体上却可能出现荒谬的情况。文章指出,这种全局观念可能来自于物理中的重力场、人体工程学或生物学等深层次的自然科学和人文科学背景,而目前的Transformer还无法真正悟出这些全局观点。 3. Sora忽略了物理过程中最为关键的临界(灾变)态。由于临界态样本的稀缺以及扩散模型将稳恒态数据流形的边界模糊化,Sora无法生成临界态的视频。这导致Sora生成的视频在某些情况下出现稳恒态之间的跳跃,而缺乏物理过程中最为关键的临界态。文章提出,基于几何方法的最优传输理论框架可以精确检测到稳恒态数据流形的边界,从而强调了临界态事件的生成,避免了不同稳恒态之间的横跳。 综上所述,虽然Sora在视频生成方面取得了一定的成果,但其技术路线存在缺陷,无法精确模拟物理规律。文章呼吁年轻的读者们积极投身于这个伟大的转折点,用自己的聪明才智推动科技与社会的发展。同时,文章也提出了基于几何方法的最优传输理论框架作为一种可能的解决方案,以克服Sora等数据驱动世界模拟模型的缺陷。
Sora
解释
2024-05-07
2024-05-07
大模型
大模型检索增强生成(RAG)高质量报告
同济大学Haofen Wang的报告《Retrieval-Augmented Generation (RAG): Paradigms, Technologies, and Trends》探讨了检索增强生成(RAG)在优化大语言模型性能中的应用。RAG通过检索相关信息辅助大模型回答,相比微调,RAG更具灵活性。报告介绍了Naive RAG、进阶RAG和模块化RAG三类方法,并探讨了RAG发展中涉及的数据索引优化、结构化语料库、知识图谱等技术。报告还总结了RAG的有效性评价、常用框架和工业应用,并指出了RAG的三大趋势、存在的挑战及未来发展方向。
RAG
大模型
检索
2024-05-07
2024-05-07
大模型
大模型能力评估体系
本文介绍了大模型技术的快速发展及其在各领域的广泛应用。随着模型规模的扩大,对其性能和能力的评测需求也日益增长。然而,当前的评测存在多样性和不一致性,导致不同榜单的排名结果存在显著差异。为了建立公正和全面的评测体系,一些机构采取了过程公开的评测方法,并涉及多个维度如通用能力、泛化能力、鲁棒性等。文章还介绍了多个广泛认可的大模型评测体系,如GLUE、SuperGLUE、GSM8K等,并展望了未来的评测方向,包括设计更全面的评测方法、动态评测和混合评测方法。同时,文章强调了在构建大模型时需要明确目标,并定义了通用、行业、企业和个人层面的评测体系及其目标。
大模型
评估
2024-05-07
2024-05-07
大模型
大模型能自己优化Prompt了,曾经那么火的提示工程要死了吗?
人类设计prompt的效率较低,效果也不如AI模型自己优化。随着ChatGPT等大型语言模型的上线,提示工程成为了一个热门领域。然而,新的研究表明,模型自己优化提示的效果最好,而非人类工程师。自动微调的提示技术成功且奇怪,一些工具可以自动生成最优的prompt,性能优于人工设计的prompt。因此,人类可能不再需要人工优化prompt,而是将这个任务交给算法。尽管如此,提示工程岗位可能仍会存在,因为将其产品化需要考虑许多因素,如可靠性、输出格式、测试、安全和合规等。目前这个领域处于早期阶段,变化很快,唯一确定的规则似乎就是没有规则。
prompt
大模型
提示
2024-05-07
2024-05-07
开源
爆火!腾讯开源PhotoMaker:高效地定制化生成任意风格的逼真人类照片!
本文介绍了一种名为PhotoMaker的高效个性化文本图像生成方法,该方法可以将任意数量的输入ID图像编码到堆叠ID嵌入中,以保留ID信息。通过引入面向ID的数据构建管道,PhotoMaker能够在训练过程中组装训练数据,从而提高了ID保存能力,同时提供了显著的速度改进、高质量的生成结果、强大的泛化能力以及广泛的应用。PhotoMaker在生成过程中保持了高效的效率,并且可以通过单个向前传递完成定制,同时保持了有希望的ID保真度和文本可控性。此外,PhotoMaker还可以混合多个输入ID,生成的图像可以很好地保留不同ID的特征,这为更多的应用释放了可能性。实验结果表明,PhotoMaker在生成高质量图像的同时,能够确保ID的高保真度,并且在不同语境下都具有很好的表现。最后,文章还提供了PhotoMaker的使用步骤和示例代码,方便读者进行尝试和使用。 总的来说,PhotoMaker是一种高效、灵活且实用的个性化文本图像生成方法,具有广泛的应用前景和潜在的应用价值。
PhotoMaker
文生图
2024-05-07
2024-05-07
Stable Diffusion
Stable Diffusion 30种采样器全解!
本文介绍了StableDiffusion中的30种采样器,按照出场时间分为经典采样器、DPM采样器和新增采样器。其中,经典采样器包括oLMS、oLMS Karras、oHeun、oEuler、oEuler a、oDDIM和oPLMS,它们中的Euler和Euler a是常用的采样器。DPM采样器包括二代算法和一代算法,其中DPM++2M Karras和DPM++3M SDE Karras是推荐的采样器。新增采样器包括UniPC和Restart。文章还解释了采样器名字中的含义,并提供了在WebUI中设置只保留实用采样器的方法。
Stable
Diffusion采样器
2024-05-07
2024-05-07
数字人
划重点!全网最全AI数字人工具合集!
文章介绍了五款AI数字人工具,包括HeyGen、Kreado Ai、Vidoz AI、腾讯智影和剪映数字人。这些工具可以帮助用户轻松创建具有逼真效果的数字人视频,满足不同场景的视频创作需求。文章强调了这些工具的易用性、多样性和高质量输出,并提供了相应的推荐指数。
AI
数字人
2024-05-06
2024-05-06
大模型
全球下载量最大的AI绘画大模型,更新Lightning极速版
文章介绍了Stable Diffusion大模型推出的两种提速技术Turbo和LCM,虽然能缩短出图时间,但存在明显的画质损失。随着字节跳动团队SDXL-Lightning大模型的发布,因其画质损失小,迅速被知名大模型跟进更新。文章强调了技术迭代对硬件资源的节约和缓解高端算力卡断供情况的重要性,并展示了多个使用大模型生成的图片示例。最后提供了下载链接和出处。
Stable
Diffusion
大模型
提示词
2024-05-06
2024-05-06
强!推荐一款自动化神器Autolt:不再重复工作!
本文介绍了AutoIt这款老牌实用的自动化工具,可帮助用户告别繁琐的重复性工作,提高工作效率。AutoIt是一款类似BASIC脚本语言,完全免费用于自动化Windows操作系统的脚本语言和工具集,具有语法简单易懂、功能强大、易于上手等特点。它可广泛应用于自动化测试、系统管理、软件部署等领域,并支持与其他自动化工具结合使用。文章还提供了AutoIt的安装、使用方法和实用示例,以及将脚本文件转换为可执行文件的方法。总之,AutoIt是一个非常有用的自动化工具,可以帮助用户自动化执行各种任务,提高工作效率。
Autolt
自动化
2024-05-06
2024-05-06
换脸
换脸软件 FaceFusion 保姆级教程
本文介绍了使用FaceFusion软件进行数字人换脸的操作过程。首先,为了避免侵权,客户提出了使用换脸软件将原素材的脸型进行替换的需求。接着,文章介绍了FaceFusion软件的特点和使用方法,包括其官网地址和运行环境要求。作者尝试了使用Colab进行免费算力运行,但由于源文件较大和算力不足,最终选择了租用AutoDL平台的算力。文章详细描述了租用算力的步骤和注意事项,包括充值、选择计费方式、地区、GPU型号等。在租用算力后,作者进行了FaceFusion的安装和运行,包括添加配置、安装依赖、下载模型等步骤。最后,文章介绍了如何通过本地SSH和外网两种方式访问FaceFusion的界面,并展示了换脸后的效果。在操作过程中,作者遇到了一些问题,如模型加载失败等,但通过重新下载模型等方式解决了问题。
FaceFusion
教程
2024-05-06
2024-05-06
ChatGPT
还在用“You are expert”这种提示词?连ChatGPT都瞧不起你,试试这些Prompt吧
本文讨论了ChatGPT在营销领域的应用,指出用户常误认为给ChatGPT加上“专家”前缀就能增强其功能,实际上这并没有任何作用。文章建议用户应明确查询的实质内容,利用权威来源并要求引用,检查AI的工作,并尝试让AI阐明分步计划、消除歧义、填补知识空白、回顾工作等策略,以获取更准确、可靠的输出。文章最后鼓励用户将ChatGPT视为协作伙伴,通过实践不断提升自身和AI的能力。
prompt
提示词
2024-05-06
2024-05-06
大模型
百川智能RAG方案总结:搜索出生的百川智能大模型RAG爬坑之路
百川智能通过结合长上下文模型(192k)和搜索增强技术,解决了知识更新和模型幻觉的问题,实现了在5000万tokens数据集中95%的精度。主要优化包括:1) Query拓展,拆解复杂问题以提高检索质量;2) 优化检索链路,采用稀疏检索、向量检索和Rerank结合的方法提高召回率和准确率;3) 自我反省机制,通过大模型自省筛选优质内容。此外,文章还讨论了当前RAG方法的痛点以及百川的技术栈和效果。总体来说,这种结合长窗口与搜索的RAG方案可能是当前较好的一种方式,但仍需考虑成本问题。
RAG
大模型
2024-05-06
2024-05-06
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100