首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
训练魔法
Sora
Sora物理悖谬的几何解释
本文分析了Sora视频生成模型的技术路线和缺陷。Sora声称是“作为世界模拟的视频生成模型”,但其技术路线无法正确模拟世界的物理规律。文章指出,Sora存在以下几个问题: 1. 用概率统计的相关性无法精确表达物理定律的因果性。虽然Sora将视频分解成时空令牌并学习它们之间的连接概率,但这种相关性无法精确表达物理定律的因果性。因此,在生成视频时,Sora无法准确模拟物理过程的因果关系,导致生成的视频在某些情况下出现悖谬。 2. Sora缺乏全局观念。虽然Transformer可以学习临近时空令牌间的连接概率,但无法判断全局的合理性。这导致Sora生成的视频在局部上可能很合理,但在整体上却可能出现荒谬的情况。文章指出,这种全局观念可能来自于物理中的重力场、人体工程学或生物学等深层次的自然科学和人文科学背景,而目前的Transformer还无法真正悟出这些全局观点。 3. Sora忽略了物理过程中最为关键的临界(灾变)态。由于临界态样本的稀缺以及扩散模型将稳恒态数据流形的边界模糊化,Sora无法生成临界态的视频。这导致Sora生成的视频在某些情况下出现稳恒态之间的跳跃,而缺乏物理过程中最为关键的临界态。文章提出,基于几何方法的最优传输理论框架可以精确检测到稳恒态数据流形的边界,从而强调了临界态事件的生成,避免了不同稳恒态之间的横跳。 综上所述,虽然Sora在视频生成方面取得了一定的成果,但其技术路线存在缺陷,无法精确模拟物理规律。文章呼吁年轻的读者们积极投身于这个伟大的转折点,用自己的聪明才智推动科技与社会的发展。同时,文章也提出了基于几何方法的最优传输理论框架作为一种可能的解决方案,以克服Sora等数据驱动世界模拟模型的缺陷。
Sora
解释
2024-05-07
2024-05-07
大模型
大模型检索增强生成(RAG)高质量报告
同济大学Haofen Wang的报告《Retrieval-Augmented Generation (RAG): Paradigms, Technologies, and Trends》探讨了检索增强生成(RAG)在优化大语言模型性能中的应用。RAG通过检索相关信息辅助大模型回答,相比微调,RAG更具灵活性。报告介绍了Naive RAG、进阶RAG和模块化RAG三类方法,并探讨了RAG发展中涉及的数据索引优化、结构化语料库、知识图谱等技术。报告还总结了RAG的有效性评价、常用框架和工业应用,并指出了RAG的三大趋势、存在的挑战及未来发展方向。
RAG
大模型
检索
2024-05-07
2024-05-07
大模型
大模型能力评估体系
本文介绍了大模型技术的快速发展及其在各领域的广泛应用。随着模型规模的扩大,对其性能和能力的评测需求也日益增长。然而,当前的评测存在多样性和不一致性,导致不同榜单的排名结果存在显著差异。为了建立公正和全面的评测体系,一些机构采取了过程公开的评测方法,并涉及多个维度如通用能力、泛化能力、鲁棒性等。文章还介绍了多个广泛认可的大模型评测体系,如GLUE、SuperGLUE、GSM8K等,并展望了未来的评测方向,包括设计更全面的评测方法、动态评测和混合评测方法。同时,文章强调了在构建大模型时需要明确目标,并定义了通用、行业、企业和个人层面的评测体系及其目标。
大模型
评估
2024-05-07
2024-05-07
Stable Diffusion
Stable Diffusion 30种采样器全解!
本文介绍了StableDiffusion中的30种采样器,按照出场时间分为经典采样器、DPM采样器和新增采样器。其中,经典采样器包括oLMS、oLMS Karras、oHeun、oEuler、oEuler a、oDDIM和oPLMS,它们中的Euler和Euler a是常用的采样器。DPM采样器包括二代算法和一代算法,其中DPM++2M Karras和DPM++3M SDE Karras是推荐的采样器。新增采样器包括UniPC和Restart。文章还解释了采样器名字中的含义,并提供了在WebUI中设置只保留实用采样器的方法。
Stable
Diffusion采样器
2024-05-07
2024-05-07
强!推荐一款自动化神器Autolt:不再重复工作!
本文介绍了AutoIt这款老牌实用的自动化工具,可帮助用户告别繁琐的重复性工作,提高工作效率。AutoIt是一款类似BASIC脚本语言,完全免费用于自动化Windows操作系统的脚本语言和工具集,具有语法简单易懂、功能强大、易于上手等特点。它可广泛应用于自动化测试、系统管理、软件部署等领域,并支持与其他自动化工具结合使用。文章还提供了AutoIt的安装、使用方法和实用示例,以及将脚本文件转换为可执行文件的方法。总之,AutoIt是一个非常有用的自动化工具,可以帮助用户自动化执行各种任务,提高工作效率。
Autolt
自动化
2024-05-06
2024-05-06
大模型
百川智能RAG方案总结:搜索出生的百川智能大模型RAG爬坑之路
百川智能通过结合长上下文模型(192k)和搜索增强技术,解决了知识更新和模型幻觉的问题,实现了在5000万tokens数据集中95%的精度。主要优化包括:1) Query拓展,拆解复杂问题以提高检索质量;2) 优化检索链路,采用稀疏检索、向量检索和Rerank结合的方法提高召回率和准确率;3) 自我反省机制,通过大模型自省筛选优质内容。此外,文章还讨论了当前RAG方法的痛点以及百川的技术栈和效果。总体来说,这种结合长窗口与搜索的RAG方案可能是当前较好的一种方式,但仍需考虑成本问题。
RAG
大模型
2024-05-06
2024-05-06
Stable Diffusion
Stable Diffusion 30种采样器全解
本文介绍了StableDiffusion中的30种采样器,分为经典采样器、DPM采样器和新增采样器三类。经典采样器中Euler和Euler a是常用的,但Euler a生成的图像具有随机性。DPM采样器中大部分是DPM算法,其中DPM++2M Karras和DPM++3M SDE Karras等被推荐。新增采样器有UniPC和Restart等。文章还解释了采样器名字中的含义,如Karras是优化算法,2M代表二阶多步算法,SDE代表随机微分方程等。最后提醒用户在WebUI中设置只保留实用的采样器。
Stable
Diffusion
采样器
2024-05-06
2024-05-06
Docker介绍及常用命令大全
Docker中的三个重要构成:Image(镜像),Container(容器),Repository(仓储)。Image相当于OOP中的类,Container相对于类实例,Repository是存放位置。
Docker
容器
2024-05-05
2024-05-05
工具
全球六大主流自动PPT制作工具
本文介绍了全球流行的AI做PPT工具,包括Decktopus、Gamma、Beautiful.ai、MindShow、Powerpresent.ai和Tome。这些工具可以自动或辅助生成PPT,提高效率,注重美观和实用性,适合不同需求的用户。用户可以根据个人喜好和需求选择合适的工具来制作演示文稿。
自动PPT
工具
2024-04-30
2024-04-30
提示词
零门槛的 4 大 AI 提示词法则,让你的 AI 助手秒变效率神器
本文介绍了如何使用AI提示词来更有效地与AI助手交流,解决AI使用不顺畅和个性化需求难以满足的问题。文章提供了四大基本法则来构建优质的AI提示词,包括给AI分配“岗位”和“待办事项”、拒绝笼统、提供示例和让AI用对“语气”。这些法则能帮助用户更好地指导AI完成任务,并输出符合期望的内容。此外,文章还提供了小技巧和建议,如如何与AI交流以获取提示词建议,以及推荐了一些免费的优质教程供深入学习。
提示词
大模型
2024-04-30
2024-04-30
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
Sora,一款由 OpenAI 在 2024 年 2 月推出的创新性文转视频生成式 AI 模型,能够依据文字说明,创作出既真实又富有想象力的场景视频,展现了其在模拟现实世界方面的巨大潜能。本文基于公开技术文档和逆向工程分析,全面审视了 Sora 背后的技术背景、应用场景、当前面临的挑战以及文转视频 AI 技术的未来发展方向。文章首先回顾了 Sora 的开发历程,探索了支撑这一“数字世界构建者”的关键技术。接着,我们详细探讨了 Sora 在电影制作、教育、市场营销等多个领域内的应用潜力及其可能带来的影响。文章还深入讨论了为实现 Sora 的广泛应用需克服的主要挑战,例如保证视频生成的安全性和公正性。最后,我们展望了 Sora 乃至整个视频生成模型技术未来的发展趋势,以及这些技术进步如何开创人机互动的新方式,进而提升视频创作的效率和创新性。
Sora
微软
2024-04-30
2024-04-30
提示词
震撼!AI语言模型突破瓶颈,26个提示词原则引领GPT-4响应质量飙升57.7%!你的模型还在等什么?
本文探讨了大型语言模型(LLMs)如GPT-4在自然语言处理领域的强大能力,并强调了优化提示词对于提高模型响应质量和准确性的重要性。文章介绍了26个优化提示原则,包括提示结构与清晰度、具体性与信息、用户交互与参与、内容与语言风格以及复杂任务与编码提示等方面。这些原则旨在帮助用户更有效地与LLMs进行交互,提升模型的输出效果。实验验证显示,仅通过优化提示词,就能显著提高模型的响应质量和准确性,尤其是在大型模型上效果更为显著。文章最后提到,这些原则就像是给LLMs装上了翅膀,让它们在AI的天空中飞得更高、更远。
语言模型
提示词
GPT-4
2024-04-30
2024-04-30
大模型
大模型套壳祛魅:质疑套壳,理解套壳
本文讨论了大模型套壳的问题,指出套壳一词在行业内存在不同的理解。文章从大模型的训练过程入手,分析了模型架构、预训练、微调等阶段中可能存在的套壳场景,并强调了在不同场景中,套壳行为应被视为正常的商业行为。同时,文章也指出了套壳行为可能带来的问题,如缺乏核心竞争力、数据隐私等。因此,文章呼吁行业应更加理性客观地看待套壳问题,把焦点放在如何降低成本、提高模型性能等关键问题上,以推动大模型应用的发展。
大模型
套壳
2024-04-30
2024-04-30
数字人
Threejs: 数字人生成金色动态粒子效果
本文介绍了生成金色动态粒子人的代码,包括顶点着色器和片元着色器的代码,这些代码可以模拟亚运会的数字人效果。动画功能使用了gsap的插件,粒子效果主要用的是glsl代码。文章提供了源码地址,并出自微信公众号。
Threejs
数字人
2024-04-29
2024-04-29
开源
来个优秀的开源人脸识别项目!
本文介绍了生物识别技术,包括指纹识别、虹膜识别、声音识别、掌纹识别、静脉识别以及人脸识别等多种技术,这些技术利用人体自身特征进行身份认证。同时,文章还介绍了一个开源的人脸识别项目——InsightFace,它基于PyTorch和MXNet,支持2D和3D人脸识别,以及人脸关键点检测等功能,是一个强大的人脸识别分析工具,适用于人脸识别研究、人脸姿态估计、动画生成等领域。
人脸识别
开源项目
2024-04-29
2024-04-29
<
...
11
12
13
14
15
16
17
18
19
20
...
>
1
2
4
5
6
7
8
9
100