首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Stable Diffusion|背景替换只需要两分钟!
· 一文看懂RAG:大语言模型落地应用的未来
· 国内厂商语音识别与Whisper评测:现状与概况对比
· Stable Diffusion 加速/优化/升级 优化出图速度
· 说真的,学会用SD做电商图,你才是真的入了门
· 第3期 SDXL和SD的10大区别!你知道几个?
· Midjourney AI 绘画美女提示词分享一
· ComfyUI-基础图生图&基础图片缩放
· 一文汇总市面上所有prompts提示词框架
· OCR的终极解法——传统算法VS多模态大模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
腾讯
腾讯的 PhotoMaker - 更快 更像 更可控的 AI Avatar
腾讯的PhotoMaker是一种高效的文本到图像生成技术,能生成逼真的个性化人类照片。它利用堆叠ID嵌入方式编码任意数量的输入ID图像,保留ID信息,并能灵活适应不同文本提示。该方法能够将艺术人物带入现实、实现风格化、改变年龄性别以及混合身份等,同时保持高质量和高效推理,展现出强大的身份保真度和灵活性。
PhotoMaker
文生图
2024-05-15
2024-05-15
大模型
如何构建基于大模型的App
文章概括了基于大模型开发业务应用的现状、挑战和策略。文章指出,虽然并非所有组织都需要训练大模型,但基于大模型开发业务应用已成为趋势。文章强调了理解大模型的能力边界、利用LLM进行语言理解和处理、推理、审查、文本转换等任务的重要性。同时,提出了利用模型微调和上下文注入来回答LLM无法知道的问题的方法。文章还指出了基于大模型API构建应用所面临的问题,如响应不可预测、与目标应用数据和用例不相关等,并提出了构建基于大模型应用的系统架构的思考,包括应用编排器、任务计划器、上下文和记忆型数据的向量存储、提示和响应管理器、效果评估器以及大模型管理器等组件。最后,文章给出了一个构建基于大模型应用的简单示例,并总结了利用大模型为业务赋能的挑战和策略。
构建
大模型App
2024-05-15
2024-05-15
ChatGPT
使用ChatGPT写出优质长文、文章
本文介绍了在ChatGPT协助下,如何快速完成不同类型的文章创作,包括长文、网络文章、爆款推广软文、改写文章以及文章总结。具体技巧包括使用特定指令来引导ChatGPT进行创作,如设定主题、设计章节标题、撰写引言和具体内容等。此外,还提供了关于文章创作的一些建议,如构建详尽的框架、注重文章深度和流畅性、采用对话式语调等。遵循这些技巧和建议,可快速生成高质量的文章。
ChatGPT
写作
2024-05-15
2024-05-15
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
香港大学、阿里巴巴和蚂蚁集团合作开发的Anydoor技术,为图片编辑带来了革命性的改变。该技术能让任何物品通过一张照片被无缝传送到另一张图片中,并自动调整姿态和站位。Anydoor采用独特的对象传送方法,以高度保真和多样化的方式将目标对象与背景场景融合,适用于图像合成、效果渲染、海报制作和虚拟试穿等场景。其核心思想是利用目标对象的身份和细节特征,通过预训练的扩散模型生成所需图像。实验结果表明,Anydoor在保真度和多样性方面均表现出显著优势,为图片编辑带来了更多可能性和便利性。
Anydoor
文生图
2024-05-15
2024-05-15
爬虫
主流网络爬虫蜘蛛详解
文章简洁精练的总结如下: 文章介绍了网络爬虫的概念,强调区分真伪蜘蛛并了解各种蜘蛛的重要性,以避免不必要的资源浪费。文中列举了多个主流搜索引擎和工具的爬虫,包括Googlebot、Bingbot、Baiduspider、Bytespider等,并提供了它们的识别特征和UA(用户代理)字符串。同时,文章也介绍了如何根据实际需要,通过robots.txt文件屏蔽不必要的爬虫,以及针对特定搜索引擎优化网站的方法。此外,文章还提供了爬虫特征字符串的汇总整理版,方便程序员直接使用。整体而言,文章旨在帮助网站管理员更好地管理和优化网站,提高网站在搜索引擎中的表现。
爬虫蜘蛛
详解
2024-05-15
2024-05-15
大模型
腾讯开源混元AI绘画大模型
腾讯开源了其AI绘画大模型——混元大模型,该模型具有中文原生和多轮对话的特点。测试结果显示,其性能在某些方面超越了其他模型,但硬件门槛较高。文章提供了详细的安装和使用指南,包括依赖关系、环境设置、模型下载以及推理方式等,以方便创作者使用和优化该模型。
腾讯
混元
文生图
2024-05-15
2024-05-15
大模型
中文原生文生图大模型来了!腾讯混元推出,Sora 同架构
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。
文生图
混元
腾讯
2024-05-14
2024-05-14
开源
构建开源多模态RAG系统
本文深入探讨了使用开源大型语言多模态(LLMM)技术构建检索增强型生成(RAG)系统的过程,而不依赖于特定的框架如LangChain或Llama索引。文章首先介绍了RAG系统的核心概念,即通过允许模型从外部来源动态检索实时信息来增强AI的理解和输出能力。然后,解释了多模态学习的意义,即通过教导计算机理解和学习不同类型的信息(如图像、文本或语音)来做出更好的预测。 接着,文章提出了一个构建RAG管道的方案,其中涉及使用CLIP嵌入图像和文本,并将这些数据存储在ChromDB向量数据库中。最后,利用Hugging Face的MLLM根据检索到的信息参与用户聊天会话。作为示例,文章描述了一个创建花专家聊天机器人的过程,包括数据预处理、创建向量数据库以及使用多模态嵌入函数进行检索。 该方案通过整合不同的模态和嵌入技术,提高了AI模型在处理复杂和多样化数据时的准确性和可靠性。此外,RAG系统通过减少幻觉和增加透明度,提高了AI决策的可信度和可解释性。这种经济高效的方法为改进AI输出提供了一种新的途径,而无需进行广泛的重新训练或微调。 综上所述,本文介绍了一种利用开源技术和多模态学习构建高效RAG系统的方法,该方法具有增强AI理解和输出能力、提高准确性和可靠性、减少幻觉和增加透明度等优点,为AI应用的发展提供了新的思路。
RAG
大模型
2024-05-13
2024-05-13
阿里
淘宝模特全体注意!阿里AnyDoor AI换装神器出来了,年度最强AIGC重制绘图工具,重塑电商模特产业
AI绘图在电商行业应用广泛,特别是AI模特换衣。阿里和港大推出的AnyDoor工具实现了一键换衣,操作简便且效果惊人。AnyDoor可自由转移图片元素,无需复杂指令,且开源易获取。使用AnyDoor需确保设备显存足够,并遵循一定步骤进行换装操作。AnyDoor换衣效果自然,但建议衣物简洁以保证最佳效果。该工具目前仍有提升空间,但已大大减轻电商美工工作负担,引领视觉革命。关注公众号可获取一键安装包,体验神奇技术革新。
AnyDoor
换装
文生图
2024-05-13
2024-05-13
Prompt
掌握Prompt的6心法
本文介绍了Prompt的概念及其在人工智能系统中的应用。Prompt是一种类似命令或指示的东西,用于指导AI系统完成特定任务。文章还提供了六个撰写优秀Prompt的心法,包括不断尝试和迭代优化、使用结构化的Prompt模板、加入防御性指示、提供示例、给予AI思考时间和将复杂问题分解为简单问题等。学会写Prompt能最大限度发挥人工智能的能力,创造更多价值。
prompt
写作
2024-05-13
2024-05-13
大模型
大模型训练工程那些事
本文围绕大模型训练工程进行了深入探讨,将其与历史上的曼哈顿计划相提并论,凸显了其在当代科技领域的重要性。文章从技术原理、数据算力与资源、时间计划等方面,分析了大模型训练工程的复杂性和挑战性。在技术原理方面,文章介绍了Scaling Laws等科学原理在指导大模型训练中的应用。在数据、算力和资源方面,文章揭示了数据规模、模型规模和计算资源对AI模型性能的影响,并讨论了算力租赁、国产替代等当前面临的问题。在时间计划方面,文章预测了大模型训练迭代和应用的紧迫性,并强调了资源规划和差异化能力的重要性。 总结来说,本文认为大模型训练工程是一项集科技、人力、资源和时间于一体的复杂系统工程,其发展和应用将对社会产生深远影响。文章呼吁产业界和学术界共同努力,推动大模型技术的发展和应用,为产业变革和社会进步贡献力量。
训练工程
大模型
2024-05-13
2024-05-13
Prompt
如何看待大型语言模型的Prompt
本文回顾了Word2Vec中的词语算术现象,并探讨了大型语言模型(LLMs)与Word2Vec之间的相似之处。文章指出,两者都将标记(单词或子词)嵌入到向量空间中,并通过优化目标将相关标记在嵌入空间中拉近。LLMs通过自注意力机制学习嵌入空间,并展现了语义连续性和可插值性。此外,文章强调了LLMs在向量程序方面的强大能力,能够执行复杂的转换任务。最后,文章指出LLMs可以视为程序数据库,并通过提示工程在程序空间中搜索最佳程序。文章提醒读者理解LLMs时应避免拟人化倾向。
prompt
大语言模型
2024-05-13
2024-05-13
腾讯
腾讯最新的人像写真工作PhotoMaker
本文介绍了腾讯git上的一个新项目,该项目能利用少量真人照片、绘画或雕塑形象生成写实人像图片,甚至可融合两张图片的长相。项目使用了多种技术,如填充图像背景、微调模型参数提取脸部特征、融合文本和图像embedding等。此外,还介绍了摄影师训练的工作流。该项目相较于其他类似项目有更大改进,值得期待。
PhotoMaker
文生图
2024-05-13
2024-05-13
开源
令人惊艳的开源图标生成AI模型:ChartLlama (南洋理&腾讯)
ChartLlama是一个由南洋理工大学和腾讯联合开发的开源多模态语言模型,能够理解和生成各种类型的图表,如柱状图、饼图等。它通过自然语言交互,无需复杂语法或编程,即可根据指令分析或创建图表。ChartLlama通过巧妙的多元化数据收集策略生成多样化、高质量的指令调整数据,并在多个评估基准中表现优异。现已开源,可访问指定地址下载体验。
ChartLlama
开源模型
图标
2024-05-13
2024-05-13
爬虫
强大高效的微信爬虫Wechat_Articles_Spider:快速获取公众号文章的利器
wechat_articles_spider是一个用于爬取微信公众号文章的Python工具,具备自动化、多线程、可定制化和数据持久化等特点。用户可安装后通过导入模块进行使用,它可应用于数据分析、媒体监测和学术研究等场景。但需注意遵守法律法规和网站规则,避免滥用。
微信爬虫
2024-05-13
2024-05-13
<
...
16
17
18
19
20
21
22
23
24
25
...
>
1
2
4
5
6
7
8
9
100