首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· SD入门教程六:ControlNet基础入门
· 分享使用SDXL 1.0模型的一些技巧和心得
· 国内厂商语音识别与Whisper评测:现状与概况对比
· RAG模型的主要痛点和解决方案
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 国内外开源大语言模型一览表
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
写不好Prompt?可以先写个粗糙版本,然后让GPT帮助优化。
本文介绍了如何优化Prompt以更好地与ChatGPT互动。首先,文章通过一个粗糙版本的Prompt示例展示了如何开始这一过程。接着,文章介绍了如何通过明确目标和可用资源来继续优化Prompt,使其更加具体和有效。此外,文章还提到了让GPT4向用户提问的方法,以进一步完善Prompt。最后,文章总结了有效Prompt编写的重要性,并鼓励读者通过实践来掌握和精进这项技能。
Prompt
GPT
2024-04-29
2024-04-29
数字人
最强开源数字人对口型系统介绍
本文介绍了开源的数字人克隆方法Easy-Wav2Lip,无需额外训练即可实现高清口型同步。相比其他开源方法,该方法具有更高的清晰度和更快的推理速度。提供了三种推理模型:原始模型、改进模型和增强模型。虽然增强模型推理速度较慢,但在非实时场景下仍具有应用价值。此外,文章还提供了一个在线服务网站,方便用户体验该代码。使用要求包括声音时长与视频时长等长、视频分辨率不超过1080P、帧率不超过30、音频为单人声、噪音降到最低、视频为单人露面视频且脸部清晰。
数字人
开源模型
2024-04-29
2024-04-29
芯片拼接技术:英伟达新核弹,站在苹果的肩膀上!
在2024年的GTC大会上,英伟达发布了新型GPU架构Blackwell和B200 GPU,该GPU的理论AI性能可达20PFLOPS,是前一代H100的五倍,晶体管规模也高达2080亿。不同于以往通过先进制程提升性能的方法,B200通过物理上将两块芯片“粘合”成一个更大的芯片来实现性能的提升。这种方案在物理学边缘进行了大胆的冲锋与冒险,虽然面临技术挑战和成本问题,但为芯片行业带来了新的思考方向。英伟达通过合作和技术研发,成功实现了这一创新,为未来的计算性能提升提供了新的路径。同时,文章也回顾了芯片封装技术的发展历程,以及苹果、台积电等公司在这一领域的探索和实践。最终,这种创新的封装技术为整个行业带来了新的机遇和挑战,推动了科技革命的进程。
芯片拼接技术
2024-04-29
2024-04-29
Stable Diffusion
Stable Diffusion高精度换脸
本文介绍了使用Stable Diffusion进行高精度换脸的操作流程,包括初版换脸、精修和高精度处理三个步骤,涉及参数设置、模型选择等,并强调了面部修复的重要性。文章还提供了具体的操作步骤和示例,展示了如何通过调整参数和模型实现高精度换脸。
Stable
Diffusion
文生图
2024-04-29
2024-04-29
ChatGPT
如何使用ChatGPT进行写作
本文介绍了如何使用ChatGPT进行内容创作,并提供了七个步骤来优化和训练ChatGPT以符合个人写作风格和需求。通过明确指导、提供示例和反馈,可以使ChatGPT产生高质量、个性化的内容。
ChatGPT
写作
2024-04-28
2024-04-28
RAG
如何提高RAG 的效果
本文探讨了如何提高RAG(Retrieval-Augmented Generation)的效果,包括参考信息主题的唯一性、预设多个Prompt模板、query改写、多种检索方式以及rerank等策略。文章强调了落地过程中细节问题的重要性,并提供了一些实践经验和解决方案。这些方法旨在帮助模型更好地利用参考信息,提高生成质量。
RAG
大模型
2024-04-28
2024-04-28
大模型
大模型在金融行业的应用场景
本文概述了大模型在金融行业中的应用场景,包括知识库/知识问答、智能客服、运营助手、风控、催收、信用评估、反欺诈、智能投顾、研发辅助和HR等。文章通过国内外实例展示了这些应用场景的具体应用和效果,如农业银行推出的ChatABC、摩根士丹利的知识问答系统、工商银行的智能客服等。这些应用不仅提高了金融业务的效率和准确性,还为客户提供了更个性化的服务。
大模型
金融
应用
2024-04-28
2024-04-28
将这些“阴谋诡计”喂给AI,使AI一天写一篇短篇小说
文章探讨了小说世界中的权谋策略,包括离间计、谋名诱敌、藏龙之际等十三种策略,旨在启迪思考并引导人们在生活中运用谋略之精华。这些策略不仅体现了智者的智慧,也考验了运用者的演技和策略布局能力。通过理解这些策略,人们可以更好地应对复杂的人际关系和竞争环境,从而在生活的棋局中更加从容地行走。文章鼓励人们与AI携手共创美好明天。
AI
写作
2024-04-28
2024-04-28
Stable Diffusion
Stable Diffusion真实人物转卡通证件照(2.0版)
本文介绍了如何使用Stable Diffusion中的dreamshaper_7模型和卡通证件照_v2.0模型,结合ControlNet插件,将真实人物照片转化为卡通证件照头像。通过三个实操案例,详细展示了所需模型和参数配置,如正向和反向提示词、迭代步数、采样方法等。
Stable
Diffusion
文生图
2024-04-28
2024-04-28
VividTalk:用一张照片和一段音频让人物栩栩如生地说话
VividTalk是南京大学、阿里巴巴、字节跳动和南开大学联合开发的前沿技术,能将单张照片和音频结合生成逼真的讲话视频。该技术通过音频到3D网格的映射和网格到视频的转换,实现了高质量的视觉效果和真实感。VividTalk在数字媒体制作、虚拟现实和人工智能等领域有广阔应用前景,为创造更丰富和互动的数字体验提供了新可能。
VividTalk
视频
2024-04-28
2024-04-28
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
本文介绍了OpenAI的Whisper的近乎实时实现项目——WhisperLive。该项目是一个实时转录应用程序,可以将语音输入转换为文本输出,支持实时音频输入和预录制的音频文件。WhisperLive使用语音活动检测(VAD)技术,仅在检测到语音时才发送音频数据,提高了转录输出的准确性和效率。用户可以通过安装PyAudio和ffmpeg,运行转录服务器和客户端程序,使用Whisper模型进行实时转录。此外,WhisperLive还支持多语言转录和翻译功能,用户可以通过设置选项来指定目标语言和任务。项目链接为https://github.com/collabora/WhisperLive。
OpenAI
Whisper
大模型
2024-04-28
2024-04-28
Stable Diffusion
Stable Diffusion插件:提示词
本文介绍了两个Stable Diffusion WebUI的提示词插件:sd-webui-prompt-all-in-one和SDWebUI Tag Autocomplete。前者提供书写提示词的辅助功能,如自动翻译和预置关键词;后者则具有自动完成提示词的能力,并支持翻译功能。文章还详细说明了这两个插件的安装和使用方法。
Stable
Diffusion
提示词
2024-04-28
2024-04-28
大模型
全量免费的EMO模型上架通义APP,外媒称之为Sora之后最受期待的大模型之一
本文介绍了阿里巴巴通义实验室研发的AI模型EMO,该模型能够让照片中的人物按照音频内容“张嘴”唱歌、说话,并且口型基本保持一致。EMO在两个月内被产品化并上线通义APP,成为全民免费可用的AI视频模型。该模型降低了人物视频的生成门槛,提升了生成质量,有望在视频制作、影视创作、电商直播等领域得到广泛应用。然而,随着EMO的普及,人们开始担心其可能被滥用,阿里云方面表示将采取措施确保内容安全并保护用户信息安全。文章还指出,AI大模型行业正在快速发展,通义APP有望成为一个包罗万象的工具铺,成为每位用户手中一个随叫随到的超级AI助手。阿里在大模型的C端入口上步伐最快,已经上线了众多免费功能。
EMO
阿里
全民演唱
2024-04-27
2024-04-27
教程
openpose原理及安装教程(姿态识别)
OpenPose是一个基于深度学习的开源库,用于实时多人姿态估计。它采用卷积神经网络(CNN)准确识别图像或视频中的人体关键点,包括头部、肩部、手肘等,进而生成完整的多人姿态估计结果。安装OpenPose需下载源代码或预编译版本,安装依赖库,使用CMake配置和生成项目文件,编译生成可执行文件或库文件,最后运行示例程序或集成到项目中。OpenPose具有多人姿态估计、多关键点检测、跨平台支持和开放源代码等优势,可用于精细的姿态分析。在GitHub上安装OpenPose需克隆代码库,下载并编译依赖库,配置和编译OpenPose,最后安装并运行。使用时需注意选择合适的硬件设备和参数配置以保证准确性和效率。
行为识别
姿态识别
2024-04-27
2024-04-27
实测:本地跑llama3:70B需要什么配置
文章介绍了开源大语言模型Llama 3 70B的能力达到了新的高度,可与顶级模型相媲美,并超过了某些GPT-4模型。文章强调了Llama 3的普及性,任何人都可以在本地部署,进行各种实验和研究。文章还提供了在本地PC上运行70B模型所需的资源信息,并展示了模型加载前后系统硬件占用情况的对比。最后,文章认为Llama 3 70B模型作为本地化Agent的底座模型非常适合,并预示着未来将有更多有趣的应用出现。
llama
GPU内存
2024-04-25
2024-04-25
<
...
16
17
18
19
20
21
22
23
24
25
...
>
1
2
4
5
6
7
8
9
100