首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· SD入门教程六:ControlNet基础入门
· 大语言模型的拐杖——RLHF基于人类反馈的强化学习
· 【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
· Stable Diffusion使用Roop插件一键换脸教程
· 10秒换脸,一张图片够了!SD Roop插件教程
· 九个让你成为GPT提示高手的提示词框架
· 大规模中文开源数据集发布!2TB、几十亿条可商用的中文数据集书生·万卷 1.0开源~中文大模型能力可能要更上一层楼了!
· AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动态提示词)
· 会“追问”的Agent,大模型知识库另类实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
前半年,我看到的有趣的 AI 产品
昨晚我们和 AI 产品经理黄钊做了一次直播,聊了聊近半年的 AI 产品趋势。今天这篇文章是我对直播内容的总结,其中部分观点来源于黄钊。希望对你有启发。
AI工具
2024-07-24
2024-07-24
开源
Github2.1万星!开发者的“瑞士军刀” 开源!
DevToys是一款专为开发者设计的多功能实用工具集,集合了JSON格式化、文本比较、正则测试等常用功能,支持跨平台,旨在提高编程效率。该工具集在github上广受好评,包含文本、编码、转换、图像、网络等多种类型的实用工具,通过统一的界面减少开发者在不同工具间切换的需要,是开发者的得力助手。
DevToys
工具集
开源
2024-07-24
2024-07-24
Prompt
80多个罕见的论文prompt,让你起飞!
先进的人工智能功能,已经成为许多人的游戏规则改变者。本文中列出的提示是为了优化您与这个强大工具的交互而精心设计的。通过利用它们,您不仅可以简化您的写作过程,还可以提高您的研究和见解的质量。
prompt
提示词
论文
2024-07-24
2024-07-24
开源
17K star!30秒偷走你的声音,开源声音克隆工具
OpenVoice是由openshell开源的一款先进的声音克隆工具,仅需30秒音频样本即可克隆独特音色,并支持多语言、精细控制音色参数。提供在线服务和本地部署选项,目标用户为开发者和研究人员。虽非完美产品,但代表了开源语音克隆技术的最新进展。
OpenVoice
声音克隆
开源
2024-07-24
2024-07-24
开源
9.4k Star!MemGPT:伯克利大学最新开源、将LLM作为操作系统、无限上下文记忆、服务化部署自定义Agent
MemGPT是一个新项目,它允许大型语言模型(如GPT-4)处理比原生更长的上下文窗口,从而提升在复杂任务中的性能。MemGPT通过分层内存系统使LLM能管理自己的内存,并通过特殊函数调用将数据在主上下文和外部上下文之间移动。该技术基于操作系统管理内存的原理,分为“主要上下文”和“外部上下文”,允许模型处理更大数据集和更长对话,并保持交互一致性。MemGPT还提供了与其他开源模型及多Agent框架的整合能力,并通过开发者门户简化创建、编辑和监视LLM代理的过程。
MemGPT
大语言模型
2024-07-24
2024-07-24
Nvidia发布Llama3-ChatQA-1.5: 提升对话问答和表格推理能力,平均性能超越GPT-4
Nvidia推出Llama3-ChatQA-1.5,一款超越GPT-4的对话问答模型,融合会话式问答和表格推理能力,通过高质量数据训练,无需ChatGPT合成数据,检索增强能力强大,小尺寸高性能,适合边缘设备部署,将支撑未来对话式AI应用。模型可在Huggingface和AI快站下载。
Llama3-ChatQA-1.5
对话问答模型
2024-07-23
2024-07-23
Fooocus更新了2.3
fooocus更新至2.3版本,加入lightning模型、图片保存格式切换、通配符设置、数据保存选项、提示词反推及元数据功能,并优化了预设设置,使操作更便捷。推荐使用老河插件,可通过B站链接下载。
fooocus
文生图
2024-07-23
2024-07-23
提示词
Anthropic推出提示词生成器让AI秒懂你的需求!
Anthropic公司推出了一款提示词生成器,通过高级提示工程技术帮助AI更精准地理解并执行用户指令,提高AI响应的精确度和可靠性。用户只需描述需求,系统即可生成优化提示,并支持微调及与其他AI模型兼容,广泛应用于各种AI平台和服务,提升工作效率,展现AI在复杂任务处理上的巨大潜力。
Anthropic
提示词
生成器
2024-07-23
2024-07-23
阿里
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
文章概述:文章介绍了一个名为EMO的AI视频项目,该项目来自阿里通义实验室,允许用户通过上传人物正面大头照和选择音频片段,生成具有自然表情和头部运动的视频。该功能在通义App上受到欢迎,用户可以通过“全民舞台”功能体验。EMO采用弱控制设计,不强制建模整个面部,而是通过面部定位器和速度编码器等控制机制实现自然流畅的生成效果。项目负责人薄列峰表示,技术开源前需解决安全问题,并透露未来计划将EMO扩展到半身、全身,并可能引入新架构。同时,EMO背后团队专注于数字人研究,通过奶牛猫跳舞等动物主题激发用户兴趣,强调高质量AIGC内容的重要性。最后,文章推荐了EMO的一个私房玩法,即使用自己不同年龄段的照片进行合唱。
音频
阿里
2024-07-23
2024-07-23
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
本文介绍了一个基于LiveKit WebRTC的代理框架,用于构建实时、可编程的服务器端参与者,能够处理或生成音频、视频和数据流。该框架包括多种插件,如语音转文本(STT)和文本转语音(TTS)等,与LiveKit服务器无缝集成,无需额外排队基础设施。当前处于开发者预览模式,API可能变动。代理通过pip安装,并可通过CLI接口运行,支持加入特定的聊天室。此外,提供了一个名为“playground”的Web前端用于简化代理的构建和测试。框架允许工作线程管理多个代理实例,并通过SIGTERM信号安全地终止工作线程。特定插件可能需要下载模型文件以使用。项目源码位于GitHub上。
voice
agent
开源
音视频
2024-07-22
2024-07-22
工具
AI文本转语音工具(TTS):MeloTTS
MeloTTS是款开源文本转语音工具,支持多语言及口音转换,可调整语速,声音自然流畅,项目及体验地址已给出。
MeloTTS
语音工具
2024-07-22
2024-07-22
开源
【开源看AI】4.2K star!Reor:AI自动帮你发现知识之间的连接
文章介绍了Reor,一个旨在通过AI自动连接笔记、增强推理能力的开源个人知识管理工具。Reor不仅支持自动连接相关笔记,还能通过智能聊天回答关于笔记的问题,并生成AI闪卡帮助记忆。它强调本地运行模型以保护用户数据隐私,适用于学生、研究人员等需要高效管理个人知识的用户。文章还探讨了Reor与Quivr等其他工具的整合潜力,以形成完整的个人知识管理系统。
Reor
开源工具
知识管理
2024-07-22
2024-07-22
阿里
[论文] 阿里提出AgentScope:灵活强大的智能体框架
随着科技的飞速发展,人工智能(AI)已经成为我们生活中不可或缺的一部分。从智能家居到自动驾驶汽车,AI正在逐渐渗透到各个领域,展现出其巨大的潜力和价值。然而,与此同时,AI也带来了一系列挑战,如就业岗位的减少、隐私安全等问题。我们该如何平衡AI带来的利弊,让科技真正为人类服务?
AgentScope
语言大模型
智能体
2024-07-22
2024-07-22
ComfyUI
扣子更新图像流功能,字节版 ComfyUI 来了!
本文介绍了ComfyUI的“字节版”图像流,一个通过可视化方式组合图像获取、生成、编辑和发布功能的开源工作流工具。尽管刚上线不久即被下架,但短暂测试中展现了智能扩图、抠图、换脸等强大功能,并提供了丰富的模板供学习。官方计划5月15日全量上线,同时呼吁读者加入社群关注更新。此外,作者还提到对GPT-4o API的初步尝试,认为其功能与4v相近,未见特别惊艳之处。
ComfyUI
图像流
文生图
2024-07-19
2024-07-19
数字人
数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
本文介绍了GPT-SoVITS声音克隆项目,该项目支持零样本文本到语音(TTS)转换、少样本TTS微调、跨语言支持以及WebUI工具等功能。环境要求包括特定版本的Python、PyTorch和CUDA。项目提供了Windows一键安装包,并详细说明了声音克隆的训练过程,包括数据准备、人声分离、语音转文字、数据格式化和微调等步骤。通过实际训练并测试效果,显示了该项目在中英文环境下声音克隆的可行性和效果提升。最后提供了项目在GitHub上的地址。
数字人
声音克隆
GPT-SoVITS
2024-07-19
2024-07-19
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100