首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
语
音
助理和远程语
音
助理:数字人可以作为语
音
助理,进行语
音
交互,提供信息查询、日程管理等辅助任务。
Fay
开源项目
数字人
OpenAI
来自OpenAI应用研究主管关于Agent的万字长文-AI Agents介绍
该论文假设,任何生成一系列学习历史数据的算法都可以通过对动作执行
克
隆
行为来蒸馏成神经网络。
Agent
Sora
中学生也能看懂的Sora视频生成原理解读
具体到Sora的实现,这个过程开始于一段与目标视频同样时长、但是内容完全是随机噪
声
的视频。
视频生成
sora
Agent
【万字长文】全球AI Agent大盘点,大语言模型创业一定要参考的60个AI智能体
6月的一次全体员工会议上,扎
克
伯格宣布了一系列处于不同开发阶段的技术,其中一个就是将带来具有不同个性和能力的AI Agents为用户提供帮助或娱乐。
大语言模型
教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程 #1/2 使用模型
原始
声
音
处理 要使用模型进行推理的话你首先需要一段已经演唱好的
声
音
垫进去,然后使用模型把原来的
音
色换成你模型训练好的
音
色(类似AI画图的img2img垫图)。
生成式AI
比尔盖茨最新预言:AI智能体颠覆计算机交互体验甚至软件行业
例如,Abridge、Nuance DAX和Nabla Copilot可以在预约期间捕获
音
频,然后写下笔记供医生查看。
AI智能体
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
多模态(Multi-Modal): 多模态主要是指让机器能够理解和处理自然界或人工定义的多种模态信息,如
声
音
、语言、视觉信息和表格、点云信息等。
开源
LLM
基于LLM+向量库的文档对话痛点及解决方案
痛点:文档切分粒度不好把控,既担心噪
声
太多又担心语义信息丢失 笔者之前采用了Longchain的文档切分工具,发现不能问题。
开源模型
目前大语言模型的评测基准有哪些?
ChatbotArena:借鉴游戏排位赛机制,让人类对模型两两评价 ChatbotArena是一个大型语言模型 (LLM) 的基准平台,该项目方LMSYS Org是由加州大学伯
克
利分校、加州大学圣地亚哥分校和卡内基梅
隆
大学合作创立的研究组织
人工智能评测
大模型
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
2303.17580.pdf HuggingGPT是近期非常火热的Agents方向的一个代表,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于文生图、图生文、语
音
转文字
提示词
prompt
开源
搞了一个Dify开源知识库
Workflow:打造你的智能工作流 · 初衷:也是在机缘巧合下,感谢MAX和众多大佬的呼
声
支持下
Dify
大模型
知识库
开源
来个优秀的开源人脸识别项目!
通过计算机与光学、
声
学、生物传感器和生物统计学原理等高科技手段的密切结合,将人体固有的生理特征或行为特征收集起来,进行取样、数字化处理和分析。
人脸识别
开源项目
打磨 8 个月、功能全面升级,Milvus 2.3.0 文字发布会现在开始!
具体来看:Milvus 2.3.0 不仅包含大量的社区呼
声
很高的新功能,还带来了诸如 GPU 支持、Query 架构升级、更强的负载均衡调度能力、新的消息队列、Arm版本镜像、可观测性、
大语言模型
ChatGPT
ChatGPT羊驼家族全沦陷!CMU博士击破LLM护栏,人类毁灭计划脱口而出
作者介绍 卡内基梅
隆
大学教授Zico Kolter(右)和博士生Andy Zou是研究人员之一 Andy Zou Andy Zou是CMU计算机科学系的一名一年级博士生,导师是Zico
开源模型
ComfyUI
ComfyUI的特性以及安装流程
手动安装(Windows、Linux)
克
隆
此存储库。
ComfyUI
文生图
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100