首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
LLM
基于LLM+向量库的文档对话痛点及解决方案
痛点:文档切分粒度不好把控,既担心噪
声
太多又担心语义信息丢失 笔者之前采用了Longchain的文档切分工具,发现不能问题。
开源模型
Stable Diffusion
SD入门教程一:Stable Diffusion 基础(技术篇)
),顾名思义,它就是能预测出随机图里包含什么噪
音
的模型。
Stable
Diffusion
文生图
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
多模态(Multi-Modal): 多模态主要是指让机器能够理解和处理自然界或人工定义的多种模态信息,如
声
音
、语言、视觉信息和表格、点云信息等。
开源
教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程 #1/2 使用模型
原始
声
音
处理 要使用模型进行推理的话你首先需要一段已经演唱好的
声
音
垫进去,然后使用模型把原来的
音
色换成你模型训练好的
音
色(类似AI画图的img2img垫图)。
生成式AI
开源
来个优秀的开源人脸识别项目!
通过计算机与光学、
声
学、生物传感器和生物统计学原理等高科技手段的密切结合,将人体固有的生理特征或行为特征收集起来,进行取样、数字化处理和分析。
人脸识别
开源项目
Roop参数说明,ROOP->StyleGAN演示!
保留
音
轨(keep audio)
音
轨就是指视频的
声
音
,勾选这个参数就是保留原视频的
声
音
,大部分情况下,肯定是要选择启用。
视频
StyleGAN
开源
搞了一个Dify开源知识库
Workflow:打造你的智能工作流 · 初衷:也是在机缘巧合下,感谢MAX和众多大佬的呼
声
支持下
Dify
大模型
知识库
打磨 8 个月、功能全面升级,Milvus 2.3.0 文字发布会现在开始!
具体来看:Milvus 2.3.0 不仅包含大量的社区呼
声
很高的新功能,还带来了诸如 GPU 支持、Query 架构升级、更强的负载均衡调度能力、新的消息队列、Arm版本镜像、可观测性、
大语言模型
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
阿里AI黑科技大揭秘:包括通义千问大模型、AnyText、Animate Anyone、Replace Anything、Outfit Anyone、FaceChain、I2VGen-XL和Animate 3D Motion,展示了阿里在AI领域的强大实力和广泛应用
阿里云
视频
音频
数字人
最强开源数字人对口型系统介绍
使用的时候在这里面输入密钥,然后再上传一个
音
频和一个视频。
数字人
开源模型
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
24年的第一个月,智源就发布了新一代text embedding模型BGE M3-Embedding,该模型支持超过100种语言,能够接受不同形式的文本输入,文本最大输入长度扩展到4192,并且支持包括稠密检索,稀疏检索,多向量检索三种不同检索手段。从实验结果上看,在多语言跟跨语种检索任务上,BGE M3-Embedding的效果超过之前提及的微软E5-mistral-7b微软E5-mistral-7b-instruct: 站在LLM肩膀上的text embedding以及openai去年底刚发布的第三代text embedding模型,对于长文本检 ...
BGE
M3-Embedding
多语音检索
人工智能
深入浅出人工智能常用技术,让你轻松掌握AI应用核心!
NLP 技术涉及到文本处理、语
音
处理、机器翻译等方面。
人工智能
开源
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
写一篇关于Vision Pro VR眼镜的20字宣传文案,并用女
声
读出来,同时生成个视频看看。
大模型
Stable Diffusion
Stable Diffusion教程:采样器
后向扩散时,Stable Diffusion 先会生成一张完全的噪
音
图,然后根据提示词的语义,通过不断的采样来去除噪
音
图中不符合语义的噪
音
,而采样器就是去除噪
音
用的算法程序。
画图
SD
采样器
详解 Diffusion (扩散) 模型
目前,它们主要用于图像和
音
频生成。
Diffusion
开源模型
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100