首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI换脸工具:facefusion使用心得
· MCP服务介绍及应用场景报告-来自Manus
· 我用AI写小说:「国学篇」如何将国学插入小说中
· 9.4k Star!MemGPT:伯克利大学最新开源、将LLM作为操作系统、无限上下文记忆、服务化部署自定义Agent
· 使用自己的数据训练清华ChatGLM2-6B 模型
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· ComfyUI官方使用手册【官网直译+关键补充】
· [Stable Diffusion]SD安装、常用模型(checkpoint、embedding、LORA)、提示词具、常用插件
· YOO简历
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
语
音
助理和远程语
音
助理:数字人可以作为语
音
助理,进行语
音
交互,提供信息查询、日程管理等辅助任务。
Fay
开源项目
数字人
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
零样本 & 小样本 TTS:输入 10 到 30 秒的
声
音
样本即可生成高质量的 TTS 输出。
Fish
Speech
本地搭建
教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程 #1/2 使用模型
原始
声
音
处理 要使用模型进行推理的话你首先需要一段已经演唱好的
声
音
垫进去,然后使用模型把原来的
音
色换成你模型训练好的
音
色(类似AI画图的img2img垫图)。
生成式AI
Stable Diffusion
SD入门教程一:Stable Diffusion 基础(技术篇)
),顾名思义,它就是能预测出随机图里包含什么噪
音
的模型。
Stable
Diffusion
文生图
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
多模态(Multi-Modal): 多模态主要是指让机器能够理解和处理自然界或人工定义的多种模态信息,如
声
音
、语言、视觉信息和表格、点云信息等。
开源
LLM
基于LLM+向量库的文档对话痛点及解决方案
痛点:文档切分粒度不好把控,既担心噪
声
太多又担心语义信息丢失 笔者之前采用了Longchain的文档切分工具,发现不能问题。
开源模型
Roop参数说明,ROOP->StyleGAN演示!
保留
音
轨(keep audio)
音
轨就是指视频的
声
音
,勾选这个参数就是保留原视频的
声
音
,大部分情况下,肯定是要选择启用。
视频
StyleGAN
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
2303.17580.pdf HuggingGPT是近期非常火热的Agents方向的一个代表,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于文生图、图生文、语
音
转文字
提示词
prompt
开源
搞了一个Dify开源知识库
Workflow:打造你的智能工作流 · 初衷:也是在机缘巧合下,感谢MAX和众多大佬的呼
声
支持下
Dify
大模型
知识库
开源
来个优秀的开源人脸识别项目!
通过计算机与光学、
声
学、生物传感器和生物统计学原理等高科技手段的密切结合,将人体固有的生理特征或行为特征收集起来,进行取样、数字化处理和分析。
人脸识别
开源项目
ChatGPT
把ChatGPT装进二次元手办,你来吗?AI桌面机器人众筹
蓝牙
音
箱,语
音
控制小度丝滑流畅。
ai小车
esp32
开源
打磨 8 个月、功能全面升级,Milvus 2.3.0 文字发布会现在开始!
具体来看:Milvus 2.3.0 不仅包含大量的社区呼
声
很高的新功能,还带来了诸如 GPU 支持、Query 架构升级、更强的负载均衡调度能力、新的消息队列、Arm版本镜像、可观测性、
大语言模型
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
24年的第一个月,智源就发布了新一代text embedding模型BGE M3-Embedding,该模型支持超过100种语言,能够接受不同形式的文本输入,文本最大输入长度扩展到4192,并且支持包括稠密检索,稀疏检索,多向量检索三种不同检索手段。从实验结果上看,在多语言跟跨语种检索任务上,BGE M3-Embedding的效果超过之前提及的微软E5-mistral-7b微软E5-mistral-7b-instruct: 站在LLM肩膀上的text embedding以及openai去年底刚发布的第三代text embedding模型,对于长文本检 ...
BGE
M3-Embedding
多语音检索
Stable Diffusion
Stable Diffusion教程:采样器
后向扩散时,Stable Diffusion 先会生成一张完全的噪
音
图,然后根据提示词的语义,通过不断的采样来去除噪
音
图中不符合语义的噪
音
,而采样器就是去除噪
音
用的算法程序。
画图
SD
采样器
人工智能
深入浅出人工智能常用技术,让你轻松掌握AI应用核心!
NLP 技术涉及到文本处理、语
音
处理、机器翻译等方面。
人工智能
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100