首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 必看!阿里通义千问完整技术报告
· MCP服务介绍及应用场景报告-来自Manus
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 实测:本地跑llama3:70B需要什么配置
· SD插件|EasyPhoto|妙鸭相机平替|美颜算法
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion教程:提示词
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 爆火的“女孩的一生”,plus版教程它来了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OmniVision - 968M:小巧精悍的
视
觉语言模型,释放多模态边缘计算
强
大潜能
边缘设备,如智能手机、物联网设备等,对智能处理
视
觉和文本信息的需求也在急剧
增
长。
OmniVision
-
968M
多模态模型
工具
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI
视
频
、AI语音...
涵盖了 AI 绘画、AI
视
频
、AI 音乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
阿里
阿里RAG新框架R4:
增
强
检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!
尽管检索
增
强
的LLMs通过检索外部数据来减少这种幻觉,但现有的方法通常不考虑检索文档与LLMs之间的细粒度结构语义交互,这在处理长文档时尤其影响回答的准确性。
RAG
检索
大型语言模型
Sora
Sora懂不懂物理世界?
Sora的基本原理 Sora的训练集为短
视
频
集,每个样本是一个短
视
频
,Sora将其编码到数据空间进行降维,然后在隐空间中将特征向量切割成补丁,加上时间顺序,构成时空补丁,亦即时空令牌(time-space
文生视频
视频生成
sora
Ollama 与 Dify:AI 应用开发的
强
强
联合
介绍 随着大型语言模型(LLM)的快速发展,它们为 AI 应用开发提供了
强
大的功能和灵活性。
Ollama
Dify
大型语言模型
ChatGPT
15种ChatGPT高
频
用法
本文列出了15个可以高频使用chatgpt以及其他大模型的场景,希望对您会有启发
大模型
效率
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音
增
强
、分离、目标说话人提取
它集成了先进的语音
增
强
(Speech Enhancement)、语音分离(Speech Separation)和音
视
频
扬声器提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理音
频
ClearerVoice-Studio
语音
RAG
Langchain中改进RAG能力的3种常用的扩展查询方法
有多种方法可以提高检索
增
强
生成(RAG)的能力,其中一种方法称为查询扩展。
检索增强生成
Langchain
教程
爆火的“女孩的一生”,plus版教程它来了
嘿,动画和
视
频
制作的小伙伴们,今天我们来聊聊怎样用animatediff和LCM(Lower Complexity Model)来制作超炫酷的
视
频
。
动画
视频
AnimateDiff
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转换为
视
频
。
AnimateDiff
视频
训练
开源
46.6k星星!最
强
开源AI集合系统,一键部署全网AI工具都能直接用,UI简直是
视
觉盛宴!
我第一次发现LobeChat的时候,就是看到那炫酷的页面,这么
强
的前端真的是在秀肌肉啊!
AI开源
集合
工具
TTS,一个奇妙的AI工具
在自媒体盛行的今天,很多人尝试制作
视
频
发到自媒体平台上,通过获得流量的方式实现直接或间接变现。
TTS
文本转语音
RAG
LLM之RAG实战(五)| 高级RAG 01:使用小块检索,小块所属的大块喂给LLM,可以提高RAG性能
RAG(Retrieval Augmented Generation,检索
增
强
生成)系统从给定的知识库中检索相关信息,从而使其能够生成事实信息、上下文相关信息和特定领域的信息。
RAG
检索
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短
视
频
火爆全网,同类型的AI短
视
频
层出不穷,更有好莱坞明星说中文的短
视
频
,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短
视
频
吧!
数字人
音视频
换脸
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改
视
频
,分割和修饰
无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散
视
频
还是
视
频
制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100