首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· prompt中的分隔符号的正确使用方法
· 【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
· Deepseek-V2技术报告解读!全网最细!
· 10大Midjourney描述词网站,让你Ai创作随心所欲!
· SD入门教程二:文生图基础用法(提示词)
· 智谱AI官网再升级,GLM-4,智能体,AI作图长文档全部搞定!
· Stable Diffusion 30种采样器全解!
· 剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
· 入坑必看:comfyui界面与基础操作
· 面向知识图谱的大模型应用
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
书
生
·万卷:难得的中
文
开源数据集
中国的AI产业要迎头赶上,中
文
的数据集是最大的短板之一。
大模型
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
CosyVoice-instruct-300M:能够
生
成富有情感表现力的
语
音
,允许通过指令
文
本进行精细调整。
asr
tts
声音
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时转录应用程序,使用 OpenAI Whisper 模型将
语
音
输入转换为
文
本输出。
OpenAI
Whisper
大模型
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生
成视频插件库
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视频剪辑的训练,它能够调整图像
生
成过程,
生
成一系列与训练视频剪辑相似的图像。
动画
视频
AnimateDiff
大
语
言模型应用中的
文
本分块策略
分块的主要原因是确保我们向量化的内容的噪
音
尽可能少,并且具有
语
义相关性。
开源模型
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
RAG
RAG——使用检索增强
生
成构建特定行业的大型
语
言模型
下面是检索增强技术论
文
的摘要部分,从中我们可以看到,检索增强技术是用于知识密集型nlp任务处理
文
本
生
成时,先通过信息检索技术来增强信息输入来使
生
成的内容更具体、更多样化和更真实的技术。
大模型
ComfyUI
ComfyUI 基础教程(二):
文
生
图基础流程
一、
文
生
图(text2img)使用步骤 .
comfyui
文生图
AI制作艺术二维码 -
文
生
图
前几天看到几个逼格比较高的二维码,然后自己动手做了一下,给大家看看效果: 1、
文
生
图(狮子): 2、
文
生
图(城市): 下边将开始介绍怎么做的,有兴趣的可以继续读一读
文生图
Sora
一
文
带你看懂OpenAI-Sora
生
成视频的原理
Sora,在粤
语
中有点像“傻啦”,可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。
视频生成
sora
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
RAG
一
文
看懂RAG:大
语
言模型落地应用的未来
其中一些主要限制包括: 不适应多模态数据:基础RAG主要关注
文
本数据的检索和
生
成,对于多模态数据(例如图像、
音
频)的处理能力有限。
rag
检索增强
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
现在的AI发展越来越快,
生
成一段
语
音
不是难事,那如果
生
成的是你自己的声
音
?
OpenVoice
声音克隆
开源
语
义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术
文
献
语
义检索
比方说,你在电台里听到了一首陌
生
的歌曲。
开源模型
万字长
文
-大
语
言模型指令调优综述
(例如,
文
本分类、信息提取、
文
本重写、
文
本创作等)和55种
语
言。
大语言模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100