首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· Fooocus,webui,comfyui优缺点
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 2024!深入了解 大语言模型(LLM)微调方法(总结)
· YOO简历
· Midjourney AI绘画美女提示词分享三
· stable diffusion如何确保每张图的面部一致?
· Stable Diffusion使用Roop插件一键换脸教程
· AI换脸工具:facefusion使用心得
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于
文
生
图、图
生
文
、
语
音
转
文
字、
文
字合成
语
音
等),从而让LLM能驱动其他智能Agent,实现多模态能力。
提示词
prompt
ChatGPT
ChatGPT丨一次性修改全
文
的提示
语
!
当需要一次性修改全
文
的格式时,可以使用提示词来改进
文
章的结构、
语
言和流畅性: 1.
写文章
大
语
言模型应用中的
文
本分块策略
分块的主要原因是确保我们向量化的内容的噪
音
尽可能少,并且具有
语
义相关性。
开源模型
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的
语
音
转换为
文
本的技术,然而,目前的
语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
教程
AI声
音
克隆 | 最全最简教程(权威版)
TTS 的英
文
全名是 Text To Speech,中
文
译名是“
文
本转
语
音
”。
声音克隆
教程
AI制作艺术二维码 -
文
生
图
前几天看到几个逼格比较高的二维码,然后自己动手做了一下,给大家看看效果: 1、
文
生
图(狮子): 2、
文
生
图(城市): 下边将开始介绍怎么做的,有兴趣的可以继续读一读
文生图
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
CosyVoice-instruct-300M:能够
生
成富有情感表现力的
语
音
,允许通过指令
文
本进行精细调整。
asr
tts
声音
ComfyUI
ComfyUI 基础教程(二):
文
生
图基础流程
一、
文
生
图(text2img)使用步骤 .
comfyui
文生图
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生
成视频插件库
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视频剪辑的训练,它能够调整图像
生
成过程,
生
成一系列与训练视频剪辑相似的图像。
动画
视频
AnimateDiff
开源
书
生
·万卷:难得的中
文
开源数据集
中国的AI产业要迎头赶上,中
文
的数据集是最大的短板之一。
大模型
RAG
RAG——使用检索增强
生
成构建特定行业的大型
语
言模型
下面是检索增强技术论
文
的摘要部分,从中我们可以看到,检索增强技术是用于知识密集型nlp任务处理
文
本
生
成时,先通过信息检索技术来增强信息输入来使
生
成的内容更具体、更多样化和更真实的技术。
大模型
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
RAG
一
文
看懂RAG:大
语
言模型落地应用的未来
其中一些主要限制包括: 不适应多模态数据:基础RAG主要关注
文
本数据的检索和
生
成,对于多模态数据(例如图像、
音
频)的处理能力有限。
rag
检索增强
Sora
解读OpenAI Sora
文
生
视频技术原理
OpenAI 随后公布的技术综述[
文
献1],难掩其勃勃雄心:视频
生
成模型作为世界模拟器。
sora
语
义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术
文
献
语
义检索
比方说,你在电台里听到了一首陌
生
的歌曲。
开源模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100