首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· AI声音克隆 | 最全最简教程(权威版)
· ComfyUI官方使用手册【官网直译+关键补充】
· Coze多智能体(Multi-Agents)模式体验!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了
· 从第一性原理看大模型Agent技术
· 精通百种语言的翻译AI来了!Meta推出,免费、开源!
· 6个最佳开源TTS引擎
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
Stability AI开源上新:3D生成
引
入视频扩散模型
将视频扩散模型用于3D生成
引
入潜在视频扩散模型,SV3D的核心目的是利用视频模型的时间一致性来提高3D生成的一致性。
sv3d
建模
RAG
超越RAG:揭秘IAG框架如何
引
领推理问答系统的创新之路
该框架通过在输入问题后添加一个诱导器来
引
导模型预测答案,从而增强系统的事实准确性。
IAG框架
大语言模型
视频
字节跳动推出MagicVideo-V2:
引
领AI视频生成新时代。
你是否曾想过,仅凭一段文字就能生成一段高清、流畅的视频?现在,这个梦想已经成为现实!字节跳动公司最新推出的MagicVideo-V2,正是一款能够将你的文字描述转化为精美视频的AI视频生成模型。
MagicVideo-V2
视频生成
RAG
一文看懂RAG:大语言模型落地应用的未来
这使得它能够在生成回答时
引
用广泛的信息源。
rag
检索增强
语义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索
0.前言 语义索
引
(可通俗理解为向量索
引
)技术是搜索
引
擎
、推荐系统、广告系统在召回阶段的核心技术之一。
开源模型
RAG
改进召回(Retrieval)和
引
入重排(Reranking)提升RAG架构下的LLM应用效果
为了避免因为大文档chunk化带来的内容分裂,在建库阶段也可做了一定优化,利用summary index对大文档进行索
引
。
大模型
LLM
【一步一步
引
导】从零详细地梳理一个完整的 LLM 训练流程
对于一些多语言模型来讲,要想穷举所有语言中的常用词(穷举不全会造成 OOV), 既费人力又费词表大小,为此,人们
引
入另一种方法:BPE。
大模型
训练
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
该工具使用 pytorch 作为深度学习
引
擎
,并遵循 Kaldi 风格的数据处理和特征提取/格式以及配方来提供各种不同的实验设置。
AudioCraft
音频
清华
震撼科技界:清华大学与智谱AI联手,
引
领中文长文智能写作新纪元!
04 LongWriter模型——
引
领人工智能撰写长文本的新纪元 在人工智能领域,一项突破性的模型——LongWriter,标志着长文本撰写的新篇章。
写作
长文本
提示词
震撼!AI语言模型突破瓶颈,26个提示词原则
引
领GPT-4响应质量飙升57.7%!你的模型还在等什么?
不同的问法会
引
导AI生成不同风格、不同详细程度的答案。
语言模型
提示词
GPT-4
微信向量检索分析一体化数仓探索:OLAP For Embedding
相比于语义性检索
引
擎
(ES)与专业的高性能检索服务,OLAP 数仓的向量检索能力在场景有何区别?
OLAP
For
Embedding
一体化数仓
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
CosyVoice-300M # 进入项目环境 export PYTHONPATH=third_party/AcademiCodec:third_party/Matcha-
TTS
asr
tts
声音
语音
语音识别的未来已来:深入了解faster-whisper的突破性进展
faster-whisper简介 faster-whisper是基于OpenAI的Whisper模型的高效实现,它利用CTranslate2,一个专为Transformer模型设计的快速推理
引
擎
。
语音识别
Faster-Whisper
数字人
数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
零样本文本到语音(
TTS
): 输入 5 秒的声音样本,即刻体验文本到语音转换。
数字人
声音克隆
GPT-SoVITS
教程
AI声音克隆 | 最全最简教程(权威版)
TTS
的英文全名是 Text To Speech,中文译名是“文本转语音”。
声音克隆
教程
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100