首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 本地部署Manus+DeepSeek保姆级教程!
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· GPU 性能(数据表)快速参考
· 盘点数据安全合规方向的热门证书【快来了解一下】
· YOO简历
· 五大AI工具自动生成PPT效果对比
· 实测:本地跑llama3:70B需要什么配置
· 划重点!全网最全AI数字人工具合集!
· 阿里Outfit Anyone实现真人百变换装
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多
语
言检索效果超过微软跟openai
其三是合
成
得到的监督数据,利用GPT3.5为来自Wiki跟MC4的长文本
生
成
对应的问题,用于缓解模型在长文档检索任务的不足,同时引入额外的多
语
言数据。
BGE
M3-Embedding
多语音检索
Sora
通俗易懂地解释OpenAI Sora视频
生
成
的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
Sora
生
成
的视频与此前其它平台
生
成
的视频到底有哪些区别?
sora
视频生成
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
而这一次的项目,就是被N多人期待了很久的,腾讯混元视频
生
成
模型。
sora
视频生成
大模型
测评了8个国产AI大模型,差点崩溃……
从自然
语
言处理到
语
音
识别,从情感分析到知识问答,大模型的应用已经渗透到我们
生
活的方方面面。
大模型
测评
Meta
各个
语
种互相翻译:Meta推出NLLB-200 AI模型,可实现200种
语
言互译
要知道,此前的众多
语
言模型,要么不支持这么多种
语
言,要么不能直接完
成
小众
语
言之间的两两翻译。
翻译
大模型
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口型与
音
频中的
语
音
唇形同步)。
数字人
视频
Stable Diffusion
详解Stable Diffusion提示词prompt
语
法
根据自己描述的中文直接通过翻译软件 进行翻译,然后把词条放在 prompt 中就行 翻译网站:https://fanyi.baidu.com/ 3.抄作业 参考一些模型网站的例图与提示词记录网站的
成
品
SD
prompt
文生图
提示词
教程
用so-vits-svc-4.1进行
音
色转换的极简教程
但是无论转换哪种声
音
,都需要至少采集30分钟-1小时的
语
音
干声,这对于普通讲话很好采集,只需要到一个安静的场所,比如录
音
棚,录制一段
语
音
即可。
声音
sovits
开源
6个最佳开源TTS引擎
02 mozilla TTS https://github.com/mozilla/TTS TTS是一个用于文本到
语
音
生
成
的高级库。
TTS引擎
开源模型
开源
开源大
语
言模型完整列表
这些模型通常拥有数十亿到数万亿个参数,能够处理各种自然
语
言处理任务,如自然
语
言
生
成
、文本分类、文本摘要、机器翻译、
语
音
识别等。
开源模型
大语言模型
教程
用so-vits-svc-4.1进行
音
色转换的极简教程!
但是无论转换哪种声
音
,都需要至少采集30分钟-1小时的
语
音
干声,这对于普通讲话很好采集,只需要到一个安静的场所,比如录
音
棚,录制一段
语
音
即可。
so-vits-svc
音色转换
教程
ComfyUI
ComfyUI上使用SDXL1.0官方工作流实操使用 零基础讲解节点式
生
成
的Ai绘画工具comfyui,节点模块讲解
因为comfyui更符合stable diffusion的工作原理,
生
成
图片时的速度相较于webui有较大的提升,根据我的测试
生
成
大图片的时候不会爆显存。
文生图
AGI
通往 AGI 之路:走进大
语
言模型
2022年 11 月 30 日发布的
语
言模型。
AGI
ChatGPT
大语言模型
开源
ChatGLM3-6B:新一代开源双
语
对话
语
言模型,流畅对话与低部署门槛再升级
在
语
义、数学、推理、代码、知识等不同角度的数据集上测评显示,ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能。
ChatGLM3
语音模型
开源模型
语
义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献
语
义检索
,拥有
语
言理解和文本
生
成
能力,尤其是它会通过连接大量的
语
料库来训练模型,这些
语
料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流
开源模型
<
...
9
10
11
12
13
14
15
16
17
18
...
>
1
2
4
5
6
7
8
9
100