首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 大模型业务应用中数据准备的要求、难点及解决思路
· 一文搞定 ComfyUI SDXL1.0 完整流程
· Prompt小技巧(18):万能Prompt
· 比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 大模型狂飙两年后,“六小龙”开始做减法
· Examful.ai
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· AI音乐热潮下,“神曲工作室”率先失业
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
LLM
2023年LLM如何
入
门?请看这篇综述!
补充一点有趣的,当参数规模超过一定水平
时
,这些扩大的
语
言模型不仅可以
实
现显著的性能提升,还表现出一些特殊的能力,比如上下文学习能力等等,这是小规模
语
言模型(例如BERT)所没有的,这种现象被称为涌现Emergence
大模型
数字人
AI虚拟主播数字人技术
实
现Wav2Lip
本文主要
实
现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口型与
音
频中的
语
音
唇形同步)。
数字人
视频
大模型
深
入
探秘:百川7B大模型的训练代码解析,揭秘巨无霸
语
言模型背后的奥秘
(二、软件和部署) 本期开始,为大家讲下这些大模型是怎么训练生成的 首先,为了确保本系列的讲解流畅,我将直接深
入
讲解大型
语
言模型的代码。
大模型
开源
6个最佳开源TTS引擎
TTS引擎用于
实
现文本到
语
音
的转换。
TTS引擎
开源模型
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
然后,它可以生成听起来自然的
语
音
,以多种
语
言模仿该
语
音
,同
时
为用户提供对情感、口
音
、节奏和
语
调等参数的精细控制。
OpenVoice
声音克隆
开源
StableDiffusion
AI绘画由
入
门到精通:StableDiffusion精讲课程
以下为本站SD画图软件生成图片赏析: StableDiffusion文生图软件的核心优势在于其能够利用深度学习技术,通过自然
语
言的描述生成高质量的图像。
SD
视频课程
AI绘画
Agent
Coze多智能体(Multi-Agents)模
式
体验!
以一个具体的
实
例作为起点,我计划创建一个“虚拟互联网软件公司”,为开源项目的快速开发提供全面的服务支持。
Coze
多智能体
ChatGPT
实
战:如何用AI Agent
实
现ChatGPT流程化写作,产能翻倍
ChatGPT 虽然是个相当厉害的 AI 聊天机器人,能回答你各
式
各样的问题,并根据你的需求生成内容,但它其
实
更像一个等待指令的工具,而非一个能自主思考的助手。
Agent
写作
ChatGPT
Prompt全攻略(一):ChatGPT
时
代,什么是Prompt?
随着GPT-3等预训练
语
言模型的进步,ChatGPT这类交互
式
人工智能chatbot应运而生。
prompt
大模型
深
入
解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型
尽管配备了八个专家,在
实
际运算
时
每个Token仅需两个专家参与。
开源模型
Mixtral
8x7B
开源
SD3 正
式
开源 Sora同源架构
2月16日伴随着OpenAI世界大模型Sora的发布,stability_ai也发布了其最新的模型Stablediffusion3,如果说一个是
音
视频方向
SD3
绘画
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引
入
Transformer结构来提升性能。
TSAC
音频工具
Prompt
Prompt及AI提问
实
践
· 模型本身的
实
现方
式
。
Prompt
大模型
提问
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
Mel-spectrogram是一种能够有效捕捉
音
频信号频谱特征的工具,它将
音
频信号转换为一种更适合机器学习模型处理的图像形
式
,成为许多
语
音
合成模型的标准输
入
形
式
,有助于模型更好地理解和学习声
音
的特征。
clone-voice
声音克隆
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
行为主义的幽灵 延续人类心理学的研究方法 心理学家在谈论一个人的人格或者一个人的心理
时
,其
实
是在深
入
了解他的思维模
式
、情感反应和行为方
式
。
大语音模型
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100