首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· Fooocus,webui,comfyui优缺点
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 2024!深入了解 大语言模型(LLM)微调方法(总结)
· YOO简历
· Midjourney AI绘画美女提示词分享三
· stable diffusion如何确保每张图的面部一致?
· Stable Diffusion使用Roop插件一键换脸教程
· AI换脸工具:facefusion使用心得
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
从 GPT-4o 到 LiveKit:实时
语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话
语
音
技术。
GPT-4o
语音交互
GLM-4-Voice 9B——实时多
语
言
语
音
对话 AI——几分钟内即可在本地安装
GLM-4-Voice作为一款端到端的
语
音
模型,推动了多
语
言对话人工智能的边界,支持英
语
和中
文
的实时对话,同时提供可适应且类人化的响应
生
成。
GLM-4-Voice
9B
语音
安装
大模型
语
言大模型100K上下
文
窗口的秘诀
上下
文
窗口(context window)是指
语
言模型在进行预测或
生
成
文
本时,所考虑的前一个词元(token)或
文
本片段的大小范围。
大模型
大模型
中
文
原
生
文
生
图大模型来了!腾讯混元推出,Sora 同架构
开源地址:https://github.com/Tencent/HunyuanDiT 这是业内首个中
文
原
生
的DiT架构
文
生
图开源模型,支持中英
文
双
语
输入及理解,
文生图
混元
腾讯
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生
成视频插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视频剪辑的训练,它能够调整图像
生
成过程,
生
成一系列与训练视频剪辑相似的图像。
动画
视频
AnimateDiff
Stable Diffusion
Stable Diffusion
文
生
图全网最细详解
我们从 Web UI 开始讲解,基于使用最多的
文
生
图 模块来讲解 一、WEB UI 页面 如果你使用的是 Kaggle 搭建的SD,那么你进入到 web ui 页面后可以看到下面这个页面
文生图
SD
开源
通过声
音
生
成逼真的全身形象?!Meta开源AI工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据
音
频
生
成逼真的人物视频!
audio2photoreal
开源工具
开源
Chinese-LLM开源中
文
大
语
言模型合集
OpenChineseLLaMA 简介:基于 LLaMA-7B 经过中
文
数据集增量预训练产
生
的中
文
大
语
言模型基座,对比原版 LLaMA,该模型在中
文
理解能力和
生
成能力方面均获得较大提升,在众多下游任务中均取得了突出的成绩
大模型
中文
懒人福
音
!用AI
生
成会议纪要,让你的工作更高效!
下面我会把已经在用的流程和经验分享给大家,包括
语
音
转
文
本工具的用法,AI总结会议的提示词等等。
会议纪要
AI工具
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将
文
本变换成
语
音
的AI工具。
TTS
文本转语音
开源
OpenAI真的开源了!这波「实时
语
音
」操作,让万物开口说话,我爱了
就像直播里的那只麋鹿,它能听懂你的问题,然后用自然流畅的
语
音
跟你聊天,就是这个 SDK 的功劳!
OpenAI
嵌入式实时语音
SDK
LLM
一
文
汇总大
语
言模型LLM所有prompt提示词框架的论
文
出处
能够让大模型推理结果变得更好的基础优化手段已经非常多了,这里梳理了常见的提示技术手段和对应的论
文
: - Zero-shot(零样本提示):https://arxiv.org/abs/2109.01652
prompt
提示词
VividTalk:用一张照片和一段
音
频让人物栩栩如
生
地说话
这个技术不仅有望改变数字媒体的
生
产方式,也为虚拟现实和人工智能的应用开辟了新的道路。
VividTalk
视频
Stable Diffusion
[Stable Diffusion]AnimateDiff :最稳定的
文
本
生
成视频插件
在小视频风靡的时代,稳定的
文
本
生
成短视频成为了迫切需求。
AnimateDiff
视频
训练
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频
生
成栩栩如
生
的人物说话头像视频
只需提供一张人物的静态照片和一段
语
音
录
音
,VividTalk即可制作出一个看起来像是实际说话的人物的视频。
VividTalk
视频
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100