首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 从第一性原理看大模型Agent技术
· ComfyUI官方使用手册【官网直译+关键补充】
· 芯片拼接技术:英伟达新核弹,站在苹果的肩膀上
· AI声音克隆 | 最全最简教程(权威版)
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 生成式AI与大语言模型的区别
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 深入解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
有感情的
语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的
语
音
生成模型,专门用于大型
语
言模型(LLM)助手的对话任务、对话
语
音
和视频介绍等应用。
ChatTTS
语音合成
Stable Diffusion
Stable Diffusion图生图(真人
转
动漫)
一、简介 今天给大家分享使用Stable Diffusion图生图进行真人
转
动漫,木木共使用了五种模型进行真人
转
动漫测试,重绘幅度在0.45~0.6之间,如果重绘幅度过大,会导致生成的图片偏离主体样貌
StableDiffusion
图生图
【进阶】-
文
生图术
语
解释
念咒 提示词组合 (prompts) 施法/吟唱/t2i
文
本
转
图像 (txt2img) i2i
文生图
开源
一款构建AI数
字
人项目开源了!自动实现
音
视频同步!
本周GitHub项目圈选: 主要包含
音
视频同步、多代理框架、3D对象模型、适用于开发者的演示
文
档构建工具、网页程序打包、自构建CRUD应用等热点项目。
AI数字人
音视频同步
用AI轻松玩
转
年度总结PPT
这篇
文
章就是为你准备的 我会教你如何利用完全免费的国产 AI 工具,快速的制作 PPT 如果你有很多复杂的
文
字
需要整理,没问题,让 A 已帮你整理 如果你平时不喜欢总结工作内容,做了很多事,写总结不知如何下笔
PPT
年终总结
将
文
本
转
化为3D动画:DeepMotion推出MotionGPT,开启动画新时代!
这是一款基于生成式AI的工具,可以将
文
本提示无缝
转
换为复杂的3D动画,简化了动画创作过程,同时也超越了物理障碍,使得更多不同类型的创作者和行业可以使用3D动画。
3D
动作捕捉
阿里
阿里&
字
节发表VividTalk,只需单张照片即可根据
音
频生成栩栩如生的人物说话头像视频
只需提供一张人物的静态照片和一段
语
音
录
音
,VividTalk即可制作出一个看起来像是实际说话的人物的视频。
VividTalk
视频
Agent
【万
字
长
文
】全球AI Agent大盘点,大
语
言模型创业一定要参考的60个AI智能体
PS:因本
文
盘点的Agent项目众多,故而
字
数也达到了1W+,建议大家先收藏再阅读。
大语言模型
开源
腾讯开源的数
字
人MuseTalk到底行不行?
该模型能够根据输入的
音
频信号,自动调整数
字
人物的面部图像,使其唇形与
音
频内容高度同步。
MuseTalk
数字人
音频
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段时间,「霉霉大秀中
文
」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
开源
GPT-4o实时
语
音
方案提供商Livekit开源voice agent:轻松处理
音
视频流
轻松访问 LiveKit WebRTC 会话并处理或生成
音
频、视频和数据流。
voice
agent
开源
音视频
美的数
字
化
转
型10年,方洪波的反思。作为领导者的高瞻远瞩与宽广胸襟!
那么ToC和ToB这四个板块的业务,在过去十年,都是我们同步数
字
化
转
型的。
工作
开源
OpenAI 开源
语
音
识别 Whisper 的使用体验怎么样?
Buzz
语
音
转
文
字
工具的特点 高度精确:基于 OpenAI 提供的 Whisper 自动
语
音
识别技术,这是一款功能强大的机器学习模型。
生成式AI
开源
从 GPT-4o 到 LiveKit:实时
语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话
语
音
技术。
GPT-4o
语音交互
大模型
语
言大模型100K上下
文
窗口的秘诀
在
语
言模型中,上下
文
窗口对于理解和生成与特定上下
文
相关的
文
本至关重要。
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100