首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
· 你的下一个浏览器,可以是豆包电脑版!
· 清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench:GPT-4是全能战士,超越所有模型
· ComfyUI 基础教程(二):文生图基础流程
· 懒人福音!用AI生成会议纪要,让你的工作更高效!
· 一键AI换脸!小红书和北大合作的InstantID
· 十大开源语音识别项目
· 用AI生成PPT、用AI优化PPT!
· OpenAI开源大模型调测工具Transformer Debugger:可以在训练大模型之前理解模型的运行情况并干预
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI绘画Stable-Diffusion风格化实战
在社交软件和短视
频
平台上,我们时常能看到各种特色鲜明的视觉效果,比如卡通化的图片和中国风的视
频
剪辑。
Stable-Diffusion
文生图
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置语速、添加停顿词、口头语、笑声!!
音
色一:男
音
色-铿锵有力效果展示 这是我经过挑选后男
音
对应的数据供768维。
chattts
tts
文生语音
ChatGPT
ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记
对于大模型prompt的设计,近期斯坦福吴恩达伙同OpenAl出了一套视
频
教程(B站地址:https://www.bilibili.com/video/BV1AT41187qt?
prompt
大模型
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
3月,国内外模型公司动作
频
频
。
零一万物
YI
李开复
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
2303.17580.pdf HuggingGPT是近期非常火热的Agents方向的一个代表,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于文生图、图生文、语
音
转文字
提示词
prompt
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Sadtalker是一个能够根据图片和
音
频
生成视
频
的开源项目,它使用了一种叫做SadNet的神经网络,可以实现风格化的单图说话人脸动画。
数字人
你的下一个浏览器,可以是豆包电脑版!
万万没想到,现在看B站视
频
的打开方式,竟然可以这么AI了。
豆包
浏览器
ChatGPT
把ChatGPT装进二次元手办,你来吗?AI桌面机器人众筹
蓝牙
音
箱,语
音
控制小度丝滑流畅。
ai小车
esp32
开源
数字人
划重点!全网最全AI数字人工具合集!
· 选择语
音
:输入文字或录制语
音
,让数字人“说出”你想让他/她表达的内容。
AI
数字人
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
语
音
处理(Audio):语
音
处理指机器从大量的语
音
数据中提取语
音
特征,学习和发现其中蕴含的规律的过程。
开源
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
24年的第一个月,智源就发布了新一代text embedding模型BGE M3-Embedding,该模型支持超过100种语言,能够接受不同形式的文本输入,文本最大输入长度扩展到4192,并且支持包括稠密检索,稀疏检索,多向量检索三种不同检索手段。从实验结果上看,在多语言跟跨语种检索任务上,BGE M3-Embedding的效果超过之前提及的微软E5-mistral-7b微软E5-mistral-7b-instruct: 站在LLM肩膀上的text embedding以及openai去年底刚发布的第三代text embedding模型,对于长文本检 ...
BGE
M3-Embedding
多语音检索
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
AI 实现视
频
自动剪切 近几年,短视
频
的风口一直在持续,各大社交网站也都针对短视
频
流量进行大力扶持。
开源模型
开源
GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
Screenpipe 使用 Rust 语言开发,并提供灵活的插件系统,可与 Ollama 等工具协同工作,适用于从屏幕和
音
频
数据中获取实时分析的需求。
AIPC
ScreenPipe
开源
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
学会SD之后可以画图、抠背景、制作商品展示图、制作建筑图、做Logo以及图标、做宣传画,甚至可以换脸、写真、做动画视
频
等。
SD
视频课程
AI绘画
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
动态表现力:通过上下文风格化的
音
频
到运动模型(ICS-A2M),MimicTalk能够「捕捉和模仿目标人物的动态说话风格」,使生成的视
频
更加生动和富有表现力。
MimicTalk
开源模型
<
...
7
8
9
10
11
12
13
14
15
16
...
>
1
2
4
5
6
7
8
9
100