首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
微软
2.7B能打Llama 2 70B,微软祭出「小
语
言
模
型
」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
凭借着2.7B的参数,「小
语
言
模
型
(SLM)」Phi-2几乎打穿了所有13B以下的大
模
型
——包括谷歌最新发布的Gemini Nano 2。
小语言模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为
语
音
的技术,通过TTS技术,计算机可以将文字信息转换成人类可听懂的
语
音
输出,实现
语
音
合成的功能 目前市场上的AI声
音
我们最多用的还是普通的
声音克隆
教程
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
今天介绍一个开源的完整的数字人项目:Fay Fay是一个完整的开源项目,包含Fay控制器及数字人
模
型
,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、
语
音
助理、远程
语
音
助理、数字人互动、心理测评
Fay
开源项目
数字人
大
模
型
的研究新方向:混合专家
模
型
(MoE)
随着不同应用场景的实际需求,大
模
型
的参数会变得越来越大,复杂性和规
模
不断的增加,尤其是在多
模
态大
模
型
的开发中,每个数据集可能完全不同,有来自文本的数据、图像的数据、
语
音
的数据等,包含不同的
模
式,特征和标注之间的关系可能也大有不同
MoE
大模型
开源
阿里云开源通义千问多
模
态大
模
型
Qwen-VL,持续推动中国大
模
型
生态建设
8月25日消息,阿里云推出大规
模
视觉
语
言
模
型
Qwen-VL,一步到位、直接开源。
大模型
LLM
领域大
模
型
LLM训练Trick
问题一:进行领域大
模
型
预训练应用哪些数据集比较好?
垂直
训练
大模型
动作识别
模
型
有哪些
动作识别
模
型
主要有: · TWO-STREAM CNN:网络顾名思义分为两个部分,一部分处理RGB图像,一部分处理光流图像。
动作识别
模型
开源
MaskGCT:登上GitHub趋势榜榜首的TTS开源大
模
型
MaskGCT是一个两阶段
模
型
:在第一阶段,
模
型
使用文本预测从
语
音
自监督学习(SSL)
模
型
中提取的
语
义标记;在第二阶段,
模
型
基于这些
语
义标记预测声学标记。
MaskGCT
声音克隆
StableDiffusion
StableDiffusion
模
型
推荐系列(功能
型
)
前两天,我分享了SDXL的通用
模
型
,这些
模
型
不仅在生成高质量图像和艺术作品方面表现出色,搭配上LoRA
模
型
还能在多个领域发挥重要作用,尤其是在平面设计与UI设计领域。
StableDiffusion
文生图
StableDiffusion
StableDiffusion
模
型
推荐系列(全能
型
)
今天,我们要聊一聊AI绘画领域里的一个超有趣的话题:为什么Midjourney能用一个5.2
模
型
轻松驾驭各种风格,而Stable Diffusion却需要我们切换无数个
模
型
呢?
stablediffusion
sd
文生图
开源
[中文开源震撼首发]33B QLoRA大
语
言
模
型
Anima真的太强大了!QLoRA技术可能是AI转折点!
我们开源了第一个中文QLoRA 33B大
语
言
模
型
——Anima。
开源模型
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI
语
音
...
Pinokio,无脑一键部署主流AI
模
型
项目!
AI绘画
AI视频
AI音乐
大
模
型
量化:什么是
模
型
量化,如何进行
模
型
量化
What:什么是
模
型
量化 简单来说,
模
型
量化(Model Quantization)就是通过某种方法将浮点
模
型
转为定点
模
型
。
大模型
投资人逃离大
模
型
该大
模
型
体系以低成本、高效率打通了各类AI应用,提供包括:面向办公场景的商汤日日新·商量
语
言大
模
型
-数据分析版本、面向医疗场景的日日新·商量
语
言大
模
型
-医疗版本“大医”……商汤“日日新·商量大
语
言
模
型
”
大模型
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
内置HP2和HP3两个
模
型
,HP3可能轻微漏伴奏但对主人声保留比HP2稍微好一丁点; 2、仅保留主人声:带和声的
音
频选这个,对主人声可能有削弱。
数字人
声音克隆
GPT-SoVITS
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100