首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
· OCR的终极解法——传统算法VS多模态大模型
· AI拟声: 5秒内克隆您的声音
· 盘点字节跳动最新的AI应用
· 无显卡+纯本地跑Qwen1.5版模型!0基础闭眼部署指南!适用绝大部分开源模型!llama2+Mistral+Zephyr通杀!
· 国产视频制作之光-可灵:提示词大全整理
· 大模型量化:什么是模型量化,如何进行模型量化
· 【工具书】文生图常用的正向反向提示词以及常用词中英文对照表
· 玩一玩阿里通义千问开源版,Win11 RTX3060本地安装记录!
· AI高手都在用的10个提示词prompt网站,建议收藏!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
一款构建AI数字人项目开源了!自动
实
现
音
视频同步!
1、Video-Tetalking Video-ReTalking 是一个利用AI
实
现视频人物嘴型与输
入
的声
音
同步的创新技术。
AI数字人
音视频同步
工具
惊艳推荐!8款好用又免费的文本转
语
音
TTS工具
具有神经网络真人发
音
、支持在线体验和本地部署(通过Docker等方
式
)。
TTS
Maker
语音
Prompt
大
语
言模型定制化应用的三种方
式
:Prompt engineering、Fine tuning、Pre-trainning的区别
在
实
现大
语
言模型的定制化应用中,的确有几种常用的方
式
:Prompt Engineering(提示工程)、Fine-tuning(微调)和Pre-training(预训练)。
大模型
ChatGPT
ChatGPT 的对话框过
时
了?这款 AI 产品提供了一种很新的聊天方
式
比如,问问广州今天的天气如何,Flowith 就会进行
实
时
搜索。
ChatGPT
聊天
开源
OpenAI 开源
语
音
识别 Whisper 的使用体验怎么样?
登录进
入
工作台后,使用
语
言识别功能,点击【新建项目】-【
语
音
转写】。
生成式AI
开源
RAGFlow:开源的RAG引擎,专注于深
入
的文档理解,支持处理各种复杂格
式
的非结构化数据
该项目提供了一个简化的RAG工作流,适用于各种规模的企业,通过结合使用大型
语
言模型(LLM)来提供基于严谨引用的真
实
问答能力。
RAGFlow
RAG
开源
免训练!单图秒级别生成AI写真,人像生成进
入
无需训练的单阶段
时
代
这一创新版本摒弃了传统的人物模型训练过程,能够直接生成 zero-shot 目标人像,引领 AI 人像生成进
入
了无需训练的单阶段
时
代。
FaceChain
FACT
文生图
Ollama最新更新v0.1.33,
实
现了多并发可同
时
与多个模型聊天对话!
上周,Ollama进行了v0.1.33版本更新,为本地部署的开源大型
语
言模型(LLMs)带来了重大改进。
ollama
语言大模型
聊天
开源
生成
式
AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的
音
频生成开发框架
支持的模型 · · AudioCraft使用 · · AudioCraft开源地址 · AudioCraft简介 产生高保真
音
频任何类型的
音
频都需要对不同尺度的复杂信号和模
式
进行建模
开源模型
剪映克隆声
音
功能详解:剪映上线5秒“AI克隆
音
色”,一堆AI公司又要进
入
慢性死亡了...
也是在那一天,N多AI初创公司宣布进
入
死亡倒计
时
。
剪映
声音克隆
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同
时
分析图像/视频/
音
频/文本
同
时
,作者还利用自动
语
音
识别(ASR)数据来训练
音
频
语
言模型。
Baichuan-Omni
多模态大模型
教程
SD
入
门教程六:ControlNet基础
入
门
从上图可以看到,我们在使用 ControlNet 的
时
候,会先将 text prompt 和图片一起输
入
到 ControlNet 的模型中,然后 ControlNet 的模型会生成一张 latent
ControlNet
文生图
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+
实
战部署推理!
它在支持5种
语
言的同
时
提供高速处理。
asr
tts
声音
开源
【TTS
语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
下面进
入
今天的主题~ 需要特别注意:本文只是技术分享,在使用对应模型进行
语
音
合成
时
,需要严格遵照对应项目的要求和法律法规!!
语音克隆
开源模型
大模型
中文版开源Llama 2同
时
有了
语
言、多模态大模型,完全可商用
据项目介绍,Chinese-Llama-2-7b 开源的内容包括完全可商用的中文版 Llama2 模型及中英文 SFT 数据集,输
入
格
式
严格遵循 llama-2-chat 格
式
,兼容适配所有针对原版 llama
开源模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100