首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 高效选择:Ollama与LM Studio深度对比
· 截至2023年5月份业界支持中文大语言模型开源总结及商用协议分析
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· 教会AI画汉字(ComfyUI篇)
· Suno音乐新手指南(手把手完整版教程)
· 文生图提示词prompt详解
· AI换脸:FaceFusion 3.5.0更新,解决老版本无法使用问题!
· Stable Diffusion基础:ControlNet之身份标识
· 炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
造梦师手记:腾讯加入Stable Diffusion的ControlNet
模
型
开
发,效果艳丽
ghostmix
模
型
作者认为,应该尽可能的少做大
模
型
,然后使用lora、ControlNet等微调工具来适配更多的场景。
Stable
Diffusion
工具
3.5k Star! 一分钟搭建一个属于你自己的
开
发工具箱!——It-tools
应用简览 IT-TOOLS是备受瞩目的免费
开
源
工具站点项目,为
开
发人员和IT专业人员提供了一个便捷的在线工具集合。
IT-TOOLS
开源模型
阿里
【语音领域-又双叒更新】阿里
开
源
FunAudioLLM: 2大核心
模
型
、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
arxiv.org/pdf/2407.04051 理论篇: FunAudioLLM项目介绍 FunAudioLLM整体系统框架介绍 FunAudioLLM 是阿里语音团队最新
开
源
的项目
asr
tts
声音
Stable Diffusion
OpenAI救了Stable Diffusion!
开
源
Dall·E3同款解码器,来自Ilya宋飏等
在热火朝天的“AI春晚”上,OpenAI一口气
开
源
两项工作,其中之一一致性解码器,专门面向SD的VAE
模
型
。
SD
文生图
DALLE
Meta
精通百种语言的翻译AI来了!Meta推出,免费、
开
源
!
这个
模
型
可以实现近101种语言之间的文本、音频、视频等多种形式的翻译,而且只需要一个
模
型
就可以完成所有任务。
大语言模型
OpenAI
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
马斯克所创办的 xAI 团队宣布
开
源
Grok-1——一个参数量为 3140 亿的 MoE 大
模
型
。
Grok-1
开源模型
心理
MindChat心理大
模
型
模
型
介绍 心理大
模
型
——漫谈(MindChat)期望从心理咨询、心理评估、心理诊断、心理治疗四个维度帮助人们纾解心理压力与解决心理困惑, 提高心理健康水平.
心理大模型
Stable Diffusion
Stable Diffusion | SD腾讯云3步部署,全程五分钟,附价格费用清单
等待几分钟后,部署完成,就会跳转到资
源
列表: 三、操作应用 1、因为我没有云盘,没有启用自定义
模
型
上传支持,不能上传
模
型
,这里只显示了一个网址,就是SD操作界面的网址,点击应用地址
下载
开源模型
OpenAI
OpenAI
开
源
语音识别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI
开
源
Whisper 自动语音识别
模
型
的软件工具,能够将音频或视频中的语音自动识别为带有时间戳的文本字幕。
生成式AI
语音
网易有道强力
开
源
中英双语语音克隆
torchaudio pip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin 准备
模
型
文件
语音
开源
语音
从 GPT-4o 到 LiveKit:实时语音交互的
开
源
实现
今天不讨论 GPT-4o 的炸裂或颠覆,而是探讨如何作为个人或独立
开
发者实现这项技术,以及它的应用场景。
GPT-4o
语音交互
OpenAI
OpenAI真的
开
源
了!这波「实时语音」操作,让万物
开
口说话,我爱了
但现在回想起来,那只麋鹿的“能说会道”,其实正是 OpenAI 今天才正式揭晓的“谜底”——他们
开
源
了一个叫做嵌入式实时语音 SDK 的东西!
OpenAI
嵌入式实时语音
SDK
微软
BGE M3-Embedding:智
源
最新发布的text embedding
模
型
,多语言检索效果超过微软跟openai
其二是来自有标注信息的监督数据,包括若干个中文跟英文的
开
源
数据集,例如MS MARCO,NLI,DuReader等。
BGE
M3-Embedding
多语音检索
微软
省钱!微软
开
源
框架LLMLingua + LlamaIndex实现提示词压缩
LLMLingua是微软发布的一款
开
源
框架,旨在帮助
开
发者实现提示词压缩,从而在诸多应用场景中,在尽可能保留有意义的信息时,减少token
开
销,降低成本。
LLMLingua
LlamaIndex
开源框架
备案通过且面向公众
开
放的国产精品大
模
型
汇总,附访问链接
本文总结整理了目前已经国内面向公众
开
放的大
模
型
网址、介绍,供大家了解使用。
大模型
国产
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100