首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
开源大语言
模
型完整列表
VisualGLM-6B ——
多
模
态
对话语言
模
型 VisualGLM-6B 是一个开源的,支持图像、中文和英文的
多
模
态
对话语言
模
型,语言
模
型基于 ChatGLM-6B,具有 62 亿参数;图像部分通过训练
开源模型
大语言模型
RAG
检索增强生成(RAG)有什么好的优化方案?
2)
多
模
态
RAG(文本+表格+图片) 对
多
模
态
RAG而言,有三种技术路线[10],见下图: 图7
多
模
态
RAG 如图7所示,对
多
模
态
RAG而言有三种技术路线,如下我们做个简要说明: ·&ensp
RAG
检索增强
SDXL
说真的,SDXL究竟藏着
多
少秘密,也许没人知道
探索功能,线上部署,更新工作流……我只想告诉你,SDXL不是一个绘图
模
型那么简单,在它里面,隐藏着太
多
不为人知的秘密。
文生图
SeaTable 一站式助力高校
多
场景数字化升级,打造高效解决方案
已经在
多
所知名高等教育机构中得到应用和肯定。
大模型
Prompt
AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动
态
提示词)
今天带来抽卡神器:dynamic prompts(动
态
提示词) 插件可以大幅提升抽卡的效率,结合前面的提示词合集 让我们开启无限抽卡之旅吧!
AI图片
开源
摆脱 OpenAI 依赖,8 分钟教你用开源生
态
构建全栈 AI 应用
摆脱对 OpenAI 的依赖,借助开源生
态
系统构建出全流程的 AI 应用,现在开始!
开源模型
StableDiffusion
深度解析丨StableDiffusion在
多
个设计场景中的探索与应用
本文将深入解析StableDiffusion在
多
个设计场景中的探索与应用,尤其关注如何利用其制作
多
种商业落地案例。
文生图
语音
GLM-4-Voice 9B——实时
多
语言语音对话 AI——几分钟内即可在本地安装
然而,大
多
数
模
型在流利地切换语言、理解口语查询的细微差别以及提供高质量响应方面仍然面临挑战。
GLM-4-Voice
9B
语音
安装
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
随着生成型人工智能(AI)的飞速发展,
多
模
态
理解和代码生成的能力达到了前所未有的水平。
设计转代码
大模型
Fastwhisper + Pyannote 实现 ASR + 说话者识别
whisper很变
态
,粤语效果也还不错,因此,如果实际业务中需要涉及到不同的语言,还是更推荐whisper
多
一点 一、faster-whisper简单介绍 faster-whisper是使用
faster-whisper
语者识别
ASR
AI资讯速递 - 快人一步!为你填平AI领域信息差及时揭示AI领域的最新动
态
在这个数字化转型的浪潮中,人工智能(AI)的发展速度之快,已经超出了大
多
数人的想象。
AI资讯
AI新闻
工具
鹅厂最新AI工具刷屏!杨幂寡姐
多
风格写真秒秒钟生成,LeCun点赞 | 可免费体验
第二个,混合不同人物特征,生成全新人物形
态
。
PhotoMaker
图生图
开源
开源语音大语言
模
型来了!阿里基于Qwen-Chat提出Qwen-Audio!
然而,语言
模
型缺乏像人类一样感知非文本
模
态
(如图像和音频)的能力。
大模型
语音
达摩院SPACE对话大
模
型:知识注入与知识利用
预训练语言
模
型有了很大的发展,出现了很
多
变种。
大模型
开源
30
多
年前被 Windows、Linux “灭掉”的操作系统 MS-DOS 4.0,微软在 GitHub 上开源了!
微软表示,“如果你想亲自运行 MS-DOS 4.0 软件并进行探索,我们已经成功地在原始 IBM PC XT、较新的 Pentium 电脑以及开源 PCem 和 86box
模
拟器上直接运行了该软件。
MS-DOS
4.0
开源模型
微软
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100