首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· LLM大模型推理输出生成方式总结
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 万物皆可接入DeepSeek,44家接入R1的国产平台超详细大盘点
· 如何下载及使用通义千问7B开源大模型
· Suno音乐新手指南(手把手完整版教程)
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· GenColor.ai
· GitHub本月榜单:一个数字人技术的“非官方”实现
· 经典Prompt欣赏 - GitHub Copilot Chat
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ComfyUI
铁锅炖blender+ComfyUI配置,更改模型地址
直接去Blender_ComfyUI\ComfyUI文件夹里找到extra_model_paths.yaml.example
用
记事本打开即可,然后把里面的path改掉,再把文件名重命名为extra_model_paths.yaml
comfyui
文生图
Sora
中学生能看懂:Sora 原理解读
通过这种基于文本条件的Diffusion模型,Sora不仅能生成具有高度创造性的视频和图片,还能确保生成内容与
用
户
的文本提示保持高度一致。
Sora
原理
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
直接端到端输出结果: 无论是中英文的大段文字: 还是包含了公式的文档图片: 又或是手机页面截图: 甚至可以将图片中的表格转换成 Latex 格式: 当然,作为多模大模型,通
用
能力的保持也是必须的
OCR
手写
文字识别
社区供稿|GPT-4 与国产模型,大!横!评!
GLM4:GPT4:文心4.0:豆包:祝福语环节各家都有瑕疵,评判标准按整句都有压上韵、且能给到更长,各家分数如下2、语义理解,来一轮常识快问快答~问问
用
户
画像?
GPT-4
大模型
FaceFusion又更新咯,增强功能再增强!
主题细化为简约扁平化设计 通过参数分组增强 --help 和文档 将默认图像和视频质量降低至 80% 向安装程序引入新的 --torch 参数 使
用
最新的
FaceFusion
文生图
数字人
划重点!全网最全AI数字人工具合集!
HeyGen 01 以其逼真的数字人效果闻名,HeyGen给
用
户
提供了绝佳的视频创作体验: · 选择模板:无论你是喜欢炫酷的风格,还是简约的风格,这里的丰盛模板总有一款适合你
AI
数字人
一文彻底搞懂多模态 - 多模态推理
接下来分两部分:知识图谱推理、多模态推理任务,一起来深入了解多模态应
用
:多模态推理。
多模态推理
大模型
大模型
比GPT-4快18倍,世界最快大模型Groq登场!每秒500 token破纪录,自研LPU是英伟达GPU 10倍
它使
用
的是SRAM,其速度比GPU所
用
的存储器快约20倍。
Groq
大模型
语音
「语音识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
技术深度:Distil-Whisper的构建原理与应
用
潜能 Distil-Whisper的成功并非偶然。
Distil-Whisper
语音识别
对于AI,我们现阶段可以有的态度
包括AI绘画也一样,会
用
会玩,图个新鲜有趣,自然很容易就能上手使
用
;但如果要想做到可以落地商
用
的程度,就需要你投入相对应的时间成本来深入学习和熟练掌握了。
文生图
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
低延迟:特别是 SenseVoice-Small 版本,采
用
非自回归端到端架构,提供了极低的推理延迟。
asr
tts
声音
Prompt
一文汇总市面上所有prompts提示词框架
因为Prompt框架隐藏着掌控未来AI应
用
的钥匙,引领我们进一步解锁AI技术在各个垂直行业中的巨大潜力。
提示词框架
prompt
LLM
AutoGPT与LLM Agent解析
其中一个典型场景是长 session 的聊天过程,由于 GPT API 本身的输入信息有 4000 个 token 的限制,所以当聊天进行比较久之后,
用
户
经常会发现 ChatGPT 已经“忘了”之前讲过的内容
大模型
大模型
宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家
利
用
从
用
户
那里收集的反馈信息,不断地评估和优化 AI 的对话能力。
宁德核电
大模型
揭秘DeepSeek:一个更极致的中国技术理想主义故事
这些使得它经常被遗忘在牌桌之外,但在另一端,它又经常在社区被
用
户
“自来水”式传播。
DeepSeek
大模型
<
...
67
68
69
70
71
72
73
74
75
76
...
>
1
2
4
5
6
7
8
9
100