首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· SD入门教程六:ControlNet基础入门
· 检索增强生成(RAG)有什么好的优化方案?
· AI时代,如何利用ChatGPT一分钟洗稿一篇文章?
· 无需翻墙,可合法使用的8款国内AI大模型产品
· 99%的人都不懂的Stable Diffusion高级功能,Negative Prompt如何正确使用?
· 无限逼近真人效果的“超真实人像大模型”,或许它才是你一直在寻找的真爱!
· AI绘画 | Midjourney高质量肖像提示词的写法(附50+肖像提示词prompt)
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 十条最佳GPT提示词,让你成为任何领域大师
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Agent
十篇高质量的AI-Agents相关论文,让AI教你认识AI-Agents
Andrej Karpathy和Lilian Weng开始对外界释放出一个信号,基于 LLM的AI Agents是AGI领域接下来重要的发展方向,使得很多原本嘲笑Auto-GPT开发者,开始更多开始正
视
基于
开源模型
Stable Diffusion
Stable diffusion三步搞定——场景定制化
在日常的工作中,为了保证
视
觉构图还有画面风格的一致性,有意的去搭建了属于赶集行业特征的运营场景素材库,目的是为了让设计师能灵活调用,随做随取,节省时间提高效率。
AI图片
工具
20个常见AI绘画工具大汇总(含免费版哦~)
NUWA NUWA(Neural visUal World reAtion)是微软亚洲研究院开发的多模态模型,通过自然语言指令,NUWA可以实现文本、图像、
视
频
之间的生成、转换和编辑。
文生图
写作
提高写作能力的90个prompt大全
轻松的语气:“为介绍[您的产品]的短
视
频
制作一个有趣的脚本。”
prompt
写作
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
LinkSoul.AI 团队接下来的工作会把语音 -
视
觉 - 文本进一步融合,让大语言模型同时支持语音和
视
觉模态。
开源模型
数据分析思路系列-如何建立指标体系
因为公司并没有按照用户类型切分的运营团队,所以我们最终选择按照产品功能,即:
视
频
学习、做题学习、pk等娱乐功能。
数据分析
指标体系
Stable Diffusion
张嘴就能生图?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
真的是一秒生成(这比我登录英雄联盟还快): 当然也可能是因为我的显卡比较好(没钱冲阿里云会员了不然我可以试试其他的显卡),但是我看了大多数的
视
频
基本上比较普遍的显卡都是在4-5秒左右就能生成。
SDXL-Turbo
文生图
深入浅出:大语言模型中必不可少的技术——Embedding简介
如何生成和存储Embedding 总结 Embeddings技术简介及其历史概要 在机器学习和自然语言处理中,embedding是指将高维度的数据(例如文字、图片、音
频
)
embedding
从0到1谈谈智能客服系统的设计与实现
总结下来,目前客服系统比较重
视
以下三个关键指标,我们分别来解读一下。
智能客服
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
其核心功能是通过提供发言者的短音
频
片段(参考语音),实现声音的高效克隆。
tts
文本转语音
什么是极限、导数、微分与积分(通俗易懂)!
你的目光时而注
视
前方的道路,时而瞥向仪表盘上跳动的速度指针。
极限
导数
微分
积分
对于AI,我们现阶段可以有的态度
Diffusion,但依然还有搭档配合,让我们能在其他模态和领域得以探索和交流,除了AI绘画之外,我们在大语言模型和本地化部署ChatGLM,声音克隆、虚拟数字人直播间以及效果不输于D-ID的口播式
视
频
文生图
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
包含两个核心模型:SenseVoice 负责语音识别和音
频
处理,CosyVoice 负责语音生成和控制。
asr
tts
声音
开源
向量数据库简介和5个常用的开源项目介绍
这些数据可能包括文本、图像、音
频
和
视
频
,使用各种过程(如机器学习模型、词嵌入或特征提取技术)将其转换为向量。
开源模型
数字人
GitHub本月榜单:一个数字人技术的“非官方”实现
个性化推荐:结合用户的历史购买数据和偏好,AnimateAnyone可以生成个性化的推荐
视
频
,提高用户购物的针对性和满意度。
AnimateAnyone
人工智能
<
...
13
14
15
16
17
18
19
20
21
22
...
>
1
2
4
5
6
7
8
9
100