首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· MCI-GRU:在真实金融交易中验证有效的股票价格预测模型
· 大语言模型应用中的文本分块策略
· 模拟ChatGPT流式数据——SSE最佳实践
· 好看的图片不知道怎么写提示词?用AI读出来
· ComfyUI学习笔记2,一文看透Workflow
· AI里的大模型,你了解么
· 用Midjourney给自己制作精美的logo或头像
· 震撼!AI语言模型突破瓶颈,26个提示词原则引领GPT-4响应质量飙升57.7%!你的模型还在等什么?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
剪映克隆声音功能详
解
:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
剪映应用推出了一项名为“AI克隆音色”的创新功能,这一功能允许用户在短短5秒内捕捉并复制特定的声音样本。通过先进的人工智能技术,剪映能够分析并学习目标声音的特征,然后生成与原声音极为相似的复制品。这一功能的上线,不仅为用户提供了前所未有的创作自由度,也为声音设计和个性化服务开辟了新的可能性。
剪映
声音克隆
工具
鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
值得注意的是,他们这里强调了,他们不会进行人脸检测,但上传的
图
片人脸已经要占据
图
片大部分。
PhotoMaker
图生图
Transformer
万字长文震撼来袭!揭秘Transformer——吐血
解
读自注意力机制的革命性突破
Transformer遵循这种总体架构,使用堆叠的自注意力机制和逐点、全连接层,分别用于编码器和
解
码器,如
图
1的左半部分和右半部分所示。
Transformer
大模型
免训练!单
图
秒级别生成AI写真,人像生成进入无需训练的单阶段时代
面对这一问题,FaceChain 给出了
解
决方案:无需大量数据,无需训练等待,甚至无需训练,只需要一张
图
片 10 秒钟即可立即生成 AI 写真!
FaceChain
FACT
文生图
清华
图
片生成速度最高提升10倍!可以做到“实时”生成!清华推出LCM/LCM-LoRA!
近年来,随着SD和Midjourney的火热,文本到
图
像生成(Text-to-Image Generation)的研究取得了令人瞩目的进展,让我们能够用自然语言指导AI创造出各种各样的
图
像。
LCM/LCM-LoRA
文生图
斯坦福宣布前端开发要失业了?!一张截
图
生成代码,64%优于原网页!
随着生成型人工智能(AI)的飞速发展,多模态理
解
和代码生成的能力达到了前所未有的水平。
设计转代码
大模型
一文彻底搞懂多模态 - 多模态推理
接下来分两部分:知识
图
谱推理、多模态推理任务,一起来深入了
解
多模态应用:多模态推理。
多模态推理
大模型
Sora
探索Sora的魔法世界:功能展示、原理
解
析、未来市场影响大猜想!
这标志着我们如何理
解
和创造虚拟世界的方式即将迎来根本性的变革。
视频生成
sora
ComfyUI
免费的文本生成视频
解
决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
AnimateDiff 是一个基于 Stable Diffusion 模型的文本生成视频插件,它通过控制模块影响
图
像生成过程,使得生成的
图
像序列具有与训练视频剪辑相似的特征。
视频生成
文生视频
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
然而,语言模型缺乏像人类一样感知非文本模态(如
图
像和音频)的能力。
大模型
语音
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理
解
的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
体验地址:https://ragflow.io/ 为了确保大家了
解
一下“先验知识“,这里
解
释一下:什么是RAG?
OCR
RAG
开源
大模型
全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万字论文理
解
力接近人类
它们能够处理各种视觉格式,包括照片、
图
表、
图
形和技术绘
图
等。
claude
大模型
Agent
AI Agent行业深度:框架拆
解
、应用方向、应用领域及相关公司深度梳理!
智能体模拟,力
图
更加拟人可信。
AI
Agents
大模型
Agent
AI Agent行业深度:框架拆
解
、应用方向、应用领域及相关公司深度梳理
智能体模拟,力
图
更加拟人可信。
AI
Agent
大模型
人工智能
AI资讯速递 - 快人一步!为你填平AI领域信息差及时揭示AI领域的最新动态
人工智能可以帮我画
图
吗?
AI资讯
AI新闻
<
...
11
12
13
14
15
16
17
18
19
20
...
>
1
2
4
5
6
7
8
9
100