首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
开源版妙鸭相机来了,无限出个人写真图(
阿
里
达摩院出品)
如需使用
阿
里
云ECS,可访问:https://www.aliyun.com/product/ecs,推荐使用”镜像市场“中的CentOS 7.9 64位(预装NVIDIA GPU驱动) # Step2
妙鸭相机
腾讯
阿
里
腾讯豪华阵容参投,智谱AI投资版图曝光
清华系受追捧,AI 创投背后的学术谱系 当然,市场上流传的智谱融资规模和节奏比官方公布的更详细,就在9月有两个关于智谱融资的消息传来,一个是它完成B-4轮融资,参与的机构包括了腾讯和
阿
里
智谱
阿里
通义千问
阿
里
AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
阿
里
动作太过频繁,就我的脑海回忆,推出了挺多东西的,效果还都不错,今天盘点下都有哪些。
阿里云
视频
音频
开源
开源语音大语言模型来了!
阿
里
基于Qwen-Chat提出Qwen-Audio!
大型语言模型(LLMs)由于其良好的知识保留能力、复杂的推理和解决问题能力,在通用人工智能(AGI)领域取得了重大进展。然而,语言模型缺乏像人类一样感知非文本模态(如图像和音频)的能力。作为一种重要模态,语音提供了超越文本的多样且复杂的信号,如人声中的情感、语调和意图,自然声音中的火车汽笛、钟声和雷声,以及音乐中的旋律。使LLMs能够感知和理解丰富的音频信号以进行音频交互引起了广泛关注。
大模型
语音
Stable Diffusion
Stable Diffusion | SD
阿
里
云3步部署,全程五分钟,免费试用三个月,电脑无需升级配置
有些新手也慢慢入门了,刚开始简单的操作还好,玩到后面,越来越吃力费劲儿,稍微复杂一点的操作就如鲠在喉,死机等等,是的,是电脑的配置限制了你的想象,云部署就派上用场了,之前分享的谷歌clab要收费了,弃坑了,今天分享一下
阿
里
云
下载
大模型
阿
里
云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
8月25日消息,
阿
里
云推出大规模视觉语言模型Qwen-VL,一步到位、直接开源。
大模型
视频
阿
里
&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
VividTalk: One-Shot Audio-Driven Talking Head Generation Based on 3D Hybrid Prior” VividTalk由南京大学、
阿
里
巴巴
VividTalk
视频
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的
阿
里
明星项目EMO正式开放
来围观初代教父唱《野狼disco》 之前全网刷屏的
阿
里
明星项目 EMO 终于正式开放了!
EMO
阿里
全民演唱
大模型
全量免费的EMO模型上架通义APP,外媒称之为Sora之后最受期待的大模型之一
两个月前,
阿
里
巴巴通义实验室公开了一篇能够让照片唱歌说话的生成式AI模型论文,EMO(Emote Portrait Alive),在海外媒体和社交平台引起热烈反响,被一批科技圈大V轮番转发。
EMO
阿里
全民演唱
RAG
阿
里
RAG新框架R4:增强检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!
大型语言模型(LLMs)在生成文本时可能会产生错误信息,即“幻觉”问题。尽管检索增强的LLMs通过检索外部数据来减少这种幻觉,但现有的方法通常不考虑检索文档与LLMs之间的细粒度结构语义交互,这在处理长文档时尤其影响回答的准确性。
RAG
检索
大型语言模型
Stable Diffusion
嘴
里
塞饭型Stable Diffusion提示词写法实用小笔记
一、自然语法 stable diffusion的文生图
里
,最简单的写法,就是自然语法。
stablediffusion
prompt
提示词
工具
淘宝模特全体注意!
阿
里
AnyDoor AI换装神器出来了,年度最强AIGC重制绘图工具,重塑电商模特产业
但近日,
阿
里
和港大联手推出了一个工具,可以轻松实现一键换衣,更重要的是,操作简单,实现效果惊人。
AnyDoor
换装
文生图
开源
【语音领域-又双叒更新】
阿
里
开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
//arxiv.org/pdf/2407.04051 理论篇: FunAudioLLM项目介绍 FunAudioLLM整体系统框架介绍 FunAudioLLM 是
阿
里
语音团队最新开源的项目
asr
tts
声音
阿
里
通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
2024中国生成式AI大会于4月18-19日在北京举行,在大会首日的主会场开幕式上,
阿
里
巴巴通义实验室XR团队负责人薄列峰博士以《人物视频生成新范式》为题发表演讲。
通义
文生视频
AI落地
里
那些假的机会
如果褪去各种装饰,那必然回到这
里
。
大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100