首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 【工具书】文生图Midjourney最全prompt提示词分类对照表
· ComfyUI官方使用手册【官网直译+关键补充】
· 谈Agent构建平台的设计
· AI音乐热潮下,“神曲工作室”率先失业
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· 2024!深入了解 大语言模型(LLM)微调方法(总结)
· OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
· 提高写作能力的90个prompt大全
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿
里
最近推出AI项目的动作太过频繁,脑子跟不上了,事出反常必有妖,盘点一下
阿
里
动作太过频繁,就我的脑海回忆,推出了挺多东西的,效果还都不错,今天盘点下都有哪些。
阿里
大模型
开源
玩一玩
阿
里
通义千问开源版,Win11 RTX3060本地安装记录!
大概在两天前,
阿
里
做了一件大事儿。
通义千问
开源
开源语音大语言模型来了!
阿
里
基于Qwen-Chat提出Qwen-Audio!
大型语言模型(LLMs)由于其良好的知识保留能力、复杂的推理和解决问题能力,在通用人工智能(AGI)领域取得了重大进展。然而,语言模型缺乏像人类一样感知非文本模态(如图像和音频)的能力。作为一种重要模态,语音提供了超越文本的多样且复杂的信号,如人声中的情感、语调和意图,自然声音中的火车汽笛、钟声和雷声,以及音乐中的旋律。使LLMs能够感知和理解丰富的音频信号以进行音频交互引起了广泛关注。
大模型
语音
开源
开源版妙鸭相机来了,无限出个人写真图(
阿
里
达摩院出品)
如果您熟悉docker,可以使用我们提供的docker镜像,其包含了模型依赖的所有组件,无需复杂的环境安装: # Step1: 机器资源 您可以使用本地或
云
端带有
妙鸭相机
视频
阿
里
&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
VividTalk: One-Shot Audio-Driven Talking Head Generation Based on 3D Hybrid Prior” VividTalk由南京大学、
阿
里
巴巴
VividTalk
视频
百度
百度智能
云
的Prompt模板
接下来主要介绍百度智能
云
中的Prompt模板。
大模型
prompt
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的
阿
里
明星项目EMO正式开放
来围观初代教父唱《野狼disco》 之前全网刷屏的
阿
里
明星项目 EMO 终于正式开放了!
EMO
阿里
全民演唱
RAG
阿
里
RAG新框架R4:增强检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!
大型语言模型(LLMs)在生成文本时可能会产生错误信息,即“幻觉”问题。尽管检索增强的LLMs通过检索外部数据来减少这种幻觉,但现有的方法通常不考虑检索文档与LLMs之间的细粒度结构语义交互,这在处理长文档时尤其影响回答的准确性。
RAG
检索
大型语言模型
大模型
全量免费的EMO模型上架通义APP,外媒称之为Sora之后最受期待的大模型之一
两个月前,
阿
里
巴巴通义实验室公开了一篇能够让照片唱歌说话的生成式AI模型论文,EMO(Emote Portrait Alive),在海外媒体和社交平台引起热烈反响,被一批科技圈大V轮番转发。
EMO
阿里
全民演唱
大模型
如何下载及使用通义千问7B开源大模型
阿
里
云
开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线ModelScope魔搭社区,开源、免费、可商用,欢迎大家来体验。
通义千问
工具
淘宝模特全体注意!
阿
里
AnyDoor AI换装神器出来了,年度最强AIGC重制绘图工具,重塑电商模特产业
但近日,
阿
里
和港大联手推出了一个工具,可以轻松实现一键换衣,更重要的是,操作简单,实现效果惊人。
AnyDoor
换装
文生图
Stable Diffusion
Stable Diffusion | SD腾讯
云
3步部署,全程五分钟,附价格费用清单
昨天分享的
阿
里
云
部署SD,得到不少朋友的关注,那不得不看看腾讯
云
部署了,流程和界面几乎都是一样的,逻辑是一样,唯一不同的是,腾讯
云
云
盘没有试用,需要自己购买。
下载
开源模型
阿
里
通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
2024中国生成式AI大会于4月18-19日在北京举行,在大会首日的主会场开幕式上,
阿
里
巴巴通义实验室XR团队负责人薄列峰博士以《人物视频生成新范式》为题发表演讲。
通义
文生视频
OpenAI
Agent:OpenAI的下一步,亚马逊
云
科技站在第5层
比如亚马逊
云
科技纽约峰会上宣布的Amazon Bedrock Agents新功能,便是这种趋势最有代表性的体现。
开源模型
开源
【语音领域-又双叒更新】
阿
里
开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
//arxiv.org/pdf/2407.04051 理论篇: FunAudioLLM项目介绍 FunAudioLLM整体系统框架介绍 FunAudioLLM 是
阿
里
语音团队最新开源的项目
asr
tts
声音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100