文章列表-AI魔法学院

文章列表

阿里腾讯豪华阵容参投，智谱AI投资版图曝光

清华系受追捧，AI 创投背后的学术谱系当然，市场上流传的智谱融资规模和节奏比官方公布的更详细，就在9月有两个关于智谱融资的消息传来，一个是它完成B-4轮融资，参与的机构包括了腾讯和阿里

智谱阿里

开源版妙鸭相机来了，无限出个人写真图（阿里达摩院出品）

如需使用阿里云ECS，可访问：https://www.aliyun.com/product/ecs，推荐使用”镜像市场“中的CentOS 7.9 64位(预装NVIDIA GPU驱动) # Step2

妙鸭相机

开源语音大语言模型来了！阿里基于Qwen-Chat提出Qwen-Audio!

大型语言模型（LLMs）由于其良好的知识保留能力、复杂的推理和解决问题能力，在通用人工智能（AGI）领域取得了重大进展。然而，语言模型缺乏像人类一样感知非文本模态（如图像和音频）的能力。作为一种重要模态，语音提供了超越文本的多样且复杂的信号，如人声中的情感、语调和意图，自然声音中的火车汽笛、钟声和雷声，以及音乐中的旋律。使LLMs能够感知和理解丰富的音频信号以进行音频交互引起了广泛关注。

大模型语音

阿里AI黑科技大揭秘：从通义千问到FaceChain，让图片和视频焕发新生！

阿里动作太过频繁，就我的脑海回忆，推出了挺多东西的，效果还都不错，今天盘点下都有哪些。

阿里云视频音频

Stable Diffusion

Stable Diffusion | SD阿里云3步部署，全程五分钟，免费试用三个月，电脑无需升级配置

有些新手也慢慢入门了，刚开始简单的操作还好，玩到后面，越来越吃力费劲儿，稍微复杂一点的操作就如鲠在喉，死机等等，是的，是电脑的配置限制了你的想象，云部署就派上用场了，之前分享的谷歌clab要收费了，弃坑了，今天分享一下阿里云

下载

阿里&字节发表VividTalk，只需单张照片即可根据音频生成栩栩如生的人物说话头像视频

VividTalk: One-Shot Audio-Driven Talking Head Generation Based on 3D Hybrid Prior” VividTalk由南京大学、阿里巴巴

VividTalk 视频

阿里云开源通义千问多模态大模型Qwen-VL，持续推动中国大模型生态建设

8月25日消息，阿里云推出大规模视觉语言模型Qwen-VL，一步到位、直接开源。

大模型

四木测评｜让教父唱《野狼disco》、恶搞《甄嬛传》，火遍全网的阿里明星项目EMO正式开放

来围观初代教父唱《野狼disco》之前全网刷屏的阿里明星项目 EMO 终于正式开放了！

EMO 阿里全民演唱

阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio，支持语音增强、分离、目标说话人提取

清晰之声，重塑沟通体验为了解决这些痛点，阿里巴巴语音实验室推出了 ClearerVoice-Studio——一款功能全面的语音处理框架。

ClearerVoice-Studio 语音

全量免费的EMO模型上架通义APP，外媒称之为Sora之后最受期待的大模型之一

两个月前，阿里巴巴通义实验室公开了一篇能够让照片唱歌说话的生成式AI模型论文，EMO（Emote Portrait Alive），在海外媒体和社交平台引起热烈反响，被一批科技圈大V轮番转发。

EMO 阿里全民演唱

阿里RAG新框架R4：增强检索器-重排序-响应器，5个知识密集任务上都超过Self-RAG等！

大型语言模型（LLMs）在生成文本时可能会产生错误信息，即“幻觉”问题。尽管检索增强的LLMs通过检索外部数据来减少这种幻觉，但现有的方法通常不考虑检索文档与LLMs之间的细粒度结构语义交互，这在处理长文档时尤其影响回答的准确性。

RAG 检索大型语言模型

【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能！效果炸裂！手把手带你理论+实战部署推理!

//arxiv.org/pdf/2407.04051 理论篇: FunAudioLLM项目介绍 FunAudioLLM整体系统框架介绍 FunAudioLLM 是阿里语音团队最新开源的项目

asr tts 声音

Stable Diffusion

嘴里塞饭型Stable Diffusion提示词写法实用小笔记

一、自然语法 stable diffusion的文生图里，最简单的写法，就是自然语法。

stablediffusion prompt 提示词

淘宝模特全体注意！阿里AnyDoor AI换装神器出来了，年度最强AIGC重制绘图工具，重塑电商模特产业

但近日，阿里和港大联手推出了一个工具，可以轻松实现一键换衣，更重要的是，操作简单，实现效果惊人。

AnyDoor 换装文生图

阿里通义实验室薄列峰：从兵马俑跳“科目三”到照片唱歌，四大框架让AI生成的人物活起来丨GenAICon 2024

2024中国生成式AI大会于4月18-19日在北京举行，在大会首日的主会场开幕式上，阿里巴巴通义实验室XR团队负责人薄列峰博士以《人物视频生成新范式》为题发表演讲。

通义文生视频

<123 4 5 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1