AI魔法学院客服
阿里千问Qwen可太牛了,学Meta,直接掀桌了
 2023-12-04
复制地址分享海报

阿里千问,每次更新都相当给力啊!

这次凭借两个核心参数就可以傲视群雄了。一个是700亿参数,一个是2GB显存搞起。

除此之外还有角色扮演能力了!!!

给我一种感觉,闭源搞不过讯飞和百度,直接就学Meta掀桌子,搞开源了。

这对百度文心说是可能是一个坏消息,人家高级版都开始收费了。但是对广大群众来说绝对是喜大普奔啊!

我就做一下那个不收钱,奔走相告的人吧!

下面具体来说说,我比较关注的几个点。

720亿参数



现在的开源模型非常之多,但是模型参数一般都不是太大。

比如书生最大的是20BYi最大也就34B, 百川有一个53B的没有开源。

这次阿里qwen直接就把72B给开源出来了。

从基准测试来看,是吊打同行的存在,全方位领先。

这个表格写非常清晰,在所有基准测试中都是最高分!YI感觉是有点水分,阿里这个还是挺硬核的。

在开头的图中可以看到,Qwen模型在某些方面的能力已经超过GPT3.5 GPT4了,当然只是在某些方面而已,GPT4的强大,可能并不那么容易量化。

------------

官方总结特点如下:

·        大规模高质量训练语料:使用超过3万亿tokens的数据进行预训练,包含高质量中、英、多语言、代码、数学等数据,涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。

·        强大的性能:Qwen-72B在多个中英文下游评测任务上(涵盖常识推理、代码、数学、翻译等),效果显著超越现有的开源模型。具体评测结果请详见下文。

·        覆盖更全面的词表:相比目前以中英词表为主的开源模型,Qwen-72B使用了约15万大小的词表。该词表对多语言更加友好,方便用户在不扩展词表的情况下对部分语种进行能力增强和扩展。

·        更长的上下文支持:Qwen-72B支持32k的上下文长度。

·        系统指令跟随:Qwen-72B-Chat可以通过调整系统指令,实现角色扮演语言风格迁移任务设定,和行为设定等能力。

2GB运行(750ti



模型越大,能力自然越强,但是有一个致命的问题--我太穷了。

跑不起来啊!!!!

72B的模型,起步就是80G显存的A100... 10万一张....

非量化版至少需要144GB显存....

单单模型文件就100G...

Qwen肯定也知道这个情况,所以很贴心的出了一个1.8B的模型,更贴心的是4bit量化都给你做好了。

推理只要2GB显存。

微调只要6GB显存。

模型大小不到2GB

----------------------

官方总结的特点如下:

·        低成本部署:提供int8int4量化版本,推理最低仅需不到2GB显存,生成2048 tokens仅需3GB显存占用。微调最低仅需6GB

·        大规模高质量训练语料:使用超过2.2万亿tokens的数据进行预训练,包含高质量中、英、多语言、代码、数学等数据,涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。

·        优秀的性能:Qwen-1.8B支持8192上下文长度,在多个中英文下游评测任务上(涵盖常识推理、代码、数学、翻译等),效果显著超越现有的相近规模开源模型,具体评测结果请详见下文。

·        覆盖更全面的词表:相比目前以中英词表为主的开源模型,Qwen-1.8B使用了约15万大小的词表。该词表对多语言更加友好,方便用户在不扩展词表的情况下对部分语种进行能力增强和扩展。

·        系统指令跟随:Qwen-1.8B-Chat可以通过调整系统指令,实现角色扮演语言风格迁移任务设定,和行为设定等能力。

18亿参数到720亿参数全覆盖啊

而且全部提供量化版本,量化版配置降低很多,能力却降低很少。

上限拉的很高,下限又压的很低。

这种全方位的服务,实在是太舒服了。

角色设定



除了模型大小上全面之外,这次模型还强化了系统指令,说人话就是具有了很强的角色扮演能力,从我的测试来看,这种能力可能比Chatgpt3.5还要强。

比如我给它一个系统指令你叫贾维斯,你是钢铁侠的AI助手,你可以做各种事情

这个时候你再去问他你是谁这样的的问题,他就能做个性化的回答了。

这个东西如果做得好,有些微调都可以省了。比如我直接接入自己的平台,给它一个系统指令,我就可以假装是自主研发,遥遥领先了!

我本来以为只有参数大到一定程度才可以,没想到 18亿的迷你模型也可以角色扮演。

只是耐力不太够,多问几次你是谁就扛不住了。

相比之下,720亿的模型就嘴硬的很,在我威逼利诱下还是打死都不说。直到....

直到我戳穿了它,它就蹦不住了。

根据官方介绍,他还具有 语言风格迁移,任务设定,行为设定等能力,这个就不展开说了,大家可以自己去探索一下。

音频聊天



除了常规的模型之外,Qwen这次还放出来了一个叫Audio的聊天模型,翻译过来大概就是音频聊天!

经过测试,这个模型可以理解你发的音频文件,直接把音频转文字。STT这个其实并不稀奇啊,但是这次是直接用大模型来完成,就感觉挺有意思。

测试过了,识别率非常高。

除了能识别之外,还能问他哪句话在哪个位置,直接给你截取出来。感觉有一句话剪辑视频的苗头了。

另外支持多轮、多语言、多语言对话。

可以容纳训练超过30多种不同的音频任务。

---------------

不要钱给这么多,确实有点让人受宠若惊了!

卷起来,把各种模型的成本打下来吧。