AI魔法学院客服
Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑
Stability AI开年第一个大模型来了! 名为Stable Code 3B,参数27亿,专为写代码而生。 Stable Code 3B可理解处理18种不同的编程语言,上下文长度100K token。 且它对硬件要求也不高,用MacBook Air等普通笔记本电脑也能离线运行。
 2024-03-20
收藏 复制地址分享海报

Stability AI开年第一个大模型来了!

名为Stable Code 3B,参数27亿,专为写代码而生。

IMG_256

Stable Code 3B可理解处理18不同的编程语言,上下文长度100K token

且它对硬件要求也不高,用MacBook Air普通笔记本电脑也能离线运行

IMG_257

性能方面,Stable Code 3B规模比CodeLLaMA 7B60%,但性能却大差不差。

BigCode评估中,在包含多种编程语言的MultiPL-E数据集上,Stable Code 3B与类似大小的模型相比,都拿下了SOTA性能。

IMG_258

Stable Code 3B刚上线,有网友反馈已经在插件中用上了:

效果非常好!体积小,兼容各种硬件且运行速度非常快。

IMG_259

Stable Code 3B长啥样?

在此之前,Stability AI去年8月份就已发布了一个初代版本Stable Code Alpha 3BStable Code 3B是其进化版。但开发团队表示,Stable Code 3B是首个主要版本,基于Stable LM 3B基础模型打造,并增加了多项附加功能。

其中就包括支持中间填补FIM等新功能,并使用RoPE(旋转位置嵌入)方法,将上下文长度从16000 token拉长至100000 token

Stable Code 3B整体架构类似于LLaMA,是一个仅解码器模型,使用Flash Attention 2算法。

IMG_260

支持以下18种编程语言:

CCPPJavaJavaScriptCSSGoHTMLRubyRustMarkdownShellPhpSqlRTypescriptPythonJupyter-CleanRestructuredText

下面是对性能比较的补充。

面对比自己大两倍多的CodeLLama 7BStable Code 3B的性能也差不多能与其打个平手,在PythonCPP语言上甚至略胜一筹。

IMG_261


IMG_262

在类似大小的模型中,Stable Code 3B表现突出。

IMG_263

不过也有吐槽声

虽然Stable Code 3B收到了一波好评,但也有不少网友认为没有太多新东西没有那么好

IMG_264

此外,它仅支持英语和编程语言,也是让大家有些许失望。

IMG_265
IMG_266

对此,你怎么看?

参考链接:
[1]https://huggingface.co/stabilityai/stable-code-3b
[2]https://twitter.com/StabilityAI/status/1747348018884493623

—  —

出自:https://mp.weixin.qq.com/s/qTFuxJsZTxhDHeUBwRFgVA

本文档由网友提供,仅限参考学习,如有不妥或产生版权问题,请联系我们及时删除。 客服请加微信:skillupvip
评论
1 评论
包打听2024/3/20 11:22:30
devin也有了,这是要卷死程序员吗
20秒读懂全文
伴读
文章摘要:Stability AI发布了名为Stable Code 3B的大型编程语言模型,具有27亿参数,可处理18种编程语言,性能与大型模型CodeLLaMA 7B相当,但对硬件要求较低,可在普通笔记本电脑上运行。尽管受到一些好评,但也有网友认为该模型缺乏新意和多元语言支持。

关键词:Stability AI, Stable Code 3B, 编程语言模型, 参数,
One More Thing
One More Thing again ...

找组织,加入AI魔法学院群