CPM-BEE面壁智能
CPM大模型是面壁团队根据多年的大模型训练经验自研的百亿参数预训练语言大模型,模型支持多语言能力和简易结构化输入输出,通过团队自研的高效微调技术,能快速适配各种下游任务,满足各种场景的需求。
大模型开源
访问 CPM-BEE面壁智能
3097
收藏
CPM-BEE面壁智能 简介
CPM大模型是面壁团队根据多年的大模型训练经验自研的百亿参数预训练语言大模型,模型支持多语言能力和简易结构化输入输出,通过团队自研的高效微调技术,能快速适配各种下游任务,满足各种场景的需求。
CPM-Bee是一个完全开源、允许商用的百亿参数中英文基座模型,也是CPM-Live训练的第二个里程碑。它采用Transformer自回归架构(auto-regressive),在超万亿(trillion)高质量语料上进行预训练,拥有强大的基础能力。开发者和研究者可以在CPM-Bee基座模型的基础上在各类场景进行适配来以创建特定领域的应用模型。
开源可商用:OpenBMB始终秉承“让大模型飞入千家万户”的开源精神,CPM-Bee基座模型将完全开源并且可商用,以推动大模型领域的发展。鼓励全球范围内的科研机构、企业和个人开发者在遵守开源许可协议的前提下,自由地在CPM-Bee基座模型上进行创新。
中英双语性能优异:CPM-Bee基座模型在预训练语料上进行了严格的筛选和配比,同时在中英双语上具有亮眼表现,具体可参见评测任务和结果。
超大规模高质量语料:CPM-Bee基座模型在超万亿语料进行训练,是开源社区内经过语料最多的模型之一。同时,对预训练语料进行了严格的筛选、清洗和后处理以确保质量。
OpenBMB大模型系统生态支持:OpenBMB大模型系统围绕高性能预训练、适配、压缩、推理开发了一系列工具,CPM-Bee基座模型将配套所有的工具脚本,高效支持开发者进行进阶使用。
对话和工具使用能力:
结合OpenBMB在指令微调和工具学习的探索,我们在CPM-Bee基座模型的基础上进行微调,训练出了具有强大对话和工具使用能力的实例模型,API和内测将于近期开放。