ȫ��ǿ��ı��ģ�ͣ�һ�οɶ�35��֣�Baichuan2-192K��

��ģ�Ϳ��飬��û��ô��

��ڴ�ģ�ʹ�ҵ��˾��ڼ��ǰ�ش��µļ�¼��

10 �� 30 �գ��ٴ��ʽ�� Baichuan2-192K ��ڴ�ģ�ͣ��ģ�ͣ�LLM��Ĵ��ڵĳ��һ�� 192K token��

��൱��ô�ģ��һ�δ��Լ 35 ����ȴﵽ�� GPT-4��32K token��Լ 2.5 ��֣�� 14 ��Claude 2.0��100K token��Լ 8 ��֣� �� 4.4 ��

��仰˵��Baichuan2-192K ��һ��Զ��һ�� 2��ȫ��Ĵ��ڳ���Ĵ�ģ����⣬��Ҳ���ı��⡢�ʴ���ȶ��ά�ȵ��ȶ��֡�

�ܹ�һ��ⳬ��ı��Ĵ�ģ�ͣ��Щ�£��ٴ��ܽ��һ��ʾ��

�ϴ�һ�� 2��ڰ�ɭ�֡�� PDF �ļ��ٴ��ģ��ͳ�Ƴ�� 30 ��֡��ѯ��й��ⱾС˵��κ��⣬��ģ�Ͷ��Ը��׼ȷ�Ĵ𰸡�

��ʱ��Ѱ�� AI �İ��ϣ��Ƿ��Ҫ��ȡ׼ȷ��Ϣ�� Baichuan2-192K��ǿ��Կ��ٽ��ʮҳ��ҳ�ĺ�ͬ�ļ�� AI ��ٸ��ժҪ��ٶ��ˣ�

��ô��ͻȻ�ӵ��һ��ļ�Ҫ��أ�

ֱ�Ӵ��һ��ϴ��Ϳ��ˣ��ٴ��ģ�Ϳ��ɰ��ƪ��ϳ�һƪ��

��ģ��ܹ��ݱ䳤֮��Ӧ�õķ��Խ��Խ�ࡣ��֪��ı��ģ��Ǻܶೡ��ܹ�Ӧ��ص�ǰ��һ�Σ��ٴ��ҵ��ȡ�

�Ӽ��ֵ��ʮ��֣�ͷ��ҵ��˾��̲��ڡ�

��ע��ģ��ı��ⷽ��Ӧ�ã��ע�⵽һ��һ��ʼ��ģ��ı��ܶ��һЩ�Ʊ��棬��Щ�ı�ͨ��ʮ��ҳ��ʮҳ��ȣ��ͨ��Ҳ�ͼ��֡��ı��ݱ�Ϊ��Сʱ�Ļ��¼��߼�ʮ��ֵĳ�ƪС˵��Խ��Խ��ң��Ѷ�ҲԽ��Խ��

��ͬʱ��ĵĴ�ģ�͹�˾ҲԽ��Խ�ܹ�ע��ǰ��ʱ�䣬��ʵ�� 100K token ��Ĵ��ڵĴ�ģ�� Claude ��Ĺ�˾ Anthropic �Ⱥ��õ��΢��͹ȸ��ʮ��Ԫ��ʣ��ģ�;��µĲ��档

Ϊʲô��Щ��˾��ս��ı��

��ȴ�Ӧ�õĽǶ��ʹ�ô�ģ��ĺܶ๤��߶��Ҫ��ܳ��ı��ʦ��ʦ��ѯʦ�ȣ���Ĵ��Խ��Щ��ô�ģ��Խ�㷺��Σ��Ӽ��ĽǶ��ɵ��ϢԽ�࣬ģ��һ��ʱ��Բο��Ϣ��Խ�࣬��þ��Ŀ��Ծ�ԽС����ɵ��Ϣ��Խ׼ȷ��Ǵ�ģ�ͼ��صı�Ҫ��ԣ��취��ģ��ܵ�ͬʱ��ҹ�˾Ҳ�ڱ�ƴ˭�ܰ��Ĵ��ø��󣬴Ӷ�Ͷ�ŵ��Ӧ�ó��

��ǰ��չʾ��һЩ��п��Կ��Baichuan2-192K ��ı��ⷽ��ֶ��ܳ�ɫ��ң��Щ��Խ��֮�⣬��ǻ��Դ�һЩ��п��һ�㡣

Baichuan2-192K��ļ�Խ��Խ��

��ı��У�һ��Ҫ��ָ��С��ȡ��ǽ��Ȼ��ϰ�ߵĸ��ĵ��Ϊ��Լ�ʱ��ģ��ɲ��Լ��ı��ĸ��Խ�ߣ�ģ�͵��Ⱦ�ԽС��ģ��Ҳ��Խ�á�

��԰ٴ��ģ��ȵĲ��Լ�� PG-19��ݼ�� DeepMind ��о��Ա��ݼ��Թ��ڱ��ƻ��ͼ�飬�� PG-19 ��鱾��

��Խ��ͼ��ʾ��Կ��ڳ�ʼ�׶Σ��࣬��ĳ��ȱȽ϶̵Ľ׶Σ��Baichuan2-192K ��ȱ㴦�ڽϵ͵�ˮ׼��ĳ��ȵ��ӣ��Ʊ��ԣ��ֳ��ȳ��½��״̬��˵���ڳ��ĵĳ��У�Baichuan2-192K ��ܱ��鱾��ı����

��ϣ�Baichuan2-192K �ı��Ҳ�ǳ��ۡ�

��Ȩ��ĳ��ı��׼ LongEval��LongEval ��ɼ��ݴ�ѧ��У��У��Գ��ģ��İ񵥣��Ҫ��ģ�ͶԳ��ݵļ��ģ�͵÷�Խ��Խ�á�

��ͼ��п��Կ��ĳ��ȵ��ӣ�Baichuan2-192K һֱ�ܹ��ȶ��ĸ��ܣ��ڴ��ڳ��ȳ�� 100K ֮��Ҳ����֮�£�Claude 2 �ڴ��ڳ��ȳ�� 80K ��Ч��½��Ѿ��ǳ��ء�

��⣬ģ�ͻ�� Dureader��NarrativeQA��TriviaQA��LSHT �ȶ��Ӣ�ĳ��ı��ʴ�ժҪ��⼯�Ͼ��˲��ԡ��ʾ��Baichuan2-192K ͬ��죬�ڴ󲿷ֳ��ı��ж�Զ��ģ�͡�

��֮����Խ��ٴ��Ĵ�ģ��ܾ�Խ����

192K ��ģ��ٴ��ô��ģ�

��Ĵ��Ч��ģ��˹��ҵ�Ĺ�ʶ��ǳ��Ĵ��ζ�Ÿ��ߵ��͸��Դ�ѹ��

Ϊ�˻��ѹ��ҵ�ڳ��һЩ��еķ��ģ��С��ģ��ͨ��ڵȷ�ʽ��ǰ�ģ�ֻ��ע��ƣ�ͨ��ĵĽ�� RAG��ǿ��ɣ��ֻ��Բ��ע��Ƶȵȡ�

��Щ��ʽ��Ȼ��Ĵ��ڳ��ȣ��ģ�͵��ܾ��в�ͬ�̶ȵ��𺦡��֮��Ƕ��ͨ��ģ��ȡ��Ĵ��ڳ��ȣ��ģ��޷��ȫ��Ϣ�ش��⣬��Կ��ı��ۺϿ��Ǵ𰸵ȡ�

��ΰٴ�� Baichaun2-192K ͨ��㷨�͹��̵ļ��Ż��ʵ��˴��ڳ��Ⱥ�ģ��֮��ƽ�⣬��˴��ڳ��Ⱥ�ģ��ܵ�ͬ��

�㷨��棬�ٴ��һ�� RoPE �� ALiBi �Ķ�̬λ�ñ��Ʒ��÷��ܹ��Բ�ͬ�ֱ��ʵ� ALiBi_mask ��в�ͬ�̶ȵ� Attention-mask ��̬�ڲ壬�ڱ�֤�ֱ��ʵ�ͬʱ��ǿ��ģ�ͶԳ��Ľ�ģ��

��̷��棬��ķֲ�ʽѵ��ܻ��ϣ��ٴ��Ŀǰ�г��Ƚ��Ż��С��ˮ��С��в��С��ؼ��Լ� Offload ��ܵȣ��һ��ȫ�� 4D ��зֲ�ʽ��÷��ܹ��ݾ��ĸ��Զ�Ѱ��ʺϵķֲ�ʽ��ԣ��ؽ��˳��е��Դ�ռ�á�

��ģ��֮ս��ٶ�Ҫ��

��ڽ�� 4 �µİٴ��ܣ��˵��ҵ�ڼ��Ĵ�ģ�ʹ�ҵ��˾��ڳ��ʱ����ҹ�˾��Ѿ�� Baichuan-7B/13B��Baichuan2-7B/13B �ĿԴ��õĴ�ģ�ͣ��Լ� Baichuan-53B��Baichuan2-53B ��Դ��ģ�͡�

ƽ��ÿ��¾ͷ��һ��µĴ�ģ����

Baichuan ϵ�д�ģ��ں��ͼ��⡢��Ϣ��Լ�ǿ��ѧϰ��мල΢��ͼ��룬��֪ʶ�ʴ��ı��ͻ��Щ��ģ��Ҳ��Ϊ��ҵ�ڱ��Baichuan ϵ�п�Դģ��ڸ��Դ��ۻ��ͻ��Σ�Baichuan 2 ��ڸ�ά��ȫ�� Llama 2��й��Դ��̬��չ��

8 �� 31 �գ��ٴ��ͨ��ʽ�˹��ܷ��а취�� 8 �ҹ�˾��Ψһһ�ҽ��괴��Ĵ�ģ�͹�˾��9 �� 25 �գ��ٴ��ܿ�� Baichuan API �ӿڣ��ʽ�� To B ��򣬿��ҵ��̡�

��˵���Ӽ��з��أ��ٴ��ٶȶ��㹻����

�ոշ�� Baichuan2-192K �Ѿ��ʽ��ڲ⣬�� API ��õķ�ʽ��Ÿ��ĺ��顣�ٴ��ʾ��Ѿ��ƾ��ý�弰��ʦ��Ȼ��˺�� Baichuan2-192K ��ȵĳ��Ӧ�õ��˴�ý��ڡ��ɵȾ��峡��У��ú�� API ��ú�˽�л��ķ�ʽ�ṩ��ҵ�û��

�� API ��ʽȫ�濪��֮��Baichuan2-192K �ܹ��ֱ��Ƚ�ϣ��ǵĹ��ѧϰ�з��ã��ҵ�û��Ч�ʡ�Baichuan2-192K �ܹ�һ��Դ��ͷ��ҳ�Ĳ��ϣ��ڳ�ƪ�ĵ��ؼ��Ϣ��ȡ��ĵ�ժҪ��ĵ��ˡ��ƪ��»򱨸��д��ӱ�̸��ʵ��о޴��á�

��ǰ��ٴ��ܴ�ʼ�ˡ�CEO ��С��͸¶����°��꣬�ٴ��Ƴ�ǧ�ڼ��Ĵ�ģ�ͣ��Ԥ�ƻ�� C �˵ĳ��Ӧ�ò����

�� OpenAI �Ĳ�࣬��С��̹�ԣ��뷽��Ǻ� OpenAI ȷʵ��ڲ�࣬OpenAI ��Ŀ��̽��ܵ��컨�壬��ϣ��Ƴ�� 1000 �� GPU ��һ��ļ��ǣ��Ӧ�÷��Ǳ��ߵø��죬��ʱ��Ӧ�ú��̬�ľ��飬��ߵĸ��Ҳ��Զ��԰ٴ��ģ�͵������һ��Ͽ����

�ɴ��Baichuan2-192K ��չ��ȫ����Ĵ��Ҳ��ٰٴ��ܴ�ģ�ͼ��صĽ��̡�

��ԣ�https://www.toutiao.com/article/7296374673758093887/?app=news_article&timestamp=1698842351&use_new_style=1&req_id=202311012039106BF57585B089182257A0&group_id=7296374673758093887&share_token=136F61E2-1379-4897-994A-CAA4DEDF6127&tt_from=weixin&utm_source=weixin&utm_medium=toutiao_ios&utm_campaign=client_share&wxshare_count=2&source=m_redirect