��ģ��߸��֪-��ģ��֪֮��

1. ѵ��ģ�ͺ�ѵ��ͨ��ģ��ȫ��¡�Ŀǰ��ڵĴ�ģ��ֻ��˵ѵ��ˣ��ѵ��ԶԶ��Ǽ��ݣ��˵��Ǹ��¶��Ǵ󳧱��Ӧ��ܾ߱��ʲôֵ�ý��¡�

2. �߱�ͨ��Ĵ�ģ�ͣ��Ų��ܲ��GPT3.5��175B��GPT4��1.8T��Ǳ�Ҫ��ģ�ĸ��Ҳ��ֽ׶γ�OpenAI��ҵ��ƿ��ڡ�

3. ��ƿ��ϣ��Һܱ��Ϊ��оƬ��ı��ݡ��Ϊ��鼮��ģ��鼮��

4. �ֽ׶Σ��ؼ��ǰ��ȥ��糤�ı��ģ��Ż��Ӧ�ó��Щһ�㶼��ؼ��ٶ��г�Ϣ��ҵ��˵��ֻ��Ӧ�þ��ˡ�

5. ��llama2 finetuneˢ��岻��ض��ݼ��ˢ�ñ�GPT-4�߲��˵��κ��⡣�û�һ��Ȼ�Ǹ��ϡ��ǹ��ڳ��Ц��ǰ�c-eval��ݶ��ѵ��棬Ȼ��c-eval��ˢ�񣬸��ֵ��GPT��Ϊ��оƬ��ٵ��ʲ�࣬�ù��ϲ��࣬��ΪGPT-4��û��ʲô��ݣ��ڳ��Ѿ��ܽӽ��ˡ��ʵ�ǣ��GPT4��100�ֵĻ��Ĵ�ģ��ø�10��Ѿ��ո��ˡ�

6. ֪ʶ��ܲ��Ǹ��£�GPT4��᷸ɵ�ƴ��֮�⣬��ٷ�ɵ�ƴ��󡣶��ģ��Ҫǿ̫��̫�࣬��п��ر�Ľ�ģ��ʽ��ǲ��rlhf��档

7. ��ѧ��Ҳ��߿��⡣��ѧֱ��Ƶ��֤��Ŀǰ��ֻ��GPT4�Ͽ��ӵ��ѧֱ��֤��Ƿȱ��

8. ��Ǵ�ģ��Ҫ��ǵ��飬��ģ��Ҫ��ٵ��⣬��໹û��Ŀ�ѧ��ȥ��չ��ܣ��ҵ��ҵ�ƻ��Ż��г��ã��Ὠ��ȫ��ϵ�ȵȣ��ﵽǧ��һtoken��Ч��ֻ��û��죬roi��

9. ֻ׷��roi��ɾͲ��ΰ��ҵ��

10. �ڹ��llm��ʵ��Ϊ��¶�̫��̫�ڣ�Ŀǰ��Ҷ�û̫��Ϣ��Ԥ��ڲ��̫�õĳɹ��Ҳ�ǳ��ڴ��

11. ��Ҫ��˼��ڹ�ȥ��work��뷨��Ҳ��ڴ�ģ��¿��³��ԣ�˵��work�ˣ��Сģ��work��뷨��Ҳ��һ��ģ֮��Ͳ��work�ˡ�ԭ��ܼ򵥣��ȥ��work��Ҳ��ֻ��ģ��޷��ǵ�Ԥ��ȥ��ϣ��ȥһЩͨ��prior�ķ�ʽ��ģ��ڲ��ȥ֮��ܷ��Լ��ģ�͡�

12. ��ֻ��һ��ͶӰ��δ��Ƕ�ģ̬��һ��ϣ�OpenAI��ú��ȫ��ż��ȴ��ߵñ��κ��˶�Ҫ�졣��ģ�ͻ��ں�ͷ��

13. �ڸ�У��ǹ��ڸ�У��Ĺ��ˣ��л��Ļ��ǽ��ģ��ˢ��֪��

��ΰ��ĸ��

��ݹ�AI��չ��ʮ��޷�4��ڶ��AlexNet��ResNet��Transformer��GPTϵ�С�

AlexNet��һ��֤��ڲ��ϵĹ�ģЧӦ��Ilya��Ҳ�ڹ��ɷ��б�ʾ�⹤��ǿ��

ResNet��ڹ�ģ��ϵ�ƿ��ʹ��д�ҵ��ڸ��Residual Connection��ǳ��ϲ�work��˵��Ӱ��ResNet��ΰ�󣬽��ƿ��⣬��AIʷ�ϵĴ��⡣

Transformer��ڹ�ϵ��ģ�ϵ�ƿ��ΰ��ṹ��û��֮һ��

GPTϵ�У��ݹ�ģ��ƿ��֤��ݹ�ģЧӦ��ͬʱ��Ͳ��˵߸��֪�Ĺ�ģ��

��ῴ��ɷ塱�ĵ��

��ҵ�ߴ�Ŷ�֪��LeCun��NIPS 2016�ϵĵ��Ƚ��޼ල��мල��ǿ��ѧϰ��

��һ��ѵ���Ļ�

1. �޼ල�ǵ��ߣ�ÿ��д��ල�źţ��Ԥ��һ֡��ض��Ǽල�źźţ�Ԥ��һ��ʣ�һ�仰��token��Ǽල�źţ�һ��Ҫ�ǵ��ߣ�

2. �мල��ɿ��Ƥ��ÿ��һСЩ�ල�źţ��࣬�ල�ź��һ��ܳԵ��Ƥ��٣�

3. ǿ��ѧϰ��Сӣ�ң�ÿ��ֻ�п��һ��ල�źţ��ල�źž��һ��Scalar��Q value�� V value��һ��һ��Сӣ�ң�

��ǣ��û��ֻ��һ��ܹ��ĵ��⡣��Ǹ�ӣ�ң��ܲ��ǵ��ü�Ǯ�Ĺؼ��

��죬��ǿ��OpenAI̽��LLMѵ��̣��޼ලԤѵ��мල��룬��ǿ��ѧϰ��΢��ģ�ͣ�ѵ��˵��ΰ��ǿ��ģ�͡�

ͬ��ǵ��LeCun��ѵ��ɵ����ǰ�LLM��ɵ����

1. �޼ල�ǵ��ߣ��һ��ҪӪ��

2. �Լල�ǵ��Ƥ��õ��Ӿ��ζ��ƫ��

3. ǿ��ѧϰ��ӣ�ң��Ʒ�ʺ͵��

��Pipeline��OpenAI��ѵ��LLM��ѵ��ϷAI��ǣ�https://arxiv.org/pdf/2206.11795.pdf

��ģ��Ϊʲô�߱��˸�Ч��ѧϰ��

��ǿ��ģ��Ԥѵ��ʱ�򣬶��ѧϰЧ��쳣�ĸߣ�ͨ��One-pass or Two-pass�Ͱ��ݸ�ѧ��ˡ�GPT4��й�ܱ��Ҳ�ᵽ�ˣ��ı��ֻ��飬��code��ݹ��4�顣

��ô��ģ�ͣ��ô��ɶȣ��Ӧ��ѵ��Ч�ʺܵͲŶ��

��һ��˸��Ƕ��һ�£�

��һ��1�ڲ��ģ�ͣ�һ�η��ֻ��1�ڸ��Ҳ��˵��һ�ڸ��¼ÿ�η��

��һ��ڲ��ģ�ͣ�һ�η��1�򱶲��ȥ��¼��1��Сģ�ͣ�ʵ��֮��1��ģ��Ѿ��1w�η��

��log��۹⿴��⣬��exp��ֶ��о��

��ȥ��ǹ۲�loss��ߵ�ʱ�򣬺��׵õ��ۣ�lossƽ�ˣ��Ѿ�ѧ��ˡ��ǽ��OpenAI��ǣ��ʱ��ȡһ��log��loss��Ȼ��ֱ��»��

��ȥ��ǿ��ʵ�飺��һ��ã��ã��û�н�һ��ˡ��Ի��Ŷ��ǽ��OpenAI��ǣ�ָ��ӣ�loss��½��β�ָ��ӿ��

U-shape��

��ʱ��Ѷȷּ��Ҫ��ܻ��U-shape��壺��ģ�Ͳ��ӣ��ĳЩtask�ϵı��֣��Ƚ��

��Ҫԭ��ǣ�ĳЩtask��ƭģ�ͣ�

1. �еȲ��ģ�Ϳ��⣬��壬��ѡ�ش��⣻

2. С��ģ�Ϳ��Ҳ��壬��Ҳ£�

3. ��ģ�ͣ��⣬Ҳ��壬��⡣

�� VS GPT

��Ա�

ǰ��ʱ��֪��ѧ��ͬѧ��˽⵽��Դ�Լ��860�ڣ�86 B��Ԫ��Ե��пֲ��1��(100 T)��ѧ��ͨ��Ϊ��Ӵ��ų��ڼ��䡣��Ӷ�Ӧ��˹��еĲ��ǿ��ģ��GPT-4�д�Լ1.8T��Ҳ��˵��Եġ��Զ��ڵ��ǿ�Ĵ�ģ�ͣ��50��ϣ��ӽ��

��ǣ��ġ�֪ʶ��ȴԶ��GPT-4��ô��ô��Ĳ��Զ��ʲô�ˣ��һ��ֵ��˼��⡣

�ѵ��ġ��ܡ��Embodied AI��ͻ��˲��ӣ�

�ֻ��ǣ��ﵽ��ˮƽ��д��Ҫ��Ѿ��󲿷ֵ��ӣ�

��̬�� VS ��̬��

��֪��Transformer��ʼ��һ�̣��Ѿ��ˣ��ѵ��ı��Ǹ��Ԫ֮��ӹ�ϵ��ѵ��ֻ�ǵ��е��ӵ�Ȩ�ء�Ҳ��˵Transformer�Ĳ��Ǿ�̬�ġ�

��ǣ��˾Ͳ�һ��ˣ��Ե��ӻ��ӻ��١��ڻ��ʱ��ͻ��ӡ��Ķ��ʱ��ڹ��ӣ��ڹ��ʱ�򹹽��ӣ��ʱ�޿̶��ڹ��ӡ��Ȼ�ˣ�ͬʱҲ��ɾ��һЩ��ӣ�Ҳ��

��ô��˹��Ƿ��serving��ӡ��ӡ�Ҳ��Ӳ��أ��ǿ��ʷcontext��ͽ�ȥ��һ�飬��ʵʵ��ڵ�д��档

��Ե��Ȩ��

��Ե��Ȩ��һ˵�𣿻��˵��binary�ģ�ֻ��ͨ�Ͳ�ͨ��𣬶�û��ǿ��֮�֣��Ҳ��һ��֪��ѧ��˽��

�õ��һ��˼��GPT

��һ�ε�����˼��һ��LeCun�ĵ��ժ¼��£�

��ῴ��ɷ塱�ĵ��
��ҵ�ߴ�Ŷ�֪��LeCun��NIPS 2016�ϵĵ��Ƚ��޼ල��мල��ǿ��ѧϰ��
��һ��ѵ��Ļ�
�޼ල�ǵ��ÿ��д��ල�źţ��Ԥ��һ֡��ض��Ǽල�źźţ�Ԥ��һ��ʣ�һ�仰��token��Ǽල�źţ�һ��Ҫ�ǵ��ߣ�
�мල��ɿ��Ƥ��ÿ��һСЩ�ල�źţ��࣬�ල�ź��һ��ܳԵ��Ƥ��٣� ǿ��ѧϰ��Сӣ�ң�ÿ��ֻ�п��һ��ල�źţ��ල�źž��һ��Scalar��Q value�� V value��һ��һ��Сӣ�ң�

��ǣ��û��ֻ��һ��ܹ��ĵ��⡣��Ǹ�ӣ�ң��ܲ��ǵ��ü�Ǯ�Ĺؼ��
��죬��ǿ��OpenAI̽��LLMѵ��̣��޼ලԤѵ��мල��룬��ǿ��ѧϰ��΢��ģ�ͣ�ѵ��˵��ΰ��ǿ��ģ�͡�
ͬ��ǵ��LeCun��ѵ��ɵ��⣬��ǰ�LLM��ɵ��⣺
�޼ල�ǵ��ߣ��һ��ҪӪ��
�Լල�ǵ��Ƥ��õ��Ӿ��ζ��ƫ��
ǿ��ѧϰ��ӣ�ң��Ʒ�ʺ͵��
��Pipeline��OpenAI��ѵ��LLM��ѵ��ϷAI��ǣ�https://arxiv.org/pdf/2206.11795.pdf

��죬��ල�ܶ�: ��һ��һ��ѧϰ�㷨��㷨��ѧϰ��ʱ��̵ļල�ܶȣ��ල�ź�� ٸ��ӣ�

1. ��224x224ͼ��񣬼ල�ܶ��1/(224x224)

2. ͼ��ָ�ļල�ܶȿ��Ϊ��1

3. bert�е�mlm loss��Ϊ��0.15��Ϊ��mask��15��ֻ��ⲿ��мල�ź�

�ල�ܶ�Ϊ1�Ƿǳ��ܿɹ�ģ�ͼ��ָ�ļල�ܶ��ȻҲ��1��Ǳ�ע�ǳ��

��Ǵ��û�з��֣�GPT�ļල�ܶȾ��1��ÿ��token��мල��ļල�ź��Դ��һ��token��һ��token��˷ѣ��Ϊ��ļල�ź��end token��Ҹ��˹��ǣ��ı�ע��ѣ��ݵ��һ�̣��Ѿ��˼ල�źţ�ֻ��ල�źţ���в��ġ�

��Ϊͬ��£��ල�ܶ�Խ�ߵ��㷨ѧϰ��Ч��ôGPT��ѧϰЧ�ʸߣ��޴��ޱȡ�

Ѱ��ƿ��ؽ��

DALL-E 3��paper��ˣ�ȫ��ڸ��ǣ��һ��ķ�ʽ��ͼ��caption��һ�飬��ô��֮��õ��ȡ֮��֮��ߵĸ��ݡ�Ȼ�󵱽��ǿ��ͼģ�;͵��ˡ�

Ҳ��˵һֱ��ݶ��ƿ��OpenAI�ҵ��˳ɱ��߰취��

��ǣ��ƿ��ҵ��ҵ�ߵ�common sense��Ϊʲô��ƿ��OpenAI��

��Laion��ݼ��ʱ��о��߾��Ѿ��ģ��caption��õ��˺�promising�Ľ��ۣ�ȴû��ø�ϸ��Щ��ȥ��ɷǳ�detail�ĳ��ı��

��죬��˵��ǣ��Ƿ��ҵ��ƿ��ڽ��ҵƿ��ô��Ѿ��ǹ��Ѿ��ޱȵĸߣ��ǰ��ޱ�ϸ�£��ǹ��ܽ��ʷ�ᡣ

��һ��ϵ�Ӱ��͸��ˡ��棬һλ��ͨ��о�Ա��ʵ��˷ܵ�˵��ҵ��ҵ�B��C�ˣ��
��ͬ��ʵ��ʲô��B��C��
��λ�о�Ա�ش�˵��ҵ��ʦ��˵��ſ��Դ�A(ʵ��)ֱ�ӵ��D��ͨ��Ҫ��B��C��ܵ��D��Ҳ��ţ��Ѿ��ҵ��ҵ�B��C��

��죬��ģ̬�Ľ�չ��ʮ��ǰ��Ŷθ��ӡ��̡�

��Ŵ�clip��ҿ��Ի�õ�һ��֪�ǣ�����ƿ��ȥ��ģ̬��work��Ϊ��Ȼ�ˣ�Ҳ��˹�ȥ��һ��ģ�͵��Լ�ʵ��ۼ��û��塣��clip��һ��𣬹�ȥ��һ�ж�ģ̬�Ĺ��Ͽ��һ��㡣��죬��Ȼ��ƿ��

��Ŵ�blip��ҿ��Ի�õ�һ��֪�ǣ�����ƿ��ģ��ϴ��ݿ��Ч��ȻLAION�Ŷ�֪��ƿ��LAION�ĺ��汾��󣬶��Ҷ��ģ�͸��ע��

�õģ��Ӵ˴�Ҷ�֪����������ƿ��ˣ��ͼ�Ķ��롢ͼ��Ļ��ͼ��

ǿ��LAION�Ŷӣ��ҵ��B��C��Ǿ��ν��õ�ǰSOTAģ��Caption��

��ǿ��о��壬��ҵ��D��Ǿ��detail caption��ǲ��detail caption��롣��֪��ô��detail caption��ô��ͨcaption��ע��֪ʶ��ԡ��detail caption��עע��bias��ѵ��ͼ��ģ�ͣ��ͼ��ģ����ѵ��ͼģ�͡�

��ǻ��֪��ԭʼ��detail caption��ݼ��ô��ģ��Ѿ��D�ˣ��ŵ�˵��

��ͬ��ݼ��ѵ��㹻��ʱ�䣬��ÿ��㹻��ѵ��ʱ��ģ�Ͷ��ͬһ��ϡ��㹻��diffusion conv-unets�ɵ�ͼ��ViT��ɵ�ͼ��ͬ��AR sampling��ɵ�ͼ��ɢģ��ͬ��

��һ��˾��ȵ�insight��ζ��ģ�͵��Ϊ��ɼܹ��Ż��ѡ��ģ��ݼ��һ��ֻ��Ϊ��Ч�ؽ��ƽ��ݼ��

��ԣ�https://nonint.com/2023/06/10/the-it-in-ai-models-is-the-dataset/

��Ȼ�ˣ��ϻ��һ��ά�ȵ��о��ߣ��о��ص㶼��B��C��D�ϡ�

��ΰ����ĸ�����

���ῴ�����ɷ塱�ĵ������

��ģ��Ϊʲô�߱���˸�Ч��ѧϰ����

��log���۹⿴�����⣬��exp���ֶ��о�����

U-shape����

���� VS GPT

�������Ա�

��̬������ VS ��̬������

���Ե�������Ȩ����

�õ��������һ������˼��GPT

Ѱ��ƿ��������������ؽ��