| A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | AA | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Actual figures key data | ||||||||||||||||||||||||||
2 | Model | GPT-2 | GPT-3 | GPT-4 | |||||||||||||||||||||||
3 | Release date | Feb-2019 | June-2020 | March-2023 | |||||||||||||||||||||||
4 | Spent on training run compute/m$ | 0.04 | 2 | 40 | |||||||||||||||||||||||
5 | FLOP on training run | 4E+21 | 3E+23 | 2E+25 | |||||||||||||||||||||||
6 | Algo efficiency (normalised to GPT-4 in 2023) | 0.02 | 0.07 | 1 | |||||||||||||||||||||||
7 | Effective FLOP on training (norm to GPT-4) | 6E+19 | 2E+22 | 2E+25 | |||||||||||||||||||||||
8 | Increase in effective FLOP vs. previous model | 325 | 948 | ||||||||||||||||||||||||
9 | Increase in effective FLOP from GPT 2 to 4 | 307,733.45 | |||||||||||||||||||||||||
10 | |||||||||||||||||||||||||||
11 | Projections based on trend lines from 2023 (i.e. assuming no major disruptions) | ||||||||||||||||||||||||||
12 | Year | 2020 | 2021 | 2022 | 2023 | 2024 | 2025 | 2026 | 2027 | 2028 | 2029 | 2030 | 2031 | 2032 | Comments | ||||||||||||
13 | Dollars spent on largest training run compute/m$ | 2.56 | 6.4 | 16 | 40 | 110 | 303 | 832 | 2288 | 6291 | 17300 | 47576 | 130834 | 359794 | Projected at 2.75/year from 2023 | ||||||||||||
14 | FLOP on largest training run | 2E+23 | 1E+24 | 4E+24 | 2E+25 | 8E+25 | 3E+26 | 1E+27 | 5E+27 | 2E+28 | 8E+28 | 3E+29 | 1E+30 | 5E+30 | Projected at 4x/year from 2023 | ||||||||||||
15 | Algorithmic efficiency - normalised to 2023 GPT-4 | 0.04 | 0.1 | 0.3 | 1 | 3 | 9 | 27 | 81 | 243 | 729 | 2187 | 6561 | 19683 | Projected at 3x/year | ||||||||||||
16 | Effective FLOP on largest run - normalised to 2023 GPT-4 | 8E+21 | 1E+23 | 1E+24 | 2E+25 | 2E+26 | 3E+27 | 3E+28 | 4E+29 | 5E+30 | 6E+31 | 7E+32 | 9E+33 | 1E+35 | |||||||||||||
17 | Increase vs GPT-4 | 4.1E-04 | 5.5E-03 | 7.4E-02 | 1.0E+00 | 1.2E+01 | 1.4E+02 | 1.7E+03 | 2.1E+04 | 2.5E+05 | 3.0E+06 | 3.6E+07 | 4.3E+08 | 5.2E+09 | |||||||||||||
18 | Equivalent to a model of size | GPT-4 | GPT-5 | GPT-6 | GPT-7 | ||||||||||||||||||||||
19 | |||||||||||||||||||||||||||
20 | |||||||||||||||||||||||||||
21 | Efficiency of training chip FLOP per dollar | 9E+16 | 2E+17 | 3E+17 | 5E+17 | 7E+17 | 1E+18 | 2E+18 | 2E+18 | 3E+18 | 5E+18 | 7E+18 | 1E+19 | 1E+19 | |||||||||||||
22 | Increase in FLOP per dollar | 1.8 | 1.8 | 1.8 | 1.5 | 1.5 | 1.5 | 1.5 | 1.5 | 1.5 | 1.5 | 1.5 | 1.5 | ||||||||||||||
23 | |||||||||||||||||||||||||||
24 | |||||||||||||||||||||||||||
25 | Effective training FLOP | Training FLOP | Training cost/bn | Parameters/ trillions | Tokens of data/trillions | ||||||||||||||||||||||
26 | GPT-4 | 2E+25 | 2E+25 | $0.1 | 2 | 10 | |||||||||||||||||||||
27 | GPT-5 | 1E+28 | 1E+27 | $2 | 17 | 84 | |||||||||||||||||||||
28 | GPT-6 | 6E+30 | 1E+29 | $20 | 140 | 700 | |||||||||||||||||||||
29 | GPT-7 | 3E+33 | 7E+30 | $200 | 1171 | 5857 | |||||||||||||||||||||
30 | |||||||||||||||||||||||||||
31 | |||||||||||||||||||||||||||
32 | |||||||||||||||||||||||||||
33 | |||||||||||||||||||||||||||
34 | |||||||||||||||||||||||||||
35 | |||||||||||||||||||||||||||
36 | |||||||||||||||||||||||||||
37 | |||||||||||||||||||||||||||
38 | |||||||||||||||||||||||||||
39 | |||||||||||||||||||||||||||
40 | |||||||||||||||||||||||||||
41 | |||||||||||||||||||||||||||
42 | |||||||||||||||||||||||||||
43 | |||||||||||||||||||||||||||
44 | |||||||||||||||||||||||||||
45 | |||||||||||||||||||||||||||
46 | |||||||||||||||||||||||||||
47 | |||||||||||||||||||||||||||
48 | |||||||||||||||||||||||||||
49 | |||||||||||||||||||||||||||
50 | |||||||||||||||||||||||||||
51 | |||||||||||||||||||||||||||
52 | |||||||||||||||||||||||||||
53 | |||||||||||||||||||||||||||
54 | |||||||||||||||||||||||||||
55 | |||||||||||||||||||||||||||
56 | |||||||||||||||||||||||||||
57 | |||||||||||||||||||||||||||
58 | |||||||||||||||||||||||||||
59 | |||||||||||||||||||||||||||
60 | |||||||||||||||||||||||||||
61 | |||||||||||||||||||||||||||
62 | |||||||||||||||||||||||||||
63 | |||||||||||||||||||||||||||
64 | |||||||||||||||||||||||||||
65 | |||||||||||||||||||||||||||
66 | |||||||||||||||||||||||||||
67 | |||||||||||||||||||||||||||
68 | |||||||||||||||||||||||||||
69 | |||||||||||||||||||||||||||
70 | |||||||||||||||||||||||||||
71 | |||||||||||||||||||||||||||
72 | |||||||||||||||||||||||||||
73 | |||||||||||||||||||||||||||
74 | |||||||||||||||||||||||||||
75 | |||||||||||||||||||||||||||
76 | |||||||||||||||||||||||||||
77 | |||||||||||||||||||||||||||
78 | |||||||||||||||||||||||||||
79 | |||||||||||||||||||||||||||
80 | |||||||||||||||||||||||||||
81 | |||||||||||||||||||||||||||
82 | |||||||||||||||||||||||||||
83 | |||||||||||||||||||||||||||
84 | |||||||||||||||||||||||||||
85 | |||||||||||||||||||||||||||
86 | |||||||||||||||||||||||||||
87 | |||||||||||||||||||||||||||
88 | |||||||||||||||||||||||||||
89 | |||||||||||||||||||||||||||
90 | |||||||||||||||||||||||||||
91 | |||||||||||||||||||||||||||
92 | |||||||||||||||||||||||||||
93 | |||||||||||||||||||||||||||
94 | |||||||||||||||||||||||||||
95 | |||||||||||||||||||||||||||
96 | |||||||||||||||||||||||||||
97 | |||||||||||||||||||||||||||
98 | |||||||||||||||||||||||||||
99 | |||||||||||||||||||||||||||
100 |