A | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | V | W | X | Y | Z | AA | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Model Name | #Parameters (Millions) | Model Size (MB) | Model Performance/Size Ratio | GLUE Datasets | |||||||||||||||||||
2 | GLUE Score | CoLA | SST-2 | MRPC | STS-B | QNLI | QQP | MNLI-m | MNLI-mm | RTE | WNLI | |||||||||||||
3 | Matthew's | Accuracy | F1 | Accuracy | Pearson | Spearman | Accuracy | F1 | Accuracy | Accuracy | Accuracy | Accuracy | Accuracy | |||||||||||
4 | BERT Models | |||||||||||||||||||||||
5 | BERT-base | 109 | 389.71 | 0.706 | 77.0 | 52.1 | 93.5 | 88.9 | 85.8 | 90.5 | 71.2 | 84.6 | 83.4 | 66.4 | 53.5 | |||||||||
6 | BERT-large | 334 | 1187.84 | 0.241 | 80.5 | 60.5 | 94.9 | 89.3 | 85.4 | 87.6 | 86.5 | 92.7 | 72.1 | 89.3 | 86.7 | 85.9 | 70.1 | 65.1 | ||||||
7 | DistilBERT | 66 | 235.97 | 1.115 | 73.6 | 45.8 | 92.3 | 87.6 | 83.1 | 71 | 71 | 88.8 | 69.6 | 88.2 | 81.6 | 81.3 | 54.1 | 65.1 | ||||||
8 | TinyBERT | 66 | 235.97 | 1.183 | 78.1 | 51.1 | 93.1 | 87.3 | 82.6 | 85 | 83.7 | 90.4 | 71.6 | 89.1 | 84.6 | 83.2 | 70 | 65.1 | ||||||
9 | ||||||||||||||||||||||||
10 | RoBERTa Models | |||||||||||||||||||||||
11 | RoBERTa-base | 125 | 0.691 | 86.3 | 63.6 | 94.8 | 90.2 | 91.2 | 92.8 | 91.8 | 87.6 | 78.7 | ||||||||||||
12 | RoBERTa-large | 355 | 796.14 | 0.248 | 88.1 | 67.8 | 96.7 | 92.3 | 89.8 | 92.2 | 91.9 | 95.4 | 74.3 | 90.2 | 90.8 | 90.2 | 88.2 | 89 | ||||||
13 | ||||||||||||||||||||||||
14 | ALBERT Models | |||||||||||||||||||||||
15 | ALBERT-base | 12 | 42.6 | 6.986 | 83.8 | 65.1 | 92.9 | 88.0 | 86.0 | 87.2 | 86.7 | 89.7 | 69.9 | 85.3 | 84.6 | 84.1 | 86.5 | |||||||
16 | ALBERT-large | 18 | 64.15 | 4.760 | 85.7 | 66.6 | 94.9 | 90.0 | 87.8 | 89.1 | 88.6 | 91.7 | 71.5 | 87.2 | 86.5 | 85.9 | 88.4 | |||||||
17 | ALBERT-xxlarge | 235 | 789.89 | 0.379 | 89.2 | 69.1 | 97.1 | 93.4 | 91.2 | 92.5 | 92 | 95.2 | 74.2 | 90.5 | 91.3 | 91 | 89.2 | 91.8 | ||||||
18 | ||||||||||||||||||||||||
19 | ELECTRA Models | |||||||||||||||||||||||
20 | ELECTRA-small | 14 | 48.29 | 5.707 | 79.9 | 64.1 | 86.8 | 81.1 | 82.7 | 85.6 | 81.2 | 81.6 | 79.8 | 82.7 | ||||||||||
21 | ELECTRA-base | 110 | 385.76 | 0.774 | 85.1 | 68.3 | 92.4 | 86.3 | 88.1 | 91.2 | 86.4 | 86.9 | 85.0 | 88.1 | ||||||||||
22 | ELECTRA-large | 334 | 1187.84 | 0.268 | 89.4 | 71.7 | 97.1 | 90.7 | 92.5 | 95.8 | 90.8 | 91.3 | 89.3 | 92.5 | ||||||||||
23 | ||||||||||||||||||||||||
24 | MiniLM Models | |||||||||||||||||||||||
25 | MiniLM-L6xH384 | 22 | 46.4 | 3.644 | 80.2 | 47.5 | 91.5 | 88.9 | 90.5 | 90.6 | 83.3 | 68.8 | ||||||||||||
26 | MiniLM-L12xH384 | 33 | 67.7 | 2.523 | 83.3 | 58.5 | 93 | 89.5 | 91.5 | 91.3 | 85.7 | 73.3 | ||||||||||||
27 | ||||||||||||||||||||||||
28 | T5 Models | |||||||||||||||||||||||
29 | T5-small | 60 | 231 | 1.290 | 77.4 | 41 | 91.8 | 89.7 | 86.6 | 85.6 | 85 | 90.3 | 70 | 88 | 82.4 | 82.3 | 69.9 | 69.2 | ||||||
30 | T5-base | 220 | 779.42 | 0.376 | 82.7 | 51.1 | 95.2 | 90.7 | 87.5 | 89.4 | 88.6 | 93.7 | 72.6 | 89.4 | 87.1 | 86.2 | 80.1 | 78.8 | ||||||
31 | T5-large | 770 | 2764.8 | 0.112 | 86.4 | 61.2 | 96.3 | 92.4 | 89.9 | 89.9 | 89.2 | 94.8 | 73.9 | 89.9 | 89.9 | 89.6 | 87.2 | 85.6 | ||||||
32 | T5-3B | 2800 | 24576 | 0.032 | 88.5 | 67.1 | 97.4 | 92.5 | 90 | 90.6 | 89.8 | 96.3 | 74.4 | 89.7 | 91.4 | 91.2 | 91.1 | 89.7 | ||||||
33 | T5-11B | 11000 | 40960 | 0.008 | 90.3 | 71.6 | 97.5 | 92.8 | 90.4 | 93.1 | 92.8 | 96.9 | 75.1 | 90.6 | 92.2 | 91.9 | 92.8 | 94.5 | ||||||
34 | ||||||||||||||||||||||||
35 | ||||||||||||||||||||||||
36 | ||||||||||||||||||||||||
37 | ||||||||||||||||||||||||
38 | ||||||||||||||||||||||||
39 | ||||||||||||||||||||||||
40 | ||||||||||||||||||||||||
41 | ||||||||||||||||||||||||
42 | ||||||||||||||||||||||||
43 | ||||||||||||||||||||||||
44 | ||||||||||||||||||||||||
45 | ||||||||||||||||||||||||
46 | ||||||||||||||||||||||||
47 | ||||||||||||||||||||||||
48 | ||||||||||||||||||||||||
49 | ||||||||||||||||||||||||
50 | ||||||||||||||||||||||||
51 | ||||||||||||||||||||||||
52 | ||||||||||||||||||||||||
53 | ||||||||||||||||||||||||
54 | ||||||||||||||||||||||||
55 | ||||||||||||||||||||||||
56 | ||||||||||||||||||||||||
57 | ||||||||||||||||||||||||
58 | ||||||||||||||||||||||||
59 | ||||||||||||||||||||||||
60 | ||||||||||||||||||||||||
61 | ||||||||||||||||||||||||
62 | ||||||||||||||||||||||||
63 | ||||||||||||||||||||||||
64 | ||||||||||||||||||||||||
65 | ||||||||||||||||||||||||
66 | ||||||||||||||||||||||||
67 | ||||||||||||||||||||||||
68 | ||||||||||||||||||||||||
69 | ||||||||||||||||||||||||
70 | ||||||||||||||||||||||||
71 | ||||||||||||||||||||||||
72 | ||||||||||||||||||||||||
73 | ||||||||||||||||||||||||
74 | ||||||||||||||||||||||||
75 | ||||||||||||||||||||||||
76 | ||||||||||||||||||||||||
77 | ||||||||||||||||||||||||
78 | ||||||||||||||||||||||||
79 | ||||||||||||||||||||||||
80 | ||||||||||||||||||||||||
81 | ||||||||||||||||||||||||
82 | ||||||||||||||||||||||||
83 | ||||||||||||||||||||||||
84 | ||||||||||||||||||||||||
85 | ||||||||||||||||||||||||
86 | ||||||||||||||||||||||||
87 | ||||||||||||||||||||||||
88 | ||||||||||||||||||||||||
89 | ||||||||||||||||||||||||
90 | ||||||||||||||||||||||||
91 | ||||||||||||||||||||||||
92 | ||||||||||||||||||||||||
93 | ||||||||||||||||||||||||
94 | ||||||||||||||||||||||||
95 | ||||||||||||||||||||||||
96 | ||||||||||||||||||||||||
97 | ||||||||||||||||||||||||
98 | ||||||||||||||||||||||||
99 | ||||||||||||||||||||||||
100 |