Top 100 GPT2-small token distance lists

Top 100 GPT2-small closest-to-centroid tokens

Token: ' externalToEVA'                   Index:  30212           Distance: 1.5305222272872925

Token: '�'                                Index:  187             Distance: 1.5314713716506958

Token: '�'                                Index:  182             Distance: 1.53245210647583

Token: '\x1c'                             Index:  216             Distance: 1.532564640045166

Token: '\x07'                             Index:  195             Distance: 1.532976746559143

Token: '�'                                Index:  179             Distance: 1.5334911346435547

Token: 'quickShip'                        Index:  39752           Distance: 1.5345481634140015

Token: '\x19'                             Index:  213             Distance: 1.534569501876831

Token: '\x0b'                             Index:  199             Distance: 1.5346266031265259

Token: '�'                                Index:  125             Distance: 1.5347601175308228

Token: '�'                                Index:  183             Distance: 1.5347920656204224

Token: '\x16'                             Index:  210             Distance: 1.5350308418273926

Token: '\x14'                             Index:  208             Distance: 1.5353295803070068

Token: ' TheNitrome'                      Index:  42089           Distance: 1.535927176475525

Token: '\x17'                             Index:  211             Distance: 1.5360500812530518

Token: '\x1f'                             Index:  219             Distance: 1.5361398458480835

Token: '\x15'                             Index:  209             Distance: 1.5366222858428955

Token: '�'                                Index:  124             Distance: 1.5366740226745605

Token: '\x13'                             Index:  207             Distance: 1.5367120504379272

Token: '\x12'                             Index:  206             Distance: 1.5369184017181396

Token: '\r'                               Index:  201             Distance: 1.5370022058486938

Token: '\x02'                             Index:  190             Distance: 1.5370362997055054

Token: '\x1d'                             Index:  217             Distance: 1.5372885465621948

Token: '\x01'                             Index:  189             Distance: 1.537652611732483

Token: '\x04'                             Index:  192             Distance: 1.5379157066345215

Token: '\x00'                             Index:  188             Distance: 1.5386497974395752

Token: 'embedreportprint'                 Index:  30898           Distance: 1.5386780500411987

Token: '\x11'                             Index:  205             Distance: 1.5387035608291626

Token: '龍�'                               Index:  39820           Distance: 1.538842797279358

Token: '�'                                Index:  181             Distance: 1.5390623807907104

Token: '\x0f'                             Index:  203             Distance: 1.539109468460083

Token: '\x18'                             Index:  212             Distance: 1.5391095876693726

Token: 'rawdownload'                      Index:  30905           Distance: 1.5395408868789673

Token: '\x03'                             Index:  191             Distance: 1.5398972034454346

Token: 'reportprint'                      Index:  30897           Distance: 1.5400230884552002

Token: '�'                                Index:  185             Distance: 1.5401253700256348

Token: '�'                                Index:  178             Distance: 1.540209412574768

Token: '�'                                Index:  177             Distance: 1.540299892425537

Token: '\x0e'                             Index:  202             Distance: 1.540697455406189

Token: '�'                                Index:  186             Distance: 1.5409419536590576

Token: '\t'                               Index:  197             Distance: 1.5411518812179565

Token: '\x05'                             Index:  193             Distance: 1.5412565469741821

Token: '\x7f'                             Index:  221             Distance: 1.5413298606872559

Token: ' サーティ'                         Index:  45544           Distance: 1.5418448448181

Token: '\x1b'                             Index:  215             Distance: 1.5420893430709839

Token: '�'                               Index:  184             Distance: 1.5421853065490723

Token: '\x10'                             Index:  204             Distance: 1.5430388450622559

Token: '\x06'                             Index:  194             Distance: 1.543290376663208

Token: '\x1e'                             Index:  218             Distance: 1.5433367490768433

Token: '\x0c'                             Index:  200             Distance: 1.5434502363204956

Token: ' RandomRedditor'                  Index:  36173           Distance: 1.543701410293579

Token: 'oreAndOnline'                     Index:  40240           Distance: 1.5442919731140137

Token: '\x08'                             Index:  196             Distance: 1.5442924499511719

Token: 'InstoreAndOnline'                 Index:  40241           Distance: 1.5442957878112793

Token: '\x1a'                             Index:  214             Distance: 1.544922113418579

Token: '�'                                Index:  180             Distance: 1.546566367149353

Token: ' externalTo'                      Index:  30208           Distance: 1.564987301826477

Token: 'ÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂ' Index:  23090           Distance: 1.6087483167648315

Token: 'StreamerBot'                      Index:  37574           Distance: 1.732062816619873

Token: 'ÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂ'                 Index:  14827           Distance: 1.7358460426330566

Token: 'ActionCode'                       Index:  31573           Distance: 1.786766767501831

Token: '�'                                Index:  153             Distance: 2.0386009216308594

Token: 'Nitrome'                          Index:  42066           Distance: 2.2179977893829346

Token: 'ÃÂÃÂÃÂÃÂ'                         Index:  9364            Distance: 2.2314975261688232

Token: 'Although'                         Index:  7003            Distance: 2.248784303665161

Token: ' subur'                           Index:  13150           Distance: 2.2823641300201416

Token: 'While'                            Index:  3633            Distance: 2.2883315086364746

Token: 'Even'                             Index:  6104            Distance: 2.291586399078369

Token: ' Although'                        Index:  4900            Distance: 2.2965781688690186

Token: 'There'                            Index:  1858            Distance: 2.308825969696045

Token: 'Despite'                          Index:  8332            Distance: 2.3097543716430664

Token: 'Several'                          Index:  14945           Distance: 2.3105275630950928

Token: 'It'                               Index:  1026            Distance: 2.335638999938965

Token: ' Even'                            Index:  3412            Distance: 2.339240550994873

Token: 'What'                             Index:  2061            Distance: 2.3435022830963135

Token: ' 141'                             Index:  25500           Distance: 2.3534021377563477

Token: 'Some'                             Index:  4366            Distance: 2.3580129146575928

Token: 'That'                             Index:  2504            Distance: 2.3603456020355225

Token: ' Despite'                         Index:  7945            Distance: 2.3628103733062744

Token: ' 345'                             Index:  39937           Distance: 2.36663556098938

Token: ' 284'                             Index:  40654           Distance: 2.367591381072998

Token: ' 142'                             Index:  25181           Distance: 2.3702306747436523

Token: ' 258'                             Index:  37528           Distance: 2.3731882572174072

Token: 'This'                             Index:  1212            Distance: 2.3741140365600586

Token: ' While'                           Index:  2893            Distance: 2.376821517944336

Token: ' 156'                             Index:  23871           Distance: 2.37799334526062

Token: ' 161'                             Index:  27829           Distance: 2.3796451091766357

Token: ' 117'                             Index:  19048           Distance: 2.3797545433044434

Token: 'When'                             Index:  2215            Distance: 2.382439136505127

Token: ' 118'                             Index:  19035           Distance: 2.3848776817321777

Token: ' 231'                             Index:  34598           Distance: 2.386871099472046

Token: 'Nearly'                           Index:  27927           Distance: 2.3873279094696045

Token: ' 234'                             Index:  34323           Distance: 2.3878378868103027

Token: ' 146'                             Index:  22986           Distance: 2.39034104347229

Token: ' 348'                             Index:  44084           Distance: 2.3940060138702393

Token: ' 246'                             Index:  34951           Distance: 2.3942792415618896

Token: ' 279'                             Index:  39466           Distance: 2.395657777786255

Token: ' 170'                             Index:  16677           Distance: 2.3959624767303467

Token: ' 165'                             Index:  21409           Distance: 2.398263931274414

Token: ' Though'                          Index:  7486            Distance: 2.398547410964966

Top 100 GPT2-small farthest-from-centroid tokens

     0 Token:'SPONSORED'                        Index:  37190   Distance:         5.5687761306762695

     1 Token:'��'                              Index:  31204   Distance:         5.524938106536865

     2 Token:'soDeliveryDate'                   Index:  39811   Distance:         5.413397312164307

     3 Token:'enegger'                          Index:  44028   Distance:         5.411920547485352

     4 Token:'Reviewer'                         Index:  35407   Distance:         5.363203525543213

     5 Token:'yip'                              Index:  39666   Distance:         5.2676615715026855

     6 Token:'inventoryQuantity'                Index:  39756   Distance:         5.228435516357422

     7 Token:'theless'                          Index:  9603    Distance:         5.177161693572998

     8 Token:' Flavoring'                       Index:  49813   Distance:         5.158931732177734

     9 Token:'natureconservancy'                Index:  41380   Distance:         5.124162197113037

    10 Token:'76561'                            Index:  48527   Distance:         5.093474388122559

    11 Token:'interstitial'                     Index:  29446   Distance:         5.083877086639404

    12 Token:'tein'                             Index:  22006   Distance:         5.050122261047363

    13 Token:'20439'                            Index:  47936   Distance:         5.041223526000977

    14 Token:'ngth'                             Index:  11910   Distance:         5.01696252822876

    15 Token:'lihood'                           Index:  11935   Distance:         5.010122776031494

    16 Token:'isSpecialOrderable'               Index:  39755   Distance:         4.996940612792969

    17 Token:'Interstitial'                     Index:  29447   Distance:         4.991404056549072

    18 Token:'xual'                             Index:  5541    Distance:         4.991244792938232

    19 Token:'terday'                           Index:  6432    Distance:         4.9850616455078125

    20 Token:'DragonMagazine'                   Index:  42424   Distance:         4.968410491943359

    21 Token:'ufact'                            Index:  3603    Distance:         4.964574813842773

    22 Token:'ahime'                            Index:  49997   Distance:         4.962774276733398

    23 Token:'sonian'                           Index:  35202   Distance:         4.955888748168945

    24 Token:'wcsstore'                         Index:  12781   Distance:         4.914438724517822

    25 Token:'MpServer'                         Index:  31765   Distance:         4.913681507110596

    26 Token:'etheless'                         Index:  12845   Distance:         4.913233757019043

    27 Token:'ascript'                          Index:  15961   Distance:         4.908909797668457

    28 Token:'taboola'                          Index:  10658   Distance:         4.898747444152832

    29 Token:'selves'                           Index:  2020    Distance:         4.894481182098389

    30 Token:'NetMessage'                       Index:  25193   Distance:         4.889615058898926

    31 Token:'actionDate'                       Index:  31538   Distance:         4.889067649841309

    32 Token:'hower'                            Index:  33539   Distance:         4.872143745422363

    33 Token:'glers'                            Index:  33641   Distance:         4.860452651977539

    34 Token:'pmwiki'                           Index:  45321   Distance:         4.857065677642822

    35 Token:'BuyableInstoreAndOnline'          Index:  40242   Distance:         4.855700969696045

    36 Token:'覚醒'                             Index:  23614   Distance:         4.852175235748291

    37 Token:'quickShipAvailable'               Index:  39753   Distance:         4.851584434509277

    38 Token:'catentry'                         Index:  39165   Distance:         4.848554611206055

    39 Token:' Cosponsors'                      Index:  41868   Distance:         4.83574914932251

    40 Token:'Downloadha'                       Index:  41551   Distance:         4.826374530792236

    41 Token:'merce'                            Index:  11647   Distance:         4.826255798339844

    42 Token:'��'                              Index:  6408    Distance:         4.826108932495117

    43 Token:'rawdownloadcloneembedreportprint' Index:  30906   Distance:         4.823506832122803

    44 Token:'uyomi'                            Index:  40012   Distance:         4.812276363372803

    45 Token:' ILCS'                            Index:  36169   Distance:         4.802180290222168

    46 Token:'ciating'                          Index:  46136   Distance:         4.794322967529297

    47 Token:'soType'                           Index:  39803   Distance:         4.793649673461914

    48 Token:'externalActionCode'               Index:  31576   Distance:         4.79293966293335

    49 Token:'ゴン'                              Index:  22997   Distance:         4.7928972244262695

    50 Token:' Canaver'                         Index:  46858   Distance:         4.791261196136475

    51 Token:'aukee'                            Index:  15263   Distance:         4.789707660675049

    52 Token:' largeDownload'                   Index:  42728   Distance:         4.78477144241333

    53 Token:'issance'                          Index:  16419   Distance:         4.775783061981201

    54 Token:'nces'                             Index:  3179    Distance:         4.771732330322266

    55 Token:' GOODMAN'                         Index:  32021   Distance:         4.763675212860107

    56 Token:'vernment'                         Index:  11355   Distance:         4.762082576751709

    57 Token:'enhagen'                          Index:  30347   Distance:         4.757350444793701

    58 Token:'ktop'                             Index:  16201   Distance:         4.756397724151611

    59 Token:'llah'                             Index:  22734   Distance:         4.753528118133545

    60 Token:' guiActiveUnfocused'              Index:  30210   Distance:         4.747090816497803

    61 Token:'abouts'                           Index:  27880   Distance:         4.739869594573975

    62 Token:'��'                              Index:  7134    Distance:         4.733396530151367

    63 Token:'hyde'                             Index:  39175   Distance:         4.73218297958374

    64 Token:'wagen'                            Index:  29160   Distance:         4.726840496063232

    65 Token:'soever'                           Index:  15485   Distance:         4.723003387451172

    66 Token:'phia'                             Index:  8193    Distance:         4.717080116271973

    67 Token:'cffffcc'                          Index:  31957   Distance:         4.710177421569824

    68 Token:'ibaba'                            Index:  37541   Distance:         4.708752155303955

    69 Token:'naire'                            Index:  24042   Distance:         4.706939697265625

    70 Token:'etsk'                             Index:  29515   Distance:         4.702176094055176

    71 Token:'heit'                             Index:  29361   Distance:         4.694527626037598

    72 Token:'��'                              Index:  8008    Distance:         4.693580150604248

    73 Token:'lain'                             Index:  34277   Distance:         4.689084053039551

    74 Token:'yss'                              Index:  33968   Distance:         4.689074516296387

    75 Token:'thood'                            Index:  12951   Distance:         4.68870735168457

    76 Token:'baugh'                            Index:  23768   Distance:         4.685913562774658

    77 Token:' "$:/'                            Index:  32047   Distance:         4.68161678314209

    78 Token:'EStreamFrame'                     Index:  43177   Distance:         4.678127288818359

    79 Token:' Leilan'                          Index:  50216   Distance:         4.678030967712402

    80 Token:'heid'                             Index:  28420   Distance:         4.677629470825195

    81 Token:'netflix'                          Index:  36977   Distance:         4.6774582862854

    82 Token:'SourceFile'                       Index:  37226   Distance:         4.6742048263549805

    83 Token:'manship'                          Index:  25428   Distance:         4.674165725708008

    84 Token:'*/('                              Index:  40278   Distance:         4.67125129699707

    85 Token:'️'                                 Index:  37929   Distance:         4.670215129852295

    86 Token:'inav'                             Index:  26802   Distance:         4.669125556945801

    87 Token:'assetsadobe'                      Index:  41383   Distance:         4.665092468261719

    88 Token:'ulhu'                             Index:  36828   Distance:         4.662954807281494

    89 Token:'eele'                             Index:  26213   Distance:         4.662253379821777

    90 Token:'displayText'                      Index:  31536   Distance:         4.660873889923096

    91 Token:'dayName'                          Index:  45392   Distance:         4.658046245574951

    92 Token:'liest'                            Index:  11318   Distance:         4.652440071105957

    93 Token:'advertising'                      Index:  34442   Distance:         4.649386882781982

    94 Token:'schild'                           Index:  35058   Distance:         4.647510051727295

    95 Token:'�'                                Index:  11737   Distance:         4.64426326751709

    96 Token:'abase'                            Index:  5754    Distance:         4.64361047744751

    97 Token:'pload'                            Index:  7304    Distance:         4.642497539520264

    98 Token:'apo'                              Index:  41817   Distance:         4.640951156616211

    99 Token:'cius'                             Index:  28599   Distance:         4.640072345733643

Top 100 GPT2-small mean-distance-from-centroid tokens

mean distance from centroid = 3.3913521766662598

   

    0  Token:'contin'       Index:  18487   Distance:         3.3913495540618896

     1  Token:' ser'         Index:  1055    Distance:         3.3913450241088867

     2  Token:' normalized'  Index:  39279   Distance:         3.3913605213165283

     3  Token:' Coast'       Index:  8545    Distance:         3.391364812850952

     4  Token:'Girl'         Index:  24151   Distance:         3.3913745880126953

     5  Token:'Bytes'        Index:  45992   Distance:         3.3914194107055664

     6  Token:' #####'       Index:  46424   Distance:         3.3914294242858887

     7  Token:' appetite'    Index:  20788   Distance:         3.391449213027954

     8  Token:' ske'         Index:  6146    Distance:         3.3912549018859863

     9  Token:' Stadium'     Index:  10499   Distance:         3.391464948654175

    10  Token:' antagonists' Index:  50178   Distance:         3.3914878368377686

    11  Token:' duck'        Index:  22045   Distance:         3.3915040493011475

    12  Token:' Trotsky'     Index:  32706   Distance:         3.3915047645568848

    13  Token:' Rip'         Index:  29496   Distance:         3.3915138244628906

    14  Token:' dazz'        Index:  32282   Distance:         3.391521692276001

    15  Token:' Bos'         Index:  14548   Distance:         3.3911633491516113

    16  Token:' docs'        Index:  34165   Distance:         3.3915486335754395

    17  Token:' phil'        Index:  5206    Distance:         3.3915600776672363

    18  Token:' Lucius'      Index:  42477   Distance:         3.391568899154663

    19  Token:' lig'         Index:  26106   Distance:         3.3915719985961914

    20  Token:' Lud'         Index:  24177   Distance:         3.391577959060669

    21  Token:' forwarding'  Index:  43448   Distance:         3.3911240100860596

    22  Token:' advance'     Index:  5963    Distance:         3.3916003704071045

    23  Token:' coordinates' Index:  22715   Distance:         3.391082286834717

    24  Token:' <!--'        Index:  37922   Distance:         3.3916280269622803

    25  Token:' Cannon'      Index:  20585   Distance:         3.391629934310913

    26  Token:' Vern'        Index:  23092   Distance:         3.3910629749298096

    27  Token:' Ré'          Index:  47957   Distance:         3.391056537628174

    28  Token:' canvas'      Index:  21978   Distance:         3.3916513919830322

    29  Token:' Ce'          Index:  20101   Distance:         3.391051769256592

    30  Token:'ē'            Index:  27092   Distance:         3.3916585445404053

    31  Token:' Album'       Index:  23999   Distance:         3.391024112701416

    32  Token:' candle'      Index:  26839   Distance:         3.3910229206085205

    33  Token:' fractions'   Index:  49876   Distance:         3.391681671142578

    34  Token:' Dip'         Index:  43945   Distance:         3.3916969299316406

    35  Token:' timeout'     Index:  26827   Distance:         3.3909912109375

    36  Token:' ICC'         Index:  32300   Distance:         3.390988349914551

    37  Token:' shelters'    Index:  23629   Distance:         3.3917396068573

    38  Token:' Polit'       Index:  7793    Distance:         3.390963554382324

    39  Token:' Kerala'      Index:  34649   Distance:         3.391770124435425

    40  Token:'Protect'      Index:  41426   Distance:         3.39092755317688

    41  Token:' idle'        Index:  21696   Distance:         3.390923261642456

    42  Token:' Augustus'    Index:  48339   Distance:         3.391787528991699

    43  Token:' cad'         Index:  20603   Distance:         3.3909006118774414

    44  Token:' tab'         Index:  7400    Distance:         3.3918063640594482

    45  Token:' TP'          Index:  24525   Distance:         3.390892744064331

    46  Token:' >>>'         Index:  13163   Distance:         3.391817331314087

    47  Token:' dub'         Index:  10873   Distance:         3.3918192386627197

    48  Token:' minim'       Index:  10356   Distance:         3.391824722290039

    49  Token:' bracket'     Index:  19096   Distance:         3.391836404800415

    50  Token:' bould'       Index:  47069   Distance:         3.3908584117889404

    51  Token:' lesbians'    Index:  34210   Distance:         3.3918488025665283

    52  Token:' univers'     Index:  5820    Distance:         3.391850233078003

    53  Token:' humanities'  Index:  47824   Distance:         3.391861915588379

    54  Token:' retiring'    Index:  29040   Distance:         3.3918683528900146

    55  Token:' ol'          Index:  25776   Distance:         3.391878128051758

    56  Token:' ETH'         Index:  35920   Distance:         3.391885995864868

    57  Token:' hind'        Index:  16222   Distance:         3.391887903213501

    58  Token:'Tech'         Index:  17760   Distance:         3.3918890953063965

    59  Token:' Milton'      Index:  30979   Distance:         3.390791416168213

    60  Token:' Federation'  Index:  11937   Distance:         3.3907783031463623

    61  Token:' Hawks'       Index:  23445   Distance:         3.3907723426818848

    62  Token:' juveniles'   Index:  48660   Distance:         3.391939878463745

    63  Token:' Mess'        Index:  10626   Distance:         3.391957998275757

    64  Token:' signs'       Index:  5895    Distance:         3.3919761180877686

    65  Token:' Charge'      Index:  20260   Distance:         3.3907270431518555

    66  Token:' Fahrenheit'  Index:  35935   Distance:         3.391995429992676

    67  Token:' Bashar'      Index:  24463   Distance:         3.3907077312469482

    68  Token:' starved'     Index:  47224   Distance:         3.39200496673584

    69  Token:' Wichita'     Index:  45526   Distance:         3.3920130729675293

    70  Token:' Organization'Index:  12275   Distance:         3.392029047012329

    71  Token:' Sens'        Index:  14173   Distance:         3.392033576965332

    72  Token:' Dw'          Index:  19113   Distance:         3.39066743850708

    73  Token:' Camden'      Index:  43084   Distance:         3.3906660079956055

    74  Token:' Bent'        Index:  20421   Distance:         3.392038583755493

    75  Token:'ooo'          Index:  34160   Distance:         3.3920416831970215

    76  Token:'ob'           Index:  672     Distance:         3.3920609951019287

    77  Token:' RF'          Index:  20445   Distance:         3.39207124710083

    78  Token:' Wa'          Index:  15329   Distance:         3.390626907348633

    79  Token:'off'          Index:  2364    Distance:         3.392092227935791

    80  Token:' vitro'       Index:  30590   Distance:         3.3906099796295166

    81  Token:' Yorkshire'   Index:  31157   Distance:         3.390578031539917

    82  Token:' Duck'        Index:  21867   Distance:         3.392127513885498

    83  Token:' pubs'        Index:  46972   Distance:         3.3921289443969727

    84  Token:'bedroom'      Index:  36269   Distance:         3.3905723094940186

    85  Token:' tit'         Index:  5259    Distance:         3.392143487930298

    86  Token:'iddling'      Index:  41367   Distance:         3.392150640487671

    87  Token:' Offic'       Index:  6328    Distance:         3.3905441761016846

    88  Token:' nuts'        Index:  14380   Distance:         3.39052677154541

    89  Token:' warp'        Index:  25825   Distance:         3.3905181884765625

    90  Token:' Phantom'     Index:  14407   Distance:         3.3922109603881836

    91  Token:' Revolution'  Index:  9303    Distance:         3.390486717224121

    92  Token:' pian'        Index:  43923   Distance:         3.390449285507202

    93  Token:' decimal'     Index:  32465   Distance:         3.3922572135925293

    94  Token:' capac'       Index:  18457   Distance:         3.390444755554199

    95  Token:' lobby'       Index:  10866   Distance:         3.392265796661377

    96  Token:' Enforcement' Index:  19198   Distance:         3.3904335498809814

    97  Token:' THANK'       Index:  49360   Distance:         3.3922717571258545

    98  Token:' subdu'       Index:  35041   Distance:         3.390432119369507

    99  Token:' bec'         Index:  639     Distance:         3.3922879695892334

Top 100 GPT2-xl closest-to-centroid tokens

    0 Token: "'re"          Index:  821     Distance:         1.0988247394561768

     1 Token: ' It'          Index:  632     Distance:         1.10574471950531

     2 Token: "'m"           Index:  1101    Distance:         1.1074422597885132

     3 Token: ' That'        Index:  1320    Distance:         1.128333568572998

     4 Token: ' There'       Index:  1318    Distance:         1.128534197807312

     5 Token: '."'           Index:  526     Distance:         1.1356818675994873

     6 Token: ' This'        Index:  770     Distance:         1.135703682899475

     7 Token: ' If'          Index:  1002    Distance:         1.1358076333999634

     8 Token: ' been'        Index:  587     Distance:         1.1476913690567017

     9 Token: ' Although'    Index:  4900    Distance:         1.1492284536361694

    10 Token: 'It'           Index:  1026    Distance:         1.1522436141967773

    11 Token: ' an'          Index:  281     Distance:         1.1545791625976562

    12 Token: ' When'        Index:  1649    Distance:         1.157148838043213

    13 Token: ' has'         Index:  468     Distance:         1.158998727798462

    14 Token: ';'            Index:  26      Distance:         1.1591651439666748

    15 Token: '.'            Index:  13      Distance:         1.159492015838623

    16 Token: 'There'        Index:  1858    Distance:         1.1596912145614624

    17 Token: ' But'         Index:  887     Distance:         1.1607087850570679

    18 Token: ' They'        Index:  1119    Distance:         1.1629877090454102

    19 Token: ',"'           Index:  553     Distance:         1.1631295680999756

    20 Token: ' it'          Index:  340     Distance:         1.1665016412734985

    21 Token: ' are'         Index:  389     Distance:         1.1677614450454712

    22 Token: "'ve"          Index:  1053    Distance:         1.168096661567688

    23 Token: '),'           Index:  828     Distance:         1.1774460077285767

    24 Token: ' While'       Index:  2893    Distance:         1.1810990571975708

    25 Token: 'This'         Index:  1212    Distance:         1.1815398931503296

    26 Token: ' was'         Index:  373     Distance:         1.1818164587020874

    27 Token: ' What'        Index:  1867    Distance:         1.1829456090927124

    28 Token: ' you'         Index:  345     Distance:         1.1838055849075317

    29 Token: 'In'           Index:  818     Distance:         1.184488296508789

    30 Token: ' were'        Index:  547     Distance:         1.1870908737182617

    31 Token: ').'           Index:  737     Distance:         1.187459111213684

    32 Token: ' However'     Index:  2102    Distance:         1.188103199005127

    33 Token: ' Even'        Index:  3412    Distance:         1.1881054639816284

    34 Token: 'That'         Index:  2504    Distance:         1.1890287399291992

    35 Token: 'Although'     Index:  7003    Distance:         1.190545916557312

    36 Token: 'Despite'      Index:  8332    Distance:         1.191179633140564

    37 Token: ' is'          Index:  318     Distance:         1.1919716596603394

    38 Token: ' For'         Index:  1114    Distance:         1.192177653312683

    39 Token: ' Despite'     Index:  7945    Distance:         1.1923538446426392

    40 Token: '.,'           Index:  1539    Distance:         1.1928788423538208

    41 Token: ' to'          Index:  284     Distance:         1.1932759284973145

    42 Token: ' that'        Index:  326     Distance:         1.1944019794464111

    43 Token: ' With'        Index:  2080    Distance:         1.194966435432434

    44 Token: ' for'         Index:  329     Distance:         1.1953264474868774

    45 Token: ' with'        Index:  351     Distance:         1.1954630613327026

    46 Token: 'If'           Index:  1532    Distance:         1.1962107419967651

    47 Token: ' doesn'       Index:  1595    Distance:         1.1966677904129028

    48 Token: 'the'          Index:  1169    Distance:         1.1967543363571167

    49 Token: ' Some'        Index:  2773    Distance:         1.1969447135925293

    50 Token: ' does'        Index:  857     Distance:         1.197643518447876

    51 Token: 'The'          Index:  464     Distance:         1.1977614164352417

    52 Token: ' they'        Index:  484     Distance:         1.1982195377349854

    53 Token: ')'            Index:  8       Distance:         1.198480486869812

    54 Token: "'ll"          Index:  1183    Distance:         1.2001967430114746

    55 Token: 'When'         Index:  2215    Distance:         1.2003682851791382

    56 Token: 'While'        Index:  3633    Distance:         1.2009003162384033

    57 Token: ' You'         Index:  921     Distance:         1.202088713645935

    58 Token: ' have'        Index:  423     Distance:         1.2036402225494385

    59 Token: ' In'          Index:  554     Distance:         1.205020546913147

    60 Token: ' makes'       Index:  1838    Distance:         1.20503568649292

    61 Token: ' this'        Index:  428     Distance:         1.2056514024734497

    62 Token: ' as'          Index:  355     Distance:         1.2058933973312378

    63 Token: 'You'          Index:  1639    Distance:         1.206149697303772

    64 Token: 'What'         Index:  2061    Distance:         1.206900715827942

    65 Token: ' The'         Index:  383     Distance:         1.2074564695358276

    66 Token: ' had'         Index:  550     Distance:         1.2079850435256958

    67 Token: 'For'          Index:  1890    Distance:         1.2090857028961182

    68 Token: ' we'          Index:  356     Distance:         1.2091714143753052

    69 Token: ' his'         Index:  465     Distance:         1.2104038000106812

    70 Token: 'Even'         Index:  6104    Distance:         1.2108395099639893

    71 Token: ' of'          Index:  286     Distance:         1.2109613418579102

    72 Token: ' but'         Index:  475     Distance:         1.21281099319458

    73 Token: 'Some'         Index:  4366    Distance:         1.2132415771484375

    74 Token: ' by'          Index:  416     Distance:         1.2136200666427612

    75 Token: 'that'         Index:  5562    Distance:         1.214524507522583

    76 Token: ' from'        Index:  422     Distance:         1.2148666381835938

    77 Token: 'But'          Index:  1537    Distance:         1.2159487009048462

    78 Token: ' These'       Index:  2312    Distance:         1.2164571285247803

    79 Token: ' at'          Index:  379     Distance:         1.218200445175171

    80 Token: ' on'          Index:  319     Distance:         1.2186042070388794

    81 Token: ' in'          Index:  287     Distance:         1.2198543548583984

    82 Token: 'We'           Index:  1135    Distance:         1.2206143140792847

    83 Token: ' gets'        Index:  3011    Distance:         1.223204493522644

    84 Token: ' what'        Index:  644     Distance:         1.2241556644439697

    85 Token: ' your'        Index:  534     Distance:         1.2258002758026123

    86 Token: ' didn'        Index:  1422    Distance:         1.2258925437927246

    87 Token: ' he'          Index:  339     Distance:         1.2262582778930664

    88 Token: "'s"           Index:  338     Distance:         1.226381778717041

    89 Token: '\n'           Index:  198     Distance:         1.2273286581039429

    90 Token: 'After'        Index:  3260    Distance:         1.22809636592865

    91 Token: 'They'         Index:  2990    Distance:         1.2289270162582397

    92 Token: ' wasn'        Index:  2492    Distance:         1.2293295860290527

    93 Token: ' their'       Index:  511     Distance:         1.2296582460403442

    94 Token: ' a'           Index:  257     Distance:         1.2305101156234741

    95 Token: 'With'         Index:  3152    Distance:         1.2320773601531982

    96 Token: ' isn'         Index:  2125    Distance:         1.2324292659759521

    97 Token: ' And'         Index:  843     Distance:         1.2325780391693115

    98 Token: ' when'        Index:  618     Distance:         1.2341785430908203

    99 Token: 'Several'      Index:  14945   Distance:         1.2343060970306396

Top 100 GPT2-xl farthest-from-centroid tokens

     0 Token:'rawdownload'            Index:  30905   Distance:         3.33955454826355

     1 Token:'\x14'                   Index:  208     Distance:         3.33333683013916

     2 Token:'\x01'                   Index:  189     Distance:         3.3312017917633057

     3 Token:'\x11'                   Index:  205     Distance:         3.3306527137756348

     4 Token:'embedreportprint'       Index:  30898   Distance:         3.3290979862213135

     5 Token:'�'                      Index:  125     Distance:         3.327265977859497

     6 Token:'\x16'                   Index:  210     Distance:         3.326960563659668

     7 Token:'\t'                     Index:  197     Distance:         3.326873302459717

     8 Token:'\x0c'                   Index:  200     Distance:         3.326695442199707

     9 Token:'\x1a'                   Index:  214     Distance:         3.326601028442383

    10 Token:'�'                      Index:  185     Distance:         3.326319456100464

    11 Token:' RandomRedditor'        Index:  36173   Distance:         3.325119972229004

    12 Token:'\x1c'                   Index:  216     Distance:         3.324606418609619

    13 Token:'\x0f'                   Index:  203     Distance:         3.3243095874786377

    14 Token:' TheNitrome'            Index:  42089   Distance:         3.323943853378296

    15 Token:'reportprint'            Index:  30897   Distance:         3.323246717453003

    16 Token:'\x1e'                   Index:  218     Distance:         3.323152780532837

    17 Token:'\x02'                   Index:  190     Distance:         3.322984218597412

    18 Token:'\x1d'                   Index:  217     Distance:         3.3213040828704834

    19 Token:'\x0e'                   Index:  202     Distance:         3.321027994155884

    20 Token:'\x18'                   Index:  212     Distance:         3.3209927082061768

    21 Token:' サーティ'                  Index:  45544   Distance:         3.3199286460876465

    22 Token:'\x03'                   Index:  191     Distance:         3.3197877407073975

    23 Token:'�'                      Index:  183     Distance:         3.3191745281219482

    24 Token:'\x17'                   Index:  211     Distance:         3.319058895111084

    25 Token:'\x0b'                   Index:  199     Distance:         3.3188211917877197

    26 Token:'\r'                     Index:  201     Distance:         3.3187379837036133

    27 Token:'\x04'                   Index:  192     Distance:         3.3185911178588867

    28 Token:'龍�'                     Index:  39820   Distance:         3.3180813789367676

    29 Token:'\x05'                   Index:  193     Distance:         3.317812204360962

    30 Token:'�'                      Index:  179     Distance:         3.3177683353424072

    31 Token:'\x1b'                   Index:  215     Distance:         3.3173940181732178

    32 Token:'�'                      Index:  184     Distance:         3.317275047302246

    33 Token:'\x15'                   Index:  209     Distance:         3.3162271976470947

    34 Token:'�'                      Index:  178     Distance:         3.315554141998291

    35 Token:'\x07'                   Index:  195     Distance:         3.315474510192871

    36 Token:'\x08'                   Index:  196     Distance:         3.314741373062134

    37 Token:'\x19'                   Index:  213     Distance:         3.3145389556884766

    38 Token:'\x00'                   Index:  188     Distance:         3.3142573833465576

    39 Token:'InstoreAndOnline'       Index:  40241   Distance:         3.314216375350952

    40 Token:'\x12'                   Index:  206     Distance:         3.3137476444244385

    41 Token:'�'                      Index:  181     Distance:         3.313575506210327

    42 Token:'�'                      Index:  177     Distance:         3.3133208751678467

    43 Token:' externalToEVA'         Index:  30212   Distance:         3.313035249710083

    44 Token:'�'                      Index:  180     Distance:         3.3120765686035156

    45 Token:'�'                      Index:  182     Distance:         3.3118510246276855

    46 Token:'quickShip'              Index:  39752   Distance:         3.3116681575775146

    47 Token:'\x1f'                   Index:  219     Distance:         3.31064772605896

    48 Token:'�'                      Index:  186     Distance:         3.3099465370178223

    49 Token:'\x06'                   Index:  194     Distance:         3.309056282043457

    50 Token:'\x13'                   Index:  207     Distance:         3.308656930923462

    51 Token:'�'                      Index:  187     Distance:         3.3077454566955566

    52 Token:'oreAndOnline'           Index:  40240   Distance:         3.306298017501831

    53 Token:'\x10'                   Index:  204     Distance:         3.3061537742614746

    54 Token:'�'                      Index:  124     Distance:         3.3053905963897705

    55 Token:'\x7f'                   Index:  221     Distance:         3.298323631286621

    56 Token:' externalTo'            Index:  30208   Distance:         3.246527910232544

    57 Token:'ÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂ’

                 Index:  23090   Distance:         3.018141984939575

    58 Token:'ActionCode'             Index:  31573   Distance:         2.965672254562378

    59 Token:'StreamerBot'            Index:  37574   Distance:         2.8924193382263184

    60 Token:'ÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂ'       Index:  14827   Distance:         2.8518106937408447

    61 Token:'SPONSORED'              Index:  37190   Distance:         2.730139970779419

    62 Token:'advertisement'          Index:  45876   Distance:         2.670930862426758

    63 Token:' Dragonbound'           Index:  17900   Distance:         2.638676643371582

    64 Token:'�'                      Index:  174     Distance:         2.596770763397217

    65 Token:'edom'                   Index:  3836    Distance:         2.5509960651397705

    66 Token:' Carbuncle'             Index:  35818   Distance:         2.5095033645629883

    67 Token:' Skydragon'             Index:  38250   Distance:         2.4964492321014404

    68 Token:'ÃÂÃÂÃÂÃÂ'               Index:  9364    Distance:         2.493638277053833

    69 Token:' Mechdragon'            Index:  35579   Distance:         2.4891304969787598

    70 Token:'ascript'                Index:  15961   Distance:         2.4882168769836426

    71 Token:'enegger'                Index:  44028   Distance:         2.4868009090423584

    72 Token:'cloneembedreportprint'  Index:  30899   Distance:         2.4652135372161865

    73 Token:'xual'                   Index:  5541    Distance:         2.4513542652130127

    74 Token:'oreAnd'                 Index:  40219   Distance:         2.4498186111450195

    75 Token:'yss'                    Index:  33968   Distance:         2.445730447769165

    76 Token:'antha'                  Index:  32589   Distance:         2.443488359451294

    77 Token:'baugh'                  Index:  23768   Distance:         2.441896915435791

    78 Token:'tein'                   Index:  22006   Distance:         2.437458038330078

    79 Token:'thood'                  Index:  12951   Distance:         2.4370245933532715

    80 Token:'enhagen'                Index:  30347   Distance:         2.430813789367676

    81 Token:'alion'                  Index:  19275   Distance:         2.4270615577697754

    82 Token:'raq'                    Index:  3766    Distance:         2.4262077808380127

    83 Token:'zin'                    Index:  42140   Distance:         2.424846649169922

    84 Token:'abouts'                 Index:  27880   Distance:         2.424142599105835

    85 Token:'SIGN'                   Index:  46224   Distance:         2.4232606887817383

    86 Token:'lain'                   Index:  34277   Distance:         2.420980215072632

    87 Token:'Interstitial'           Index:  29447   Distance:         2.4186954498291016

    88 Token:'swick'                  Index:  30961   Distance:         2.418560028076172

    89 Token:'xit'                    Index:  10198   Distance:         2.4180564880371094

    90 Token:' Nanto'                 Index:  47614   Distance:         2.417248010635376

    91 Token:'icz'                    Index:  28051   Distance:         2.4170420169830322

    92 Token:'indal'                  Index:  44644   Distance:         2.415736436843872

    93 Token:'cham'                   Index:  49869   Distance:         2.415719747543335

    94 Token:'amen'                   Index:  41763   Distance:         2.4145805835723877

    95 Token:'asio'                   Index:  29831   Distance:         2.4140307903289795

    96 Token:'theless'                Index:  9603    Distance:         2.412609577178955

    97 Token:'龍�'                     Index:  19049   Distance:         2.4112346172332764

    98 Token:'iola'                   Index:  30292   Distance:         2.411001205444336

    99 Token:'onga'                   Index:  44294   Distance:         2.410895347595215

Top 100 GPT2-xl mean-distance-from-centroid tokens

mean distance from centroid = 1.8377946615219116

     0  Token:' gel'         Index:  20383   Distance:         1.8377970457077026

     1  Token:' Alpha'       Index:  12995   Distance:         1.8377904891967773

     2  Token:' jumper'      Index:  31118   Distance:         1.8378019332885742

     3  Token:'Lewis'        Index:  40330   Distance:         1.8378077745437622

     4  Token:' phosphate'   Index:  46926   Distance:         1.8378087282180786

     5  Token:'login'        Index:  38235   Distance:         1.837770938873291

     6  Token:' morph'       Index:  17488   Distance:         1.8378208875656128

     7  Token:' accessory'   Index:  28207   Distance:         1.837827444076538

     8  Token:' greeting'    Index:  31933   Distance:         1.8378349542617798

     9  Token:' Bart'        Index:  13167   Distance:         1.8378361463546753

    10  Token:' runway'      Index:  23443   Distance:         1.8377509117126465

    11  Token:' Sher'        Index:  6528    Distance:         1.8377450704574585

    12  Token:'Line'         Index:  13949   Distance:         1.8378454446792603

    13  Token:' Kardashian'  Index:  48099   Distance:         1.8378528356552124

    14  Token:' nail'        Index:  17864   Distance:         1.8378595113754272

    15  Token:' ethn'        Index:  33961   Distance:         1.8378615379333496

    16  Token:' piss'        Index:  18314   Distance:         1.8377244472503662

    17  Token:' Thought'     Index:  27522   Distance:         1.8377199172973633

    18  Token:' Pharmaceutical' Index:  37175   Distance:         1.8377118110656738

    19  Token:' mobilization'Index:  46762   Distance:         1.8378934860229492

    20  Token:' magistrate'  Index:  38620   Distance:         1.8378956317901611

    21  Token:' Mount'       Index:  5628    Distance:         1.837693214416504

    22  Token:' Race'        Index:  12588   Distance:         1.83768892288208

    23  Token:' trout'       Index:  49411   Distance:         1.8376816511154175

    24  Token:' Freedom'     Index:  10204   Distance:         1.8379098176956177

    25  Token:' Mir'         Index:  7381    Distance:         1.8376774787902832

    26  Token:'selling'      Index:  16473   Distance:         1.837915062904358

    27  Token:' Taiwanese'   Index:  41777   Distance:         1.8379210233688354

    28  Token:' flock'       Index:  29556   Distance:         1.8376673460006714

    29  Token:' Cer'         Index:  17419   Distance:         1.837650179862976

    30  Token:' manuals'     Index:  41371   Distance:         1.837944746017456

    31  Token:' competence'  Index:  31450   Distance:         1.8379515409469604

    32  Token:' bribe'       Index:  40879   Distance:         1.8379546403884888

    33  Token:' euphem'      Index:  48732   Distance:         1.8376260995864868

    34  Token:'killing'      Index:  43764   Distance:         1.8376243114471436

    35  Token:' Friend'      Index:  9182    Distance:         1.837989330291748

    36  Token:' instrumental'Index:  21543   Distance:         1.8379945755004883

    37  Token:'debug'        Index:  24442   Distance:         1.8375909328460693

    38  Token:' ta'          Index:  20486   Distance:         1.8380028009414673

    39  Token:' batted'      Index:  45754   Distance:         1.8380101919174194

    40  Token:' Cutting'     Index:  40152   Distance:         1.8375744819641113

    41  Token:' affili'      Index:  8349    Distance:         1.8375626802444458

    42  Token:'NECT'         Index:  48842   Distance:         1.838038682937622

    43  Token:' Adults'      Index:  35154   Distance:         1.8380409479141235

    44  Token:' lingu'       Index:  20280   Distance:         1.837548017501831

    45  Token:' unanimous'   Index:  28085   Distance:         1.8375470638275146

    46  Token:' shadow'      Index:  9082    Distance:         1.8380695581436157

    47  Token:'Sim'          Index:  8890    Distance:         1.8375192880630493

    48  Token:'993'          Index:  44821   Distance:         1.8380743265151978

    49  Token:' pound'       Index:  14896   Distance:         1.838077425956726

    50  Token:' misdem'      Index:  19914   Distance:         1.8375117778778076

    51  Token:' Jiang'       Index:  32294   Distance:         1.8380863666534424

    52  Token:' crystal'     Index:  15121   Distance:         1.8375009298324585

    53  Token:' reunited'    Index:  35440   Distance:         1.837498426437378

    54  Token:' AFP'         Index:  8916    Distance:         1.8374981880187988

    55  Token:' undermin'    Index:  16303   Distance:         1.8374966382980347

    56  Token:' Courtney'    Index:  36677   Distance:         1.8374965190887451

    57  Token:' horizontally'Index:  36774   Distance:         1.8380943536758423

    58  Token:' honored'     Index:  21014   Distance:         1.8381036520004272

    59  Token:' Turns'       Index:  30875   Distance:         1.8374829292297363

    60  Token:' oy'          Index:  35104   Distance:         1.8374829292297363

    61  Token:' ff'          Index:  31246   Distance:         1.8374710083007812

    62  Token:'NYSE'         Index:  49430   Distance:         1.838128685951233

    63  Token:'oo'           Index:  2238    Distance:         1.8374602794647217

    64  Token:' assignments' Index:  25815   Distance:         1.838129997253418

    65  Token:' wise'        Index:  10787   Distance:         1.8374543190002441

    66  Token:' NL'          Index:  22879   Distance:         1.8374477624893188

    67  Token:' Independent' Index:  13362   Distance:         1.8381541967391968

    68  Token:' forfe'       Index:  19366   Distance:         1.8374329805374146

    69  Token:'aced'         Index:  2286    Distance:         1.8374195098876953

    70  Token:' malf'        Index:  27750   Distance:         1.837415337562561

    71  Token:' galvan'      Index:  42170   Distance:         1.8381749391555786

    72  Token:' Cap'         Index:  4476    Distance:         1.8374139070510864

    73  Token:' Nursing'     Index:  46278   Distance:         1.8374133110046387

    74  Token:' reign'       Index:  13580   Distance:         1.8381848335266113

    75  Token:'iguous'       Index:  29709   Distance:         1.8381882905960083

    76  Token:' dunk'        Index:  35434   Distance:         1.8374006748199463

    77  Token:' exceptions'  Index:  13269   Distance:         1.838194727897644

    78  Token:'talking'      Index:  48186   Distance:         1.837381362915039

    79  Token:' Burma'       Index:  40306   Distance:         1.838208556175232

    80  Token:' Ep'          Index:  4551    Distance:         1.8382205963134766

    81  Token:' perpet'      Index:  8939    Distance:         1.8373634815216064

    82  Token:' Activities'  Index:  36270   Distance:         1.8382261991500854

    83  Token:' Spani'       Index:  37506   Distance:         1.8382389545440674

    84  Token:' Irma'        Index:  41224   Distance:         1.8382395505905151

    85  Token:' Mult'        Index:  7854    Distance:         1.8382436037063599

    86  Token:' faculties'   Index:  47126   Distance:         1.8382459878921509

    87  Token:' stack'       Index:  8931    Distance:         1.8373374938964844

    88  Token:' Crazy'       Index:  19932   Distance:         1.8382567167282104

    89  Token:' conditional' Index:  26340   Distance:         1.8373326063156128

    90  Token:'�'            Index:  43718   Distance:         1.8373303413391113

    91  Token:' extensions'  Index:  18366   Distance:         1.8382689952850342

    92  Token:'potion'       Index:  49324   Distance:         1.8382822275161743

    93  Token:'Saint'        Index:  48615   Distance:         1.8382846117019653

    94  Token:' nerve'       Index:  16384   Distance:         1.8373029232025146

    95  Token:' Mak'         Index:  15841   Distance:         1.8382878303527832

    96  Token:'613'          Index:  47512   Distance:         1.838289737701416

    97  Token:' Jeb'         Index:  24298   Distance:         1.837297797203064

    98  Token:'umni'         Index:  25402   Distance:         1.8372949361801147

    99  Token:' ERA'         Index:  18802   Distance:         1.838295340538025

Top 100 GPT-j closest-to-centroid tokens

Note: We’ve removed all tokens of the form “<|extratoken_xx|>” which were added to the token set for GPT-j to pad it out to a more nicely divisible size of 50400.

     0 Token: ' attRot'                     Index:  35207   Distance:         0.06182861328125

     1 Token: '�'                           Index:  125     Distance:         0.06256103515625

     2 Token: 'EStreamFrame'                Index:  43177   Distance:         0.06256103515625

     3 Token: '�'                           Index:  186     Distance:         0.0626220703125

     4 Token: ' SolidGoldMagikarp'          Index:  43453   Distance:         0.06280517578125

     5 Token: 'PsyNetMessage'               Index:  28666   Distance:         0.06292724609375

     6 Token: '�'                           Index:  177     Distance:         0.06304931640625

     7 Token: '�'                           Index:  187     Distance:         0.06304931640625

     8 Token: 'embedreportprint'            Index:  30898   Distance:         0.0631103515625

     9 Token: ' Adinida'                    Index:  46600   Distance:         0.0631103515625

    10 Token: 'oreAndOnline'                Index:  40240   Distance:         0.06317138671875

    11 Token: '�'                           Index:  184     Distance:         0.063232421875

    12 Token: '�'                           Index:  185     Distance:         0.063232421875

    13 Token: '�'                           Index:  180     Distance:         0.06329345703125

    14 Token: '�'                           Index:  181     Distance:         0.06329345703125

    15 Token: 'StreamerBot'                 Index:  37574   Distance:         0.06341552734375

    16 Token: '�'                           Index:  182     Distance:         0.0634765625

    17 Token: 'GoldMagikarp'                Index:  42202   Distance:         0.0634765625

    18 Token: '�'                           Index:  124     Distance:         0.06353759765625

    19 Token: ' externalToEVA'              Index:  30212   Distance:         0.06353759765625

    20 Token: ' TheNitrome'                 Index:  42089   Distance:         0.06353759765625

    21 Token: ' TheNitromeFan'              Index:  42090   Distance:         0.06353759765625

    22 Token: ' RandomRedditorWithNo'       Index:  36174   Distance:         0.0635986328125

    23 Token: 'InstoreAndOnline'            Index:  40241   Distance:         0.0635986328125

    24 Token: '�'                           Index:  183     Distance:         0.063720703125

    25 Token: '�'                           Index:  178     Distance:         0.06378173828125

    26 Token: '�'                           Index:  179     Distance:         0.06396484375

    27 Token: ' RandomRedditor'             Index:  36173   Distance:         0.064208984375

    28 Token: ' davidjl'                    Index:  23282   Distance:         0.0682373046875

    29 Token: 'Downloadha'                  Index:  41551   Distance:         0.0694580078125

    30 Token: ' srfN'                       Index:  42586   Distance:         0.070556640625

    31 Token: 'cloneembedreportprint'       Index:  30899   Distance:         0.07489013671875

    32 Token: 'rawdownload'                 Index:  30905   Distance:         0.07501220703125

    33 Token: ' guiActiveUn'                Index:  29372   Distance:         0.0777587890625

    34 Token: ' DevOnline'                  Index:  47571   Distance:         0.08074951171875

    35 Token: ' externalToEVAOnly'          Index:  30213   Distance:         0.0885009765625

    36 Token: ' unfocusedRange'             Index:  30209   Distance:         0.09246826171875

    37 Token: ' UCHIJ'                      Index:  39253   Distance:         0.09246826171875

    38 Token: ' 裏覚醒'                        Index:  25992   Distance:         0.09375    

    39 Token: ' guiActiveUnfocused'         Index:  30210   Distance:         0.09405517578125

    40 Token: ' サーティ'                    Index:  45544   Distance:         0.10540771484375

    41 Token: 'rawdownloadcloneembedreportprint'

                                            Index:  30906   Distance:         0.105712890625

    42 Token: 'TPPStreamerBot'              Index:  37579   Distance:         0.107666015625

    43 Token: 'DragonMagazine'              Index:  42424   Distance:         0.1102294921875

    44 Token: ' guiIcon'                    Index:  30211   Distance:         0.116943359375

    45 Token: 'quickShip'                   Index:  39752   Distance:         0.1240234375

    46 Token: '?????-?????-'                Index:  31666   Distance:         0.1318359375

    47 Token: 'BuyableInstoreAndOnline'     Index:  40242   Distance:         0.1431884765625

    48 Token: ' サーティワン'                 Index:  45545   Distance:         0.143798828125

    49 Token: 'reportprint'                 Index:  30897   Distance:         0.14501953125

    50 Token: 'isSpecialOrderable'          Index:  39755   Distance:         0.1453857421875

    51 Token: 'channelAvailability'         Index:  39757   Distance:         0.14599609375

    52 Token: ' Smartstocks'                Index:  32437   Distance:         0.146240234375

    53 Token: ' sqor'                       Index:  36938   Distance:         0.1524658203125

    54 Token: ' strutConnector'             Index:  50009   Distance:         0.1639404296875

    55 Token: 'quickShipAvailable'          Index:  39753   Distance:         0.177490234375

    56 Token: 'soDeliveryDate'              Index:  39811   Distance:         0.1856689453125

    57 Token: '龍契士'                       Index:  39821   Distance:         0.19140625  

    58 Token: 'assetsadobe'                 Index:  41383   Distance:         0.198486328125

    59 Token: ' guiActive'                  Index:  18472   Distance:         0.2196044921875

    60 Token: 'ÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂ'

                                            Index:  23090   Distance:         0.2296142578125

    61 Token: 'ÃÂÃÂÃÂÃÂ'                    Index:  9364    Distance:         0.255126953125

    62 Token: 'natureconservancy'           Index:  41380   Distance:         0.26318359375

    63 Token: ' istg'                       Index:  36940   Distance:         0.263671875

    64 Token: 'iHUD'                        Index:  38370   Distance:         0.266357421875

    65 Token: ' dstg'                       Index:  36935   Distance:         0.272216796875

    66 Token: 'ÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂ'            Index:  14827   Distance:         0.277099609375

    67 Token: 'ItemThumbnailImage'          Index:  39177   Distance:         0.27734375  

    68 Token: ' externalTo'                 Index:  30208   Distance:         0.277587890625

    69 Token: ' 裏�'                        Index:  34504   Distance:         0.293212890625

    70 Token: ' Skydragon'                  Index:  38250   Distance:         0.310791015625

    71 Token: '��士'                       Index:  33434   Distance:         0.326416015625

    72 Token: 'inventoryQuantity'           Index:  39756   Distance:         0.326416015625

    73 Token: ' Mechdragon'                 Index:  35579   Distance:         0.333251953125

    74 Token: ' petertodd'                  Index:  37444   Distance:         0.36962890625

    75 Token: '龍喚士'                       Index:  33454   Distance:         0.371337890625

    76 Token: 'ForgeModLoader'              Index:  24934   Distance:         0.380126953125

    77 Token: ' 裏�'                        Index:  20174   Distance:         0.38818359375

    78 Token: ' guiName'                    Index:  30202   Distance:         0.4140625  

    79 Token: ' largeDownload'              Index:  42728   Distance:         0.41455078125

    80 Token: 'ItemTracker'                 Index:  47198   Distance:         0.429931640625

    81 Token: ' Dragonbound'                Index:  17900   Distance:         0.441650390625

    82 Token: 'ÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂv

                                            Index:  35496   Distance:         0.453125    

    83 Token: 'ÃÂÃÂ'                        Index:  5815    Distance:         0.458740234375

    84 Token: '龍�'                         Index:  39820   Distance:         0.465087890625

    85 Token: 'Nitrome'                     Index:  42066   Distance:         0.4697265625

    86 Token: '\n'                          Index:  198     Distance:         0.490234375

    87 Token: 'ゼウス'                       Index:  43361   Distance:         0.491455078125

    88 Token: 'MpServer'                    Index:  31765   Distance:         0.494140625

    89 Token: 'SpaceEngineers'              Index:  31032   Distance:         0.496337890625

    90 Token: ' ItemLevel'                  Index:  34448   Distance:         0.51025390625

    91 Token: 'wcsstore'                    Index:  12781   Distance:         0.52587890625

    92 Token: ' '                           Index:  220     Distance:         0.52685546875

    93 Token: 'Buyable'                     Index:  39693   Distance:         0.54052734375

    94 Token: ' "$:/'                       Index:  32047   Distance:         0.5439453125

    95 Token: 'EngineDebug'                 Index:  49781   Distance:         0.544921875

    96 Token: 'cffffcc'                     Index:  31957   Distance:         0.56005859375

    97 Token: '#$#$'                        Index:  34206   Distance:         0.578125    

    98 Token: '�'                           Index:  174     Distance:         0.57958984375

    99 Token: ' Leilan'                     Index:  50216   Distance:         0.5927734375

Top 100 GPT-j farthest-from-centroid tokens

     0 Token:' �'                     Index:  17433   Distance:         1.30859375  

     1 Token:'gif'                    Index:  27908   Distance:         1.2255859375

     2 Token:'�'                      Index:  136     Distance:         1.22265625  

     3 Token:' ›'                     Index:  37855   Distance:         1.208984375

     4 Token:'�'                      Index:  46256   Distance:         1.20703125  

     5 Token:'._'                     Index:  47540   Distance:         1.2060546875

     6 Token:'kids'                   Index:  45235   Distance:         1.203125    

     7 Token:'�'                      Index:  146     Distance:         1.2021484375

     8 Token:'�'                      Index:  133     Distance:         1.201171875

     9 Token:' @@'                    Index:  25248   Distance:         1.201171875

    10 Token:'�'                      Index:  144     Distance:         1.2001953125

    11 Token:'DW'                     Index:  42955   Distance:         1.19921875  

    12 Token:' tha'                   Index:  28110   Distance:         1.1962890625

    13 Token:'bsp'                    Index:  24145   Distance:         1.1953125  

    14 Token:'�'                      Index:  137     Distance:         1.1943359375

    15 Token:'cheat'                  Index:  46799   Distance:         1.193359375

    16 Token:'caps'                   Index:  27979   Distance:         1.1884765625

    17 Token:'Â'                      Index:  5523    Distance:         1.1865234375

    18 Token:'@@'                     Index:  12404   Distance:         1.1865234375

    19 Token:'journal'                Index:  24891   Distance:         1.185546875

    20 Token:'utm'                    Index:  26841   Distance:         1.18359375  

    21 Token:'َ'                      Index:  24333   Distance:         1.1796875  

    22 Token:'��'                     Index:  42062   Distance:         1.1787109375

    23 Token:' Kindle'                Index:  27114   Distance:         1.1767578125

    24 Token:' �'                     Index:  23294   Distance:         1.17578125  

    25 Token:'Reviewer'               Index:  35407   Distance:         1.17578125  

    26 Token:' -->'                   Index:  14610   Distance:         1.173828125

    27 Token:'agra'                   Index:  45429   Distance:         1.173828125

    28 Token:'�'                      Index:  160     Distance:         1.1728515625

    29 Token:'cdn'                    Index:  32341   Distance:         1.1708984375

    30 Token:' EDIT'                  Index:  48483   Distance:         1.169921875

    31 Token:'�'                      Index:  135     Distance:         1.1689453125

    32 Token:'�'                      Index:  134     Distance:         1.1669921875

    33 Token:'blogspot'               Index:  35217   Distance:         1.1640625  

    34 Token:' LET'                   Index:  37994   Distance:         1.1640625  

    35 Token:' prob'                  Index:  1861    Distance:         1.1630859375

    36 Token:'�'                      Index:  5099    Distance:         1.1630859375

    37 Token:'wikipedia'              Index:  31266   Distance:         1.162109375

    38 Token:' %%'                    Index:  43313   Distance:         1.162109375

    39 Token:'reek'                   Index:  10316   Distance:         1.16015625  

    40 Token:'ifact'                  Index:  29660   Distance:         1.16015625  

    41 Token:' Neb'                   Index:  29837   Distance:         1.158203125

    42 Token:'�'                      Index:  145     Distance:         1.1572265625

    43 Token:'wiki'                   Index:  15466   Distance:         1.1572265625

    44 Token:' tho'                   Index:  42796   Distance:         1.1572265625

    45 Token:' JJ'                    Index:  38775   Distance:         1.15625    

    46 Token:'""'                     Index:  15931   Distance:         1.1552734375

    47 Token:'‑'                      Index:  20977   Distance:         1.1552734375

    48 Token:' 978'                   Index:  41417   Distance:         1.1552734375

    49 Token:'metadata'               Index:  38993   Distance:         1.154296875

    50 Token:'orest'                  Index:  26522   Distance:         1.1533203125

    51 Token:'malink'                 Index:  31000   Distance:         1.1533203125

    52 Token:'ソ'                      Index:  47559   Distance:         1.1533203125

    53 Token:'HOU'                    Index:  46685   Distance:         1.15234375  

    54 Token:'\x0b'                   Index:  199     Distance:         1.1513671875

    55 Token:'ournals'                Index:  18408   Distance:         1.1513671875

    56 Token:'��'                     Index:  41678   Distance:         1.1513671875

    57 Token:' Joined'                Index:  16709   Distance:         1.150390625

    58 Token:' denomin'               Index:  31457   Distance:         1.150390625

    59 Token:'Ã'                      Index:  5746    Distance:         1.1494140625

    60 Token:'Merit'                  Index:  21583   Distance:         1.1494140625

    61 Token:'umbered'                Index:  26584   Distance:         1.1494140625

    62 Token:' �'                     Index:  27332   Distance:         1.1484375  

    63 Token:' bec'                   Index:  639     Distance:         1.1474609375

    64 Token:'€'                      Index:  26391   Distance:         1.1474609375

    65 Token:'cgi'                    Index:  37157   Distance:         1.1474609375

    66 Token:'\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0\xa0'

                                      Index:  39172   Distance:         1.1474609375

    67 Token:'Rated'                  Index:  15322   Distance:         1.146484375

    68 Token:'tml'                    Index:  20369   Distance:         1.146484375

    69 Token:' PUBLIC'                Index:  44731   Distance:         1.146484375

    70 Token:'document'               Index:  22897   Distance:         1.1455078125

    71 Token:'Uk'                     Index:  28425   Distance:         1.1455078125

    72 Token:'JJ'                     Index:  32178   Distance:         1.1455078125

    73 Token:'ッ'                      Index:  14777   Distance:         1.14453125  

    74 Token:'Joined'                 Index:  24363   Distance:         1.14453125  

    75 Token:'�'                      Index:  47078   Distance:         1.14453125  

    76 Token:'ウ'                      Index:  16165   Distance:         1.1435546875

    77 Token:'メ'                      Index:  26998   Distance:         1.1435546875

    78 Token:'sid'                    Index:  30255   Distance:         1.1435546875

    79 Token:'usercontent'            Index:  43667   Distance:         1.1435546875

    80 Token:' Caption'               Index:  11260   Distance:         1.142578125

    81 Token:' �'                     Index:  14524   Distance:         1.142578125

    82 Token:'�'                      Index:  29785   Distance:         1.142578125

    83 Token:'ْ'                      Index:  48763   Distance:         1.142578125

    84 Token:' redist'                Index:  17678   Distance:         1.1416015625

    85 Token:' shr'                   Index:  10157   Distance:         1.140625    

    86 Token:' newsletters'           Index:  16983   Distance:         1.140625    

    87 Token:'readable'               Index:  46155   Distance:         1.140625    

    88 Token:'"></'                   Index:  23984   Distance:         1.1396484375

    89 Token:'ECK'                    Index:  25171   Distance:         1.1396484375

    90 Token:'agic'                   Index:  9083    Distance:         1.138671875

    91 Token:'Catal'                  Index:  39075   Distance:         1.138671875

    92 Token:'cler'                   Index:  22902   Distance:         1.1376953125

    93 Token:'=""'                    Index:  33151   Distance:         1.1376953125

    94 Token:'\n\xa0'                 Index:  44320   Distance:         1.1376953125

    95 Token:'\x10'                   Index:  204     Distance:         1.13671875  

    96 Token:'��'                     Index:  21253   Distance:         1.13671875  

    97 Token:'ovy'                    Index:  27796   Distance:         1.13671875  

    98 Token:'1016'                   Index:  27956   Distance:         1.13671875  

    99 Token:'ま'                      Index:  30159   Distance:         1.13671875

Top 100 GPT-j mean-distance-from-centroid tokens

mean distance from centroid = 1.0029296875

     0  Token:' ha'          Index:  387     Distance:         1.0029296875

     1  Token:'ack'          Index:  441     Distance:         1.0029296875

     2  Token:' im'          Index:  545     Distance:         1.0029296875

     3  Token:' trans'       Index:  1007    Distance:         1.0029296875

     4  Token:' ins'         Index:  1035    Distance:         1.0029296875

     5  Token:'pr'           Index:  1050    Distance:         1.0029296875

     6  Token:' Im'          Index:  1846    Distance:         1.0029296875

     7  Token:'use'          Index:  1904    Distance:         1.0029296875

     8  Token:'ederal'       Index:  2110    Distance:         1.0029296875

     9  Token:'ried'         Index:  2228    Distance:         1.0029296875

    10  Token:'ext'          Index:  2302    Distance:         1.0029296875

    11  Token:'amed'         Index:  2434    Distance:         1.0029296875

    12  Token:' Che'         Index:  2580    Distance:         1.0029296875

    13  Token:'oved'         Index:  2668    Distance:         1.0029296875

    14  Token:' Mark'        Index:  2940    Distance:         1.0029296875

    15  Token:'idered'       Index:  3089    Distance:         1.0029296875

    16  Token:' Rec'         Index:  3311    Distance:         1.0029296875

    17  Token:' Paul'        Index:  3362    Distance:         1.0029296875

    18  Token:' Russian'     Index:  3394    Distance:         1.0029296875

    19  Token:' Net'         Index:  3433    Distance:         1.0029296875

    20  Token:' har'         Index:  3971    Distance:         1.0029296875

    21  Token:' William'     Index:  3977    Distance:         1.0029296875

    22  Token:' firm'        Index:  4081    Distance:         1.0029296875

    23  Token:' climate'     Index:  4258    Distance:         1.0029296875

    24  Token:' stream'      Index:  4269    Distance:         1.0029296875

    25  Token:' expand'      Index:  4292    Distance:         1.0029296875

    26  Token:' micro'       Index:  4580    Distance:         1.0029296875

    27  Token:' multi'       Index:  5021    Distance:         1.0029296875

    28  Token:' fuck'        Index:  5089    Distance:         1.0029296875

    29  Token:' illegal'     Index:  5293    Distance:         1.0029296875

    30  Token:'Int'          Index:  5317    Distance:         1.0029296875

    31  Token:' Rad'         Index:  5325    Distance:         1.0029296875

    32  Token:'eds'          Index:  5379    Distance:         1.0029296875

    33  Token:'TA'           Index:  5603    Distance:         1.0029296875

    34  Token:' marijuana'   Index:  5727    Distance:         1.0029296875

    35  Token:' shop'        Index:  6128    Distance:         1.0029296875

    36  Token:' mine'        Index:  6164    Distance:         1.0029296875

    37  Token:' Offic'       Index:  6328    Distance:         1.0029296875

    38  Token:' Paris'       Index:  6342    Distance:         1.0029296875

    39  Token:'ulture'       Index:  6456    Distance:         1.0029296875

    40  Token:'care'         Index:  6651    Distance:         1.0029296875

    41  Token:' Lo'          Index:  6706    Distance:         1.0029296875

    42  Token:' bike'        Index:  7161    Distance:         1.0029296875

    43  Token:' jail'        Index:  7356    Distance:         1.0029296875

    44  Token:'Source'       Index:  7416    Distance:         1.0029296875

    45  Token:' Ireland'     Index:  7517    Distance:         1.0029296875

    46  Token:'aning'        Index:  7574    Distance:         1.0029296875

    47  Token:' cutting'     Index:  7720    Distance:         1.0029296875

    48  Token:' murd'        Index:  7847    Distance:         1.0029296875

    49  Token:' myth'        Index:  7918    Distance:         1.0029296875

    50  Token:'lights'       Index:  8091    Distance:         1.0029296875

    51  Token:'rance'        Index:  8132    Distance:         1.0029296875

    52  Token:' Exper'       Index:  8170    Distance:         1.0029296875

    53  Token:'Ne'           Index:  8199    Distance:         1.0029296875

    54  Token:' Return'      Index:  8229    Distance:         1.0029296875

    55  Token:'00000000'     Index:  8269    Distance:         1.0029296875

    56  Token:' ordinary'    Index:  8850    Distance:         1.0029296875

    57  Token:' enorm'       Index:  8885    Distance:         1.0029296875

    58  Token:' loyal'       Index:  9112    Distance:         1.0029296875

    59  Token:' kiss'        Index:  9245    Distance:         1.0029296875

    60  Token:' entity'      Index:  9312    Distance:         1.0029296875

    61  Token:'DC'           Index:  9697    Distance:         1.0029296875

    62  Token:' joke'        Index:  9707    Distance:         1.0029296875

    63  Token:'izza'         Index:  9990    Distance:         1.0029296875

    64  Token:' Move'        Index:  10028   Distance:         1.0029296875

    65  Token:' Walker'      Index:  10120   Distance:         1.0029296875

    66  Token:' Samsung'     Index:  10397   Distance:         1.0029296875

    67  Token:' graduate'    Index:  10428   Distance:         1.0029296875

    68  Token:' generations' Index:  10439   Distance:         1.0029296875

    69  Token:'ilation'      Index:  10520   Distance:         1.0029296875

    70  Token:' math'        Index:  10688   Distance:         1.0029296875

    71  Token:' retirement'  Index:  10737   Distance:         1.0029296875

    72  Token:'Run'          Index:  10987   Distance:         1.0029296875

    73  Token:'ele'          Index:  11129   Distance:         1.0029296875

    74  Token:' Conservative'Index:  11132   Distance:         1.0029296875

    75  Token:'walk'         Index:  11152   Distance:         1.0029296875

    76  Token:'blem'         Index:  11253   Distance:         1.0029296875

    77  Token:' Rather'      Index:  11317   Distance:         1.0029296875

    78  Token:'oda'          Index:  11329   Distance:         1.0029296875

    79  Token:' consensus'   Index:  11529   Distance:         1.0029296875

    80  Token:'track'        Index:  11659   Distance:         1.0029296875

    81  Token:'gments'       Index:  11726   Distance:         1.0029296875

    82  Token:' gui'         Index:  11774   Distance:         1.0029296875

    83  Token:'forward'      Index:  11813   Distance:         1.0029296875

    84  Token:' chamber'     Index:  11847   Distance:         1.0029296875

    85  Token:' cats'        Index:  11875   Distance:         1.0029296875

    86  Token:' disk'        Index:  11898   Distance:         1.0029296875

    87  Token:' ME'          Index:  11948   Distance:         1.0029296875

    88  Token:'aro'          Index:  12022   Distance:         1.0029296875

    89  Token:' settle'      Index:  12259   Distance:         1.0029296875

    90  Token:' sustained'   Index:  12605   Distance:         1.0029296875

    91  Token:'bes'          Index:  12636   Distance:         1.0029296875

    92  Token:' Netherlands' Index:  12671   Distance:         1.0029296875

    93  Token:' "/'          Index:  12813   Distance:         1.0029296875

    94  Token:' probability' Index:  12867   Distance:         1.0029296875

    95  Token:'Mart'         Index:  13143   Distance:         1.0029296875

    96  Token:' bankrupt'    Index:  13158   Distance:         1.0029296875

    97  Token:'named'        Index:  13190   Distance:         1.0029296875

    98  Token:' powered'     Index:  13232   Distance:         1.0029296875

    99  Token:' exceptions'  Index:  13269   Distance:         1.0029296875