| A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | any_url | count | total_conflicting | Total | Query | |||||||||||||||||||||
2 | https://new.kasumata.ee/ | 1 | 77252 | 29,735,203 | select any_value(url) as any_url, count(*) as count, total_conflicting from ( | |||||||||||||||||||||
3 | https://www.raamatuost.ee/ | 1 | 77074 | SELECT url, max(id_count) as max_per_id, count(*) as total_conflicting FROM( | ||||||||||||||||||||||
4 | https://cfapi.centminmod.com/ | 1 | 60475 | #standardSQL | ||||||||||||||||||||||
5 | https://www.facebook.com/login/?next=https%3A%2F%2Fwww.facebook.com%2Fprivacy_sandbox%2Ftopics%2Fregistration%2F%3Fid%3D510235355828933 | 1 | 51127 | # This query finds pages in the HTTP Archive that have duplicate element IDs in their HTML. | ||||||||||||||||||||||
6 | https://docda.de/ | 2 | 45513 | SELECT | ||||||||||||||||||||||
7 | https://www.facebook.com/login/?next=https%3A%2F%2Fwww.facebook.com%2Fprivacy_sandbox%2Ftopics%2Fregistration%2F%3Fid%3D2037053586588160 | 1 | 39963 | -- The unique identifier for the page. | ||||||||||||||||||||||
8 | https://nomoskopio.gr/nomos_content.php | 2 | 34632 | url, | ||||||||||||||||||||||
9 | https://www.catwalkpictures.com/ | 3 | 29731 | -- The duplicate ID that was found. | ||||||||||||||||||||||
10 | https://gumroad.com/cart_items_count | 1 | 29022 | id, | ||||||||||||||||||||||
11 | https://oaf.ljmu.ac.uk/ | 1 | 28369 | -- The number of times the ID was found on the page. | ||||||||||||||||||||||
12 | https://repascentrum.sk/ | 1 | 26178 | COUNT(id) AS id_count | ||||||||||||||||||||||
13 | https://carkitstunter.nl/contents/nl/d-33.html | 1 | 25455 | FROM | ||||||||||||||||||||||
14 | https://ad.360yield.com/user_sync?rt=html&partner_id=1680&gdpr=0&gdpr_consent=&r=https%3A%2F%2Fs.seedtag.com%2Fcs%2Fcookiesync%2Fimprovedigital%3Fchanneluid%3D%7BPUB_USER_ID%7D | 1 | 25288 | -- The table containing request and response data. | ||||||||||||||||||||||
15 | https://www.facebook.com/login/?next=https%3A%2F%2Fwww.facebook.com%2Fprivacy_sandbox%2Ftopics%2Fregistration%2F%3Fid%3D899838500042702 | 1 | 23621 | `httparchive.crawl.requests`, | ||||||||||||||||||||||
16 | https://www.facebook.com/login/?next=https%3A%2F%2Fwww.facebook.com%2Fprivacy_sandbox%2Ftopics%2Fregistration%2F%3Fid%3D139085250159210 | 1 | 23391 | -- REGEXP_EXTRACT_ALL captures all substrings that match the regex pattern. | ||||||||||||||||||||||
17 | https://allmart.ro/categorie-produs/birotica-si-papetarie/ | 1 | 23101 | -- We're looking for id attributes with either single or double quotes. | ||||||||||||||||||||||
18 | https://dataseason.ru/ | 1 | 22846 | -- The UNNEST function then expands the resulting array of IDs into individual rows. | ||||||||||||||||||||||
19 | https://vmoreserialov.ru/ | 1 | 22840 | UNNEST(REGEXP_EXTRACT_ALL(response_body, r'id=["\']([^"\'\s]+)["\']')) AS id | ||||||||||||||||||||||
20 | https://masterserial.ru/ | 1 | 22839 | WHERE | ||||||||||||||||||||||
21 | https://ssbdb.doshisha.ac.jp/thesis/thesis_list.php | 2 | 22370 | type = 'html' | ||||||||||||||||||||||
22 | https://awine.kr/ | 1 | 21943 | AND date > "2025-07-01" | ||||||||||||||||||||||
23 | https://www.linear.eu/de/home/ | 3 | 21683 | AND response_body IS NOT NULL | ||||||||||||||||||||||
24 | https://agrownet.com/contents/en-us/d-33.html | 2 | 21612 | AND TRIM(id) != '' -- Exclude empty id attributes like id="" | ||||||||||||||||||||||
25 | https://3dmall.gr/ | 1 | 20225 | GROUP BY | ||||||||||||||||||||||
26 | https://www.bikersbuyit.com/Shops/bbiholland/contents/nl/d-33.html | 1 | 20137 | -- Group by the page and the extracted ID to count occurrences. | ||||||||||||||||||||||
27 | https://vboblobprod.blob.core.windows.net/awsvboticketscom/_images/seatmaps/svgmap_8023.html | 1 | 20102 | url, | ||||||||||||||||||||||
28 | https://mrfresh-schnelsen.lieferservice-ohne-provision.de/ | 1 | 19320 | id HAVING id_count>1) group by url) | ||||||||||||||||||||||
29 | https://www.clampitt.com/ | 1 | 18812 | group by total_conflicting | ||||||||||||||||||||||
30 | https://www.broditnederland.nl/contents/nl/d-33.html | 2 | 18523 | |||||||||||||||||||||||
31 | https://www.eberle.de/typo3conf/ext/eberle/Resources/Public/javascript/Produktfinder/fetch_data.php | 1 | 18103 | |||||||||||||||||||||||
32 | https://www.kurankelimemeali.com/fatiha/1-ayet-meali | 2 | 18069 | |||||||||||||||||||||||
33 | https://www.studentdisciplinedefense.com/ | 1 | 17848 | |||||||||||||||||||||||
34 | https://www.kaientai.cc/digicatainfo.aspx | 1 | 17670 | |||||||||||||||||||||||
35 | https://swimming.mossport.ru/ | 1 | 17590 | |||||||||||||||||||||||
36 | https://wisniowa.edu.pl/ | 1 | 17195 | |||||||||||||||||||||||
37 | https://www.facnor.com/ | 1 | 17177 | |||||||||||||||||||||||
38 | https://www.reifen-felgen.de/ | 1 | 17132 | |||||||||||||||||||||||
39 | https://plaka-watersports.com/ | 1 | 16560 | |||||||||||||||||||||||
40 | https://kidtunz.com/ | 1 | 16425 | |||||||||||||||||||||||
41 | https://www.turbobaltic.com/ | 2 | 16357 | |||||||||||||||||||||||
42 | https://www.centralferreteria.cl/ | 1 | 16287 | |||||||||||||||||||||||
43 | https://www.mickperrin.com/ | 1 | 15969 | |||||||||||||||||||||||
44 | https://jobs.centracare.com/us/en | 1 | 15910 | |||||||||||||||||||||||
45 | https://www.eberle.de/typo3conf/ext/eberle/Resources/Public/javascript/Ersatztypsuche/selectsearch.php | 1 | 15858 | |||||||||||||||||||||||
46 | https://rgreform.com/calcular-presupuesto-reforma-online-gratis/ | 1 | 15764 | |||||||||||||||||||||||
47 | https://savewizard.net/wizardtest/game_hyperkin.php | 1 | 15557 | |||||||||||||||||||||||
48 | https://kitcia.com.br/catalogo-online-kitcia/?bapf_gid=137958 | 1 | 15545 | |||||||||||||||||||||||
49 | https://steam-tracker.com/ | 1 | 15482 | |||||||||||||||||||||||
50 | https://www.hiddenmeanings.com/ | 1 | 15480 | |||||||||||||||||||||||
51 | https://ooobvs.ru/ | 1 | 15432 | |||||||||||||||||||||||
52 | https://www.savewizard.net/wizardtest/game_test.php | 1 | 15417 | |||||||||||||||||||||||
53 | https://computos2024.iepc-chiapas.org/pages/Gub/00.html | 1 | 15334 | |||||||||||||||||||||||
54 | https://www.vgka.de/ | 1 | 15328 | |||||||||||||||||||||||
55 | https://rieber.systems/de | 2 | 15285 | |||||||||||||||||||||||
56 | https://testovizavozacka.neocities.org/odgovoreni.htm | 2 | 15044 | |||||||||||||||||||||||
57 | https://gaitherconcerts.thundertix.com/ | 2 | 14801 | |||||||||||||||||||||||
58 | https://www.facebook.com/login/?next=https%3A%2F%2Fwww.facebook.com%2Fprivacy_sandbox%2Ftopics%2Fregistration%2F%3Fid%3D1616410655322279 | 1 | 14595 | |||||||||||||||||||||||
59 | https://auto-pak.pl/ | 1 | 14588 | |||||||||||||||||||||||
60 | https://www.forevermoto.it/ | 1 | 14527 | |||||||||||||||||||||||
61 | https://jerseylova.com/ | 1 | 14320 | |||||||||||||||||||||||
62 | https://docs.google.com/spreadsheets/d/e/2PACX-1vR1lxQY9bN0kmA5T5EX4LrcClFSJYBq3UkhlFrtgAFZPeOZeMUozUCHt-Fxo0iSfWUMiqMemMb7pB2Y/pubhtml/sheet?headers=false&gid=0 | 1 | 14009 | |||||||||||||||||||||||
63 | https://www.facebook.com/login/?next=https%3A%2F%2Fwww.facebook.com%2Fprivacy_sandbox%2Ftopics%2Fregistration%2F%3Fid%3D846721642067046 | 1 | 14004 | |||||||||||||||||||||||
64 | https://akrogiali-agistri.gr/ | 1 | 13954 | |||||||||||||||||||||||
65 | https://experts.uum.edu.my/ | 1 | 13715 | |||||||||||||||||||||||
66 | https://refurbiestore.de/ | 1 | 13682 | |||||||||||||||||||||||
67 | https://sarvaindia.com/index.aspx | 1 | 13386 | |||||||||||||||||||||||
68 | https://hinduscriptures.in/ | 2 | 13310 | |||||||||||||||||||||||
69 | https://primaistora.bg/ | 1 | 13082 | |||||||||||||||||||||||
70 | https://www.sait.health/ | 1 | 12947 | |||||||||||||||||||||||
71 | https://lc100e.github.io/menu.html | 1 | 12754 | |||||||||||||||||||||||
72 | https://psnews.ro/ | 1 | 12665 | |||||||||||||||||||||||
73 | https://www.hinduscriptures.in/scriptures/introduction-of-scriptures/vedic-scriptures-an-introduction | 2 | 12610 | |||||||||||||||||||||||
74 | https://escalerasdemadera.com.co/ | 1 | 12455 | |||||||||||||||||||||||
75 | https://carparts-market.pl/ | 2 | 12431 | |||||||||||||||||||||||
76 | https://www.facebook.com/login/?next=https%3A%2F%2Fwww.facebook.com%2Fprivacy_sandbox%2Ftopics%2Fregistration%2F%3Fid%3D354868328052100 | 1 | 12421 | |||||||||||||||||||||||
77 | https://firstautomotive.com.br/ | 1 | 12257 | |||||||||||||||||||||||
78 | https://childrensermons.com/ | 1 | 12176 | |||||||||||||||||||||||
79 | https://cycc2024.my.canva.site/ | 1 | 12138 | |||||||||||||||||||||||
80 | https://pskomsklep.pl/ | 1 | 12011 | |||||||||||||||||||||||
81 | https://seed-pk.com/ | 1 | 11863 | |||||||||||||||||||||||
82 | https://xn--80aapawgqaulx4c1c.xn--p1ai/ | 1 | 11827 | |||||||||||||||||||||||
83 | https://www.yokohama.com.cn/ | 1 | 11732 | |||||||||||||||||||||||
84 | https://elettronicadirollo.com/en/ | 1 | 11638 | |||||||||||||||||||||||
85 | https://elettronicadirollo.com/ | 1 | 11619 | |||||||||||||||||||||||
86 | https://www.sarel.co.il/ | 1 | 11550 | |||||||||||||||||||||||
87 | https://www.jlrepc.com/ | 2 | 11506 | |||||||||||||||||||||||
88 | https://trabajos.compassgroupcareers.com/ | 1 | 11446 | |||||||||||||||||||||||
89 | https://kmlnetworklink.gsi.go.jp/kmlnetworklink/ | 1 | 11445 | |||||||||||||||||||||||
90 | https://www.builderreviews.co.nz/ | 1 | 11440 | |||||||||||||||||||||||
91 | https://www.leandroxavier.blog.br/ | 1 | 11417 | |||||||||||||||||||||||
92 | https://hanketori.fi/wp-admin/admin-ajax.php | 1 | 11384 | |||||||||||||||||||||||
93 | https://docs.mendix.com/ | 1 | 11382 | |||||||||||||||||||||||
94 | https://www.tyhafan.org/ | 1 | 11244 | |||||||||||||||||||||||
95 | https://infonista.jp/api/modal/station/home.html?20250612 | 1 | 11241 | |||||||||||||||||||||||
96 | https://5echm.aivu.top/webhelpcontents.htm | 2 | 11176 | |||||||||||||||||||||||
97 | https://aacalc.ru/ | 1 | 11148 | |||||||||||||||||||||||
98 | https://isidomain.web.id/ | 1 | 11101 | |||||||||||||||||||||||
99 | https://jobs.ua/ | 1 | 11054 | |||||||||||||||||||||||
100 | https://tldr.dendron.so/nav.html | 1 | 11004 |