AB
1
馃攢 XPath para SEO 馃殌 Cheat Sheet
2
by 馃寪 miguelpau.es 馃惁@miguelpau
3
4
SCRAPING DE HTML B脕SICO Y PARAMETRIZADO
5
6
Expresi贸n XPath驴Qu茅 nos devuelve?
7
//titleContenido de la etiqueta title
8
//meta[@name='description']/@contentContenido de la meta-etiqueta description
9
//h1Contenido de todas las etiquetas H1 que haya en la URL
10
//h1/text()[1]Contenido de la primera etiqueta H1 que se encuentre
11
count(//h1)N潞 de etiquetas H1 en la p谩gina
12
//link[@rel='canonical']/@hrefValor de la etiqueta rel canonical
13
//meta[@name='robots']/@contentValor de la etiqueta meta-robots
14
//a/@href[contains(.,'texto')]
URL de un enlace que contengan en el valor de href el texto indicado, por ejemplo un dominio
15
//a[contains(@href, 'texto')]Anchor text usado en un enlace que contenga el texto indicado en el atributo href
16
//a[contains(@href, 'URL')]/@relValor de la etiqueta rel de un enlace (si existe) cuya URL coincida con la indicada
17
//a[contains(@rel, 'nofollow')]/@hrefRelaci贸n de URLs de enlaces cuya etiqueta rel contiene nofollow
18
//a[@style='display:none;']/@hrefRelaci贸n de enlaces ocultos con display:none;
19
//a[@href='https://www.dominio.es/blog']/attribute::*
Relaci贸n de atributos que tiene ese enlace
20
//link/@hreflangValores ISO de todos los hreflang definidos
21
//link[@hreflang]/@hrefValores (URLS) de los href que figuran en cada hreflang definido
22
//img[not(@alt)]/@srcRelaci贸n de im谩genes sin texto en el atributo ALT
23
//*[@class="breadcrumb"]/span/span/a
Todos los anchor texts de migas de pan para unas breadcrumbs que tienen el class "breadcrumb" (Ejemplo)
24
SCRAPING DE SERPS
25
26
Expresi贸n XPath驴Qu茅 nos devuelve?
27
//*[@id="rso"]/div/div/div[1]/a/@hrefRelaci贸n de URLs del listado de la p谩gina de resultados
28
//*[@id="rso"]/div/div/div[1]/a/h3Relaci贸n de titles de los snippets en el listado de la p谩gina de resultados
29
//*[@class='card-section']/div/p/a
Lista de b煤squedas relacionadas que se muestra hacia el final de p谩gina de resultados
30
//*[@class='related-question-pair']/g-accordion-expander/div/div
Relaci贸n de preguntas+respuestas del bloque "Otras preguntas de los usuarios"
31
SCRAPING DE DATOS ESTRUCTURADOS, TWITTER CARDS Y OPEN GRAPH
32
33
Expresi贸n XPath驴Qu茅 nos devuelve?
34
//*[@itemtype]/@itemtypeRelaci贸n de todos los marcados de datos incluidos en la URL escrapeada
35
//meta[@property='article:published_time']/@content
Fechas de los posts, 煤til cuando el atributo fecha no se est谩 visualizando en el post
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100