Hontza-GSheets-v1
 Share
The version of the browser you are using is no longer supported. Please upgrade to a supported browser.Dismiss

View only
 
 
ABCDEFGHIJKLMNOPQRSTUV
1
http://www.hontza.eshttp://bit.ly/Hontza-GSheetshttps://docs.google.com/spreadsheets/u/0/?tgif=d
2
Scraping Básico con GSheets (para Hontza)
3
4
1.-¿Por qué debería usar Google Sheets para escrapear mis fuentes?AYUDA - Más Info
5
- Google Sheets es un entorno estable, potente, gratis y usable por NO programadoresFunciones de Google Sheet
6
- Con Google Sheets escrapearás fuentes sin RSS y comprobarás el resultado al instanteFunción ImportXML
7
- Con la función ImportXML podrás extraer títulos, enlaces, resumenes y textos selectos de páginas web, usando expresiones XPathTutorial XPath en Español
8
- Si todavía no sabes nada de ImportXML ni de XPath, este es un buen momento para aprender! Pulsa en los enlaces de AYUDA - Más InfoHoja Resumen de XPath
9
- Instala el plugin Scraper en Chrome! Te mostrará las expresiones XPath correctas y te permitirá jugar y probar variantesPlugin Scraper para Chrome
10
- Lee el Tutorial XPath y no pierdas la Hoja Resumen XPath para arrancar fácilmente
11
- Con este documento simplificarás la gestion de las tareas de escrapeo mediante Plantillas fáciles de rellenar
12
- Descarga e Instala Hontza. Con Hontza importarás directamente estas Plantillas de Google SheetsDescargar e instalar Hontza
13
14
2.-¿Cuál es el OBJETIVO de este documento?AYUDA - Más Info
15
- Que personalices varias Plantillas para explotar tus fuentes y las integres fácilmente en Hontza
Mira las Plantillas en el pie de esta página
16
17
3.-¿Qué CONTENIDO tiene este documento?AYUDA - Más Info
18
- Varias Plantillas para que escrapees tus fuentes. La primera tiene un ejemplo BásicoPulsa en la pestaña 2.-Ej-BASICO
19
- El Script Hontza para que personalices la frecuencia de actualización de las fuentes
20
21
4.- ¿Cómo puedo CONFIGURAR y ACTIVAR mi Google Sheet?AYUDA - Más Info
22
1.- Haz login en GMail, copia esta hoja (con comentarios) en tu Google Drive y renómbrala a tu gusto. Ya tienes TU Google Sheet!!Menu- Archivo- Crear una Copia
23
2.- Apunta tu nuevo Google Sheet ID, está en la URL de tu página
Mira en tu navegador la URL de la página!
24
- Para ayudarte a identificarlo, a continuación ponemos en rojo el ID de esta Google Sheet tal como aparece en la URL
25
- https://docs.google.com/spreadsheets/d/19aJAit0T19xJcyCXB6Leds5af1IXGDonjWFX5rBXS6Q/edit#gid=1572566344
26
3.- Personaliza el Script Hontza: Pulsa en el menu [Herramientas] - [Editor de Secuencia de comandos]Menu- Herramientas- Editor de...
27
- Sustituye en la línea 30 el valor de la variable ID por tu Google Sheet ID
28
- Ajusta el temporizador a tus necesidades pulsando en el icono del reloj "activador de secuencias"Menu - Icono "Reloj"
29
- Autoriza al Script Hontza para acceder a tu Google Sheet y ejecutar las funciones ImportXML
30
- Configura tus avisos pulsando en Notificaciones, los recibirás sólo si falla la ejecución del Script Hontza
31
- Comprueba que no hay mensajes de error pulsando en el icono "ejecutar"Menu - Icono "Play"
32
- Pulsa "Guardar" para grabar los cambios. Sal de la página cerrando la pestaña del navegadorMenu - Icono "Diskette"
33
4.- Publica tu Google Sheet en 2 pasos para que Hontza pueda leer los contenidos
34
- Boton AZUL superior derecho [Compartir] - [Avanzado] - [Cambiar] - seleccionar "Cualquier usuario con el enlace" "Puede ver" y guardar
Menu - Compartir - Avanzado - Cambiar
35
- Menú superior [Archivo] - [Publicar en la Web] - [Enlace] - seleccionar "Todo el documento" y guardar
Menu - Archivo - Publicar en la Web - Enlace
36
37
5.- ¿Cómo puedo PERSONALIZAR cada Plantilla?AYUDA - Más Info
38
- En el nombre de las Plantillas [N.- Plantilla] NO puedes cambiar el número N
39
- No elimines las Plantillas ni alteres su orden, eso afecta a su importación desde Hontza
40
- En cada Plantilla, edita las celdas de la Columna B para escrapear los datos de tu página web de interés
Usa Scrape para comprobar los XPath
41
- No modifiques las celdas en gris, contienen fórmulas o encabezamientos importantes para su importación
42
- Hontza importará, de cada Plantilla, las columnas cuyo encabezamiento sea: Title, Link, Description
43
- Recomendación: Si quieres escrapear muchas fuentes, usa muchas Google Sheet ligeras, con pocas Plantillas
44
- Google ralentiza las funciones ImportXML cuando hay muchas en una misma hoja Google Sheet
45
46
6.- ¿Cómo puedo IMPORTAR mis Google Sheets a Hontza?AYUDA - Más Info
47
- En Hontza, en la pestaña [Vigilancia], en el menú [Añadir Canal], pulsa en [Google Sheets]
Hontza - Vigilancia - Añadir Canal - G.Sheets
48
- Introduce tu Google Sheet ID y el número de la hoja (número de la Plantilla)
49
50
7.- Ya he hecho todo el proceso ... y ahora ¿qué pasa?AYUDA - Más Info
51
1.- Cada Plantilla de Google Sheet escrapeará sistemáticamente cada una de tus fuentes
52
2.- Cada Canal de Hontza descargará automáticamente las noticias escrapeadas por cada Plantilla de G.Sheet
53
3.- En Hontza te centrarás en lo que eres insustituible: analizar las novedades y generar ideas/proyectos!!
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Loading...
Main menu