1 of 51

Disponibilidad del conocimiento científico y acceso abierto a código y datos de investigación

2, 7, 9 y 14 de septiembre 2021

2 of 51

Talleristas

Luis D. Verde Arregoitia

Biólogo - Universidad Nacional Autónoma de México, México

Dr. en Ciencias Biológicas - Universidad de Queensland, Australia

Instructor Certificado por RStudio

www.liomys.mx; @LuisDVerde

  • Ecomorfología y evolución de pequeños mamíferos, biogeografía, programación funcional en R

Adriana Calahorra Oliart

Bióloga - Universidad Nacional Autónoma de México, México

Maestra en Ciencias Biológicas - Universidad Nacional Autónoma de México, México

Cand. a Dra. en Ciencias Biológicas - Universidad Nacional Autónoma de México, México

  • Morfometría geométrica, modelado de nicho ecológico, taxonomía integrativa

3 of 51

https://www.anid.cl/blog/2020/11/25/con-amplio-consenso-anid-inicia-hoja-de-ruta-de-politica-de-acceso-abierto/

4 of 51

Contenidos:

  1. Flujos de trabajo para análisis trazables y reproducibles en R (Semana 1)

  • Publicación y deposición de datos de investigación (Semana 2)

5 of 51

6 of 51

Organización de archivos & datos

7 of 51

comprobante.pdf

comprobante(1).pdf

mayo.pdf

arriendo.pdf

paint23.exe

pago 04.pdf

gasFeb.pdf

mayo2020.pdf

pagado.pdf

trTerceros02.pdf

vacaciones2007dsa34.jpg

zoom.zip

tarea2019.docx

contrato22.pdf

8 of 51

https://ascii-tree-generator.com/

9 of 51

Código

Datos

Figuras

Resultados

Flujo de trabajo

10 of 51

https://books.ropensci.org/targets/drake.html

11 of 51

-No modificar los datos ‘crudos’

-Optimizar pasos intermedios

-Evitar repetición

Datos

Figuras

Resultados

Finales

Datos &

Resultados Intermedios

12 of 51

13 of 51

Organización de código

Nombres/fechas

Rotular secciones importantes

Orden lógico

Pasos secuenciales

14 of 51

Organización de código

# para comentarios y anotaciones

librería {styler} para formato automático del código

librería {littleboxes} para cajas de comentarios

https://github.com/ThinkR-open/littleboxes

CTRL + SHIFT + R para insertar secciones

15 of 51

Reportando métodos y resultados

Para que otros puedan replicar el trabajo, con otros datos pero los mismos métodos

Para que otros puedan reproducir el trabajo con los mismos datos y métodos, tal como se reportó.

Reconocimiento a quienes aportan datos, métodos, o materiales.

16 of 51

El análisis estadístico se realizó utilizando el programa estadístico Rstudio, donde se aplicó un análisis discriminante.

El análisis estadístico se realizó utilizando el entorno de programación estadística R (R Core Team 2020) versión 4.1.0. Se donde se aplicó un análisis discriminante cuadrático con los argumentos predeterminados de la función ‘quaDA’ del paquete DiscriMiner (Sanchez 2013). Los datos y códigos correspondientes están disponibles en el material suplementario S1.

17 of 51

Lenguaje

R, Python, Julia, etc.

Entorno (IDE)

RStudio, VS Code, Sublime, etc.

Librerías

{phytools}, {vegan}

Funciones

Reportar:

Versión

Versión, Compañia, Ubicación

Autor, Versión, Cita

Argumentos importantes

18 of 51

El análisis estadístico se realizó utilizando el entorno de programación estadística R (R Core Team 2020) versión 4.1.0. Se donde se aplicó un análisis discriminante cuadrático con los argumentos predeterminados de la función ‘quaDA’ del paquete DiscriMiner (Sanchez 2013). Los datos y códigos correspondientes están disponibles en el material suplementario S1.

19 of 51

Reportando versiones

sessionInfo()

citation()

{annotater}

{grateful}

https://github.com/Pakillo/grateful

Para consultar detalles de sistema, versiones, paquetes, etc.

Para consultar la cita para R o para un paquete en específico

Añade datos de versión y repositorio a un archivo .R

Genera citas para todos los paquetes mencionados en un archivo .R

20 of 51

Citas a datos

Crédito a quienes contribuyeron a la generación, curación, y almacenamiento de datos de investigación.

Citas por requerimiento institucional, editorial, o legal.

Genera vínculos bibliográficos y conecta las publicaciones con sus datos subyacentes.

21 of 51

Ejemplo 1:

Dryad: citar artículo original & el paquete de datos

Artículo:

Westbrook JW, Kitajima K, Burleigh JG, Kress WJ, Erickson DL, Wright SJ (2011) What makes a leaf tough? Patterns of correlated evolution between leaf toughness traits and demographic rates among 197 shade-tolerant woody species in a neotropical forest. American Naturalist 177(6): 800-811. http://dx.doi.org/10.1086/659963

Datos:

Westbrook JW, Kitajima K, Burleigh JG, Kress WJ, Erickson DL, Wright SJ (2011) Data from: What makes a leaf tough? Patterns of correlated evolution between leaf toughness traits and demographic rates among 197 shade-tolerant woody species in a neotropical forest. Dryad Digital Repository. http://dx.doi.org/10.5061/dryad.8525

22 of 51

Ejemplo 2:

Citar el paquete de datos dentro de la publicación que los describe

...available as an archived repository (Colunga-Salas et al., 2019).

Artículo: Colunga-Salas, P, Sánchez-Montes, S, Grostieta, E, et al. What do studies in wild mammals tell us about human emerging viral diseases in Mexico? Transbound Emerg Dis. 2020; 67: 33– 45. https://doi.org/10.1111/tbed.13336

Datos: Colunga-Salas, P., Sánchez-Montes, S., Grostieta, E., et al. (2019). What do studies in wild mammals tell us about human emerging viral diseases in Mexico? Zenodo Data Package. Retrieved from https://zenodo.org/record/3187486

23 of 51

Reportando resultados

tablas de R a Word con {flextable}

https://ardata-fr.github.io/flextable-book/

{broom} para procesar modelos

write.csv(), pegar en procesador de texto y convertir en tabla

scales::pvalue() para darle formato a estadísticos p

{report} para generar reportes estadísticos estandarizados para objetos de R

https://easystats.github.io/report/articles/report.html

24 of 51

Formatos y estructuras para almacenamiento y difusión de datos de investigación.

Rodríguez Sánchez et al. (2016)

25 of 51

Formatos

Hoja de cálculo

Tablas en un .doc

Tablas en un .docx

Bases de datos relacionales

Tablas en un PDF

Tablas en una imagen

Archivos de texto plano

?

Gradiente de facilidad de uso y acceso inmediato a los datos

26 of 51

27 of 51

28 of 51

Estructuras

Presentación/Claridad/Legibilidad

Uso de espacio

  • En memoria
  • En páginas impresas o digitales

¿Uso inmediato?

29 of 51

30 of 51

31 of 51

Bad Data Handbook

Q.E. MacCallum (2012)

Datos para consumo humano

Datos para consumo computacional

!=

32 of 51

Deposición de datos, documentos, y código

33 of 51

Deposición de datos y código

  • Cŕedito y atribución
  • Identificador único
  • Persistencia
  • Accesibilidad
  • Especificidad (Versiones y actualizaciones)

British Ecological Society Guides to Better Science: Reproducible Code (2019)

34 of 51

Repositorios

Zenodo

Dryad

OSF

Figshare

VIVLI

Harvard Dataverse

e-cienciaDatos

https://fairsharing.org/collection/GeneralRepositoryComparison

💵

💾

🔬🧬🥼

🔒

35 of 51

Licencias

Para establecer y comunicar de forma clara:

  • Las condiciones que rigen la utilización de un determinado conjunto de datos

  • Los usos a los que se pueden someter los datos en caso de reutilización y las condiciones que deberán tener en cuenta en materia de propiedad intelectual.

Declaraciones explícitas que conceden permisos sobre el uso de un trabajo

36 of 51

Licencias

Guías para elegir licencias para datos

https://help.figshare.com/article/what-is-the-most-appropriate-licence-for-my-data

https://choosealicense.com/

Para datos

Para código

  • Requerir atribución al contenido original
  • Permitir o prohibir uso comercial
  • Requerir que cualquier producto derivado use la misma licencia

37 of 51

Acceso Abierto

Verde (auto-archivo) Depósito y disponibilidad gratuita de una versión avanzada (~ sin diagramación) del artículo

Oro: El artículo publicado en su versión final es accesible públicamente (a expensas de los autores)

Diamante/Platino: El artículo publicado en su versión final es accesible públicamente sin cargos adicionales para los autores.

38 of 51

Disponibilidad del conocimiento científico y acceso abierto a código y datos de investigación

2, 7, 9 y 14 de septiembre 2021

39 of 51

Acceso Abierto

40 of 51

Acceso público, inmediato, permanente y gratuito a copias digitales de los documentos, publicaciones y datos científicos publicados en revistas, libros, monografías u otros medios de comunicación físicos o

digitales.

41 of 51

Acceso Abierto

Propuesta de Política de acceso abierto ANID: Asegurar a la ciudadanía el acceso al conocimiento científico contenido en las publicaciones resultantes de proyectos de investigación y en las tesis de posgrado financiados por la Agencia.

*25% de la producción científica en Chile es en acceso abierto en revistas indizadas en SciELO-Chile

42 of 51

Acceso Abierto

Propuesta de Política de acceso abierto ANID:

PARA PUBLICACIONES

Sigue el modelo de la Ruta Verde, alineada con orientaciones consensuadas por los Organismos Nacionales de Ciencia y Tecnología (ONCYT)

43 of 51

44 of 51

45 of 51

46 of 51

Article Processing Charges (Sept 2021)

Scientific Reports 1990 USD ~ 1,573,214 CLP

Nature Communications 5560 USD ~ 4,395,513 CLP

Revista Chilena de Historia Natural 2290 USD ~ 1,810,382 CLP

Fire Ecology 2090 USD ~ 1,652,270 CLP

Plants, People, Planet 2500 USD ~ 1,976,400 CLP

Ecology and Evolution 2200 USD ~ 1,739,232 CLP

Ecosphere 1925 USD ~ 1,521,828 CLP

Conservation Science and Practice 1850 USD ~1,462,536 CLP

https://authorservices.wiley.com/author-resources/Journal-Authors/open-access/article-publication-charges.html

https://support.nature.com/en/support/solutions/articles/6000211135-article-processing-charges

47 of 51

Propuesta de Política de acceso abierto ANID:

Los autores que utilicen el “pago por publicar” en acceso abierto están obligados a reportar:

  • el DOI del artículo para poder hacer el depósito en el repositorio institucional
  • costo pagado por publicar
  • el origen de los fondos que financió la tarifa APC.

48 of 51

¿Dónde y cómo publicar OA?

  • Sociedades científicas

https://doaj.org/ - The Directory of Open Access Journals

https://v2.sherpa.ac.uk/romeo/ - Rutas al acceso abierto (dorado, verde)

https://beallslist.net/ - Beall’s list of Potential Predatory Journals and Publishers

49 of 51

Sociedades científicas

50 of 51

Vínculo entre versión final, aceptada, o archivada

Google Scholar

Unpaywall

https://unpaywall.org/

51 of 51

https://elifesciences.org/articles/57067