Disponibilidad del conocimiento científico y acceso abierto a código y datos de investigación
2, 7, 9 y 14 de septiembre 2021
Talleristas
Luis D. Verde Arregoitia
Biólogo - Universidad Nacional Autónoma de México, México
Dr. en Ciencias Biológicas - Universidad de Queensland, Australia
Instructor Certificado por RStudio
www.liomys.mx; @LuisDVerde
Adriana Calahorra Oliart
Bióloga - Universidad Nacional Autónoma de México, México
Maestra en Ciencias Biológicas - Universidad Nacional Autónoma de México, México
Cand. a Dra. en Ciencias Biológicas - Universidad Nacional Autónoma de México, México
https://www.anid.cl/blog/2020/11/25/con-amplio-consenso-anid-inicia-hoja-de-ruta-de-politica-de-acceso-abierto/
Contenidos:
Organización de archivos & datos
comprobante.pdf
comprobante(1).pdf
mayo.pdf
arriendo.pdf
paint23.exe
pago 04.pdf
gasFeb.pdf
mayo2020.pdf
pagado.pdf
trTerceros02.pdf
vacaciones2007dsa34.jpg
zoom.zip
tarea2019.docx
contrato22.pdf
https://ascii-tree-generator.com/
Código
Datos
Figuras
Resultados
Flujo de trabajo
https://books.ropensci.org/targets/drake.html
-No modificar los datos ‘crudos’
-Optimizar pasos intermedios
-Evitar repetición
Datos
Figuras
Resultados
Finales
Datos &
Resultados Intermedios
Organización de código
Nombres/fechas
Rotular secciones importantes
Orden lógico
Pasos secuenciales
Organización de código
# para comentarios y anotaciones
librería {styler} para formato automático del código
librería {littleboxes} para cajas de comentarios
https://github.com/ThinkR-open/littleboxes
CTRL + SHIFT + R para insertar secciones
Reportando métodos y resultados
Para que otros puedan replicar el trabajo, con otros datos pero los mismos métodos
Para que otros puedan reproducir el trabajo con los mismos datos y métodos, tal como se reportó.
Reconocimiento a quienes aportan datos, métodos, o materiales.
✅
❌
El análisis estadístico se realizó utilizando el programa estadístico Rstudio, donde se aplicó un análisis discriminante.
El análisis estadístico se realizó utilizando el entorno de programación estadística R (R Core Team 2020) versión 4.1.0. Se donde se aplicó un análisis discriminante cuadrático con los argumentos predeterminados de la función ‘quaDA’ del paquete DiscriMiner (Sanchez 2013). Los datos y códigos correspondientes están disponibles en el material suplementario S1.
Lenguaje
R, Python, Julia, etc.
Entorno (IDE)
RStudio, VS Code, Sublime, etc.
Librerías
{phytools}, {vegan}
Funciones
Reportar:
Versión
Versión, Compañia, Ubicación
Autor, Versión, Cita
Argumentos importantes
✅
El análisis estadístico se realizó utilizando el entorno de programación estadística R (R Core Team 2020) versión 4.1.0. Se donde se aplicó un análisis discriminante cuadrático con los argumentos predeterminados de la función ‘quaDA’ del paquete DiscriMiner (Sanchez 2013). Los datos y códigos correspondientes están disponibles en el material suplementario S1.
Reportando versiones
sessionInfo()
citation()
{annotater}
{grateful}
https://github.com/Pakillo/grateful
Para consultar detalles de sistema, versiones, paquetes, etc.
Para consultar la cita para R o para un paquete en específico
Añade datos de versión y repositorio a un archivo .R
Genera citas para todos los paquetes mencionados en un archivo .R
Citas a datos
Crédito a quienes contribuyeron a la generación, curación, y almacenamiento de datos de investigación.
Citas por requerimiento institucional, editorial, o legal.
Genera vínculos bibliográficos y conecta las publicaciones con sus datos subyacentes.
Ejemplo 1:
Dryad: citar artículo original & el paquete de datos
Artículo:
Westbrook JW, Kitajima K, Burleigh JG, Kress WJ, Erickson DL, Wright SJ (2011) What makes a leaf tough? Patterns of correlated evolution between leaf toughness traits and demographic rates among 197 shade-tolerant woody species in a neotropical forest. American Naturalist 177(6): 800-811. http://dx.doi.org/10.1086/659963
Datos:
Westbrook JW, Kitajima K, Burleigh JG, Kress WJ, Erickson DL, Wright SJ (2011) Data from: What makes a leaf tough? Patterns of correlated evolution between leaf toughness traits and demographic rates among 197 shade-tolerant woody species in a neotropical forest. Dryad Digital Repository. http://dx.doi.org/10.5061/dryad.8525
Ejemplo 2:
Citar el paquete de datos dentro de la publicación que los describe
...available as an archived repository (Colunga-Salas et al., 2019).
Artículo: Colunga-Salas, P, Sánchez-Montes, S, Grostieta, E, et al. What do studies in wild mammals tell us about human emerging viral diseases in Mexico? Transbound Emerg Dis. 2020; 67: 33– 45. https://doi.org/10.1111/tbed.13336
Datos: Colunga-Salas, P., Sánchez-Montes, S., Grostieta, E., et al. (2019). What do studies in wild mammals tell us about human emerging viral diseases in Mexico? Zenodo Data Package. Retrieved from https://zenodo.org/record/3187486
Reportando resultados
tablas de R a Word con {flextable}
https://ardata-fr.github.io/flextable-book/
{broom} para procesar modelos
write.csv(), pegar en procesador de texto y convertir en tabla
scales::pvalue() para darle formato a estadísticos p
{report} para generar reportes estadísticos estandarizados para objetos de R
https://easystats.github.io/report/articles/report.html
Formatos y estructuras para almacenamiento y difusión de datos de investigación.
Rodríguez Sánchez et al. (2016)
Formatos
Hoja de cálculo
Tablas en un .doc
Tablas en un .docx
Bases de datos relacionales
Tablas en un PDF
Tablas en una imagen
Archivos de texto plano
?
Gradiente de facilidad de uso y acceso inmediato a los datos
Estructuras
Presentación/Claridad/Legibilidad
Uso de espacio
¿Uso inmediato?
Bad Data Handbook
Q.E. MacCallum (2012)
Datos para consumo humano
Datos para consumo computacional
!=
Deposición de datos, documentos, y código
Deposición de datos y código
British Ecological Society Guides to Better Science: Reproducible Code (2019)
Repositorios
Zenodo
Dryad
OSF
Figshare
VIVLI
Harvard Dataverse
e-cienciaDatos
https://fairsharing.org/collection/GeneralRepositoryComparison
💵
💾
🔬🧬🥼
🔒
Licencias
Para establecer y comunicar de forma clara:
Declaraciones explícitas que conceden permisos sobre el uso de un trabajo
Licencias
Guías para elegir licencias para datos
https://help.figshare.com/article/what-is-the-most-appropriate-licence-for-my-data
https://choosealicense.com/
Para datos
Para código
Acceso Abierto
Verde (auto-archivo) Depósito y disponibilidad gratuita de una versión avanzada (~ sin diagramación) del artículo
Oro: El artículo publicado en su versión final es accesible públicamente (a expensas de los autores)
Diamante/Platino: El artículo publicado en su versión final es accesible públicamente sin cargos adicionales para los autores.
Disponibilidad del conocimiento científico y acceso abierto a código y datos de investigación
2, 7, 9 y 14 de septiembre 2021
Acceso Abierto
Acceso público, inmediato, permanente y gratuito a copias digitales de los documentos, publicaciones y datos científicos publicados en revistas, libros, monografías u otros medios de comunicación físicos o
digitales.
Acceso Abierto
Propuesta de Política de acceso abierto ANID: Asegurar a la ciudadanía el acceso al conocimiento científico contenido en las publicaciones resultantes de proyectos de investigación y en las tesis de posgrado financiados por la Agencia.
*25% de la producción científica en Chile es en acceso abierto en revistas indizadas en SciELO-Chile
Acceso Abierto
Propuesta de Política de acceso abierto ANID:
PARA PUBLICACIONES
Sigue el modelo de la Ruta Verde, alineada con orientaciones consensuadas por los Organismos Nacionales de Ciencia y Tecnología (ONCYT)
Article Processing Charges (Sept 2021)
Scientific Reports 1990 USD ~ 1,573,214 CLP
Nature Communications 5560 USD ~ 4,395,513 CLP
Revista Chilena de Historia Natural 2290 USD ~ 1,810,382 CLP
Fire Ecology 2090 USD ~ 1,652,270 CLP
Plants, People, Planet 2500 USD ~ 1,976,400 CLP
Ecology and Evolution 2200 USD ~ 1,739,232 CLP
Ecosphere 1925 USD ~ 1,521,828 CLP
Conservation Science and Practice 1850 USD ~1,462,536 CLP
https://authorservices.wiley.com/author-resources/Journal-Authors/open-access/article-publication-charges.html
https://support.nature.com/en/support/solutions/articles/6000211135-article-processing-charges
Propuesta de Política de acceso abierto ANID:
Los autores que utilicen el “pago por publicar” en acceso abierto están obligados a reportar:
¿Dónde y cómo publicar OA?
https://doaj.org/ - The Directory of Open Access Journals
https://v2.sherpa.ac.uk/romeo/ - Rutas al acceso abierto (dorado, verde)
https://beallslist.net/ - Beall’s list of Potential Predatory Journals and Publishers
Sociedades científicas
Vínculo entre versión final, aceptada, o archivada
Google Scholar
Unpaywall
https://unpaywall.org/
https://elifesciences.org/articles/57067