1 of 44

���Portal de Datos de Ciencia y Técnica de Argentina�

Presentación realizada por el equipo de la

Oficina de Conocimiento Abierto

Noviembre 2020

DACyTAr

Ministerio de Ciencia, Tecnología e Innovación

2 of 44

Contenido de la presentación

a) DACyTAr “Portal de Datos de Ciencia y Técnica de Argentina - MINCYT”. Origen; quiénes participaron del proyecto inicial; datos de acceso; la Ley N°26.899 y los datos primarios;

b) Preguntas y respuestas sobre temas básicos (se incluye este tipo de preguntas y respuestas para que el kit de transparencias pueda ser utilizado por docentes, investigadores y que están destinados a los estudiantes que se inician en la realización de trabajos finales, tesis):

¿Qué son los datos primarios de investigación?

¿Qué son los conjuntos de datos primarios?

¿El DACyTAr excluye algún tipo de dato?

¿Por qué es importante visibilizar los datos?

¿Cuáles son los plazos que establece la Ley No. 26.899 para los datos?

La Ley No. 26.899 ¿preve excepciones?

3 of 44

Contenido de la presentación

  • ¿Cómo se protegen los derechos de autor?
  • La citación de los Datos primarios de Investigación.
  • Principios de las citaciones (FORCE 11).
  • Publicar una versión de sus datos en CSV.
  • UNC – Oficina de Conocimiento Abierto:
  • ¿Deposito mis datos primarios en DACyTAR o en el Repositorio de la UNC?
  • ¿Cómo es el proceso?
  • Formulario para completar datos primarios.
  • Proyecto a mediano plazo . Políticas Datos UNC

4 of 44

Contenido de la presentación

  • ¿Dónde localizo la OCA?
  • PRINCIPIOS FAIR.
  • Bibliografía.
  • Datos de Contacto.
  • Integrantes equipo Oficina Conocimiento Abierto.

5 of 44

Portal de Datos de Ciencia y Técnica de Argentina�MINCYT

  • “DACyTAr inaugurado en 23 de octubre 2020 es el portal que permitirá, de forma centralizada, buscar y acceder a todos los conjuntos de datos primarios de investigación disponibles en acceso abierto a través de los repositorios digitales institucionales que integran el Sistema Nacional de Repositorios Digitales (SNRD)”.*
  • La Universidad Nacional de Córdoba integra el Sistema Nacional de Repositorios Digitales y se adhirió en el año 2014 con el Repositorio Digital Universitario (RDU) https://rdu.unc.edu.ar/

6 of 44

Acceso a DACyTAR

https://dacytar.mincyt.gob.ar/

7 of 44

Universidades e Instituciones que participaron del Proyecto Piloto DACyTAr

  • INTA Digital (INTA)
  • RepHipUNR (Universidad Nacional de Rosario)
  • Repositorio Institucional SEGEMAR (Servicio Geológico Minero)
  • RID-UNRN (Universidad Nacional de Río Negro)
  • SEDICI (Univrsidad Nacional de La Plata)
  • Repositorio Digital Universitario (UNC)

Un dato de importancia: la Universidad Nacional de Córdoba fue la primera institución del Sistema Nacional de Ciencia, Tecnología e Innovación en registrar un conjunto de datos en octubre 2019: https://rdu.unc.edu.ar/handle/11086/12914

*

8 of 44

DACyTAr se encuadra en la Ley No. 26.899 y su reglamentación

  • La Ley exige a los organismos e instituciones públicas que componen el Sistema Nacional de Ciencia, Tecnología e Innovación y que reciben financiamiento del Estado nacional, a hacer disponible en Acceso Abierto a través de repositorios digitales interoperables

La producción científico-tecnológica

Los datos primarios de investigación que son el

resultado de actividades de investigación

9 of 44

Acerca de DACyTAr

  • “Este portal es producto del cumplimiento de los estándares y protocolos de interoperabilidad establecidos por el SNRD siguiendo pautas y acuerdos internacionales. Estos estándares, permiten que los repositorios institucionales se comuniquen entre sí y se integren a redes de repositorios y/o portales como DACyTAr o SNRD”.*

10 of 44

Preguntas y Respuestas para aquellos que se inician en la investigación

  • ¿Qué son los datos primarios de investigación?

  • “Se entiende por dato primario de investigación a todos aquellos datos en bruto sobre los que se basa cualquier investigación y que pueden ser o no ser publicados cuando se comunica un avance científico, pero que son los que fundamentan un nuevo conocimiento”. *

11 of 44

¿Qué son los conjuntos de datos primarios?

  • Los conjuntos de datos primarios de investigación, son colecciones de datos codificados en una estructura definida, como ser listas, tablas, bases de datos, etc., que generalmente puede ser leída por sistemas automatizados.

  • Se pueden clasificar en observacionales, experimentales o computacionales. Por ejemplo: registros numéricos, registros textuales, imágenes y/o sonidos, modelados computacionales, que la comunidad científica genera en el marco de sus proyectos de investigación, y que son comúnmente aceptados para validar los resultados de la investigación.

12 of 44

¿El DACyTAr excluye algún tipo de dato?

  • SI
  • anotaciones de laboratorio,
  • análisis preliminares,
  • objetos físicos: cartas, inventarios, muestras, cepas de bacterias, animales de ensayo, vasijas, especímenes, etc. *

13 of 44

¿Por qué es importante visibilizar los datos?

  • Porque la disponibilidad pública de los datos primarios de investigación:
  • permite validar los resultados publicados de las investigaciones, fomenta la colaboración,
  • evita la duplicación de esfuerzos al permitir la reutilización de los datos disponibles,
  • acelera la innovación,
  • mejora la transparencia del proceso científico y,
  • además, es una obligación que establece la normativa vigente a nivel nacional.

14 of 44

¿Cuáles son los plazos que establece la Ley No. 26.899?

  • De acuerdo a la Ley 26.899 y su reglamentación, los datos primarios de investigación deberían estar disponibles en acceso abierto a través de los repositorios digitales institucionales en un plazo no mayor a los 5 años a partir del momento de su recolección.

15 of 44

La Ley No. 26.899 ¿preve excepciones?

  • SI, para aquellos casos en que los datos:
  • deban protegerse y mantenerse en confidencialidad por cuestiones de propiedad industrial;
  • hayan sido generados en el marco de acuerdos previos con terceros que hubieran cofinanciado la investigación y se hubiesen acordado plazos diferentes para su disponibilidad pública;
  • sean de carácter sensible, pudieran afectar la privacidad de las personas, atentar contra especies protegidas o contra cuestiones de seguridad nacional;
  • poniéndose en acceso abierto pudieran afectar los ingresos de las autoras y autores y/o sus instituciones.

16 of 44

¿Cómo se protegen los derechos de autor?

  • Los conjuntos de datos en los repositorios son acompañados por una serie de etiquetas (“metadatos”) que los describen. Hay metadatos específicos que mencionan a las autoras y autores y a sus instituciones de filiación otorgando así el reconocimiento correspondiente.

  • Usar licencias del tipo copyleft, por ejemplo las Creative Commons: https://creativecommons.org/choose/?lang=es_AR, se indican cuáles so n los permisos que los autores brindan sobre sus obras.

17 of 44

Algunos aspectos importantes sobre las Licencias

  • Indique la licencia elegida de forma clara y destacada
  • Explicar las liberaciones / limitaciones de la licencia elegida y qué restricciones pueden aplicarse
  • Explique que la licencia se aplica a los datos y no al contenido que representan los datos (una licencia abierta sobre los metadatos no es lo mismo que el contenido en sí mismo esté abierto, no tenga derechos de autor o pueda usarse libremente)
  • Explique por qué se eligió esta licencia.

18 of 44

La citación de los Datos primarios de Investigación

  • Preámbulo
  • Los datos deben considerarse productos de investigación legítimos y citables. La citación de datos, al igual que la cita de otras evidencias y fuentes, es una buena práctica de investigación y es parte del ecosistema académico que respalda la reutilización de datos.

19 of 44

Principios de las citaciones

  • 1. Importancia
  • Los datos deben considerarse productos de investigación legítimos y citables. Las citas de datos deben recibir la misma importancia en el registro académico que las citas de otros objetos de investigación, como las publicaciones.
  • 2. Crédito y atribución
  • Las citas de datos deberían facilitar el reconocimiento académico y la atribución normativa y legal a todos los contribuyentes a los datos, reconociendo que un solo estilo o mecanismo de atribución puede no ser aplicable a todos los datos.

  • 3. Evidencia
  • En la literatura académica, siempre y cuando una afirmación se base en datos, se deben citar los datos correspondientes.

20 of 44

Principios de las citaciones

  • 3. Evidencia
  • En la literatura académica, siempre y cuando una afirmación se base en datos, se deben citar los datos correspondientes.

  • 4. Identificación única
  • Una cita de datos debe incluir un método persistente para la identificación que sea procesable por máquina, globalmente único y ampliamente utilizado por una comunidad.

21 of 44

Principios de las citaciones

  • 5. Acceso
  • Las citas de datos deben facilitar el acceso a los datos en sí mismos y a los metadatos, la documentación, el código y otros materiales asociados que sean necesarios para que tanto las personas como las máquinas hagan un uso informado de los datos de referencia.

  • 6. Persistencia
  • Los identificadores únicos y los metadatos que describen los datos y su disposición deben persistir, incluso más allá de la vida útil de los datos que describen.

22 of 44

Principios de las citaciones

  • 7. Especificidad y verificabilidad
  • Las citas de datos deben facilitar la identificación, el acceso y la verificación de los datos específicos que respaldan una afirmación. Las citas o metadatos de citas deben incluir información sobre la procedencia y la fijeza suficiente para facilitar la verificación de que el intervalo de tiempo específico, la versión y / o la porción granular de los datos recuperados posteriormente es la misma que se citó originalmente.
  • 8. Interoperabilidad y flexibilidad
  • Los métodos de citación de datos deben ser lo suficientemente flexibles para adaptarse a las distintas prácticas entre comunidades, pero no deben diferir tanto que comprometan la interoperabilidad de las prácticas de citación de datos entre comunidades.

23 of 44

Algunos aspectos importantes respecto de los datos - Sencillez

  • Sencillez
  • Considere la posibilidad de publicar una versión de sus datos en CSV, para que puedan ser utilizados por más personas. CSV es legible por humanos por sí solo, pero también se puede ver y manipular con muchas herramientas existentes, como Google Sheets y OpenRefine . Los conjuntos de datos grandes o complejos se pueden distribuir a través de varios archivos CSV que contienen los datos acoplados. Sea creativo con la distribución y aumentará el interés en acceder a sus colecciones.

24 of 44

UNC – Oficina de Conocimiento Abierto

¿Deposito mis datos primarios en DACyTAR o en el Repositorio de la UNC?

La Oficina de Conocimiento Abierto (OCA) se encarga de depositarlos en el Repositorio Digital Universitario (RDU) y sus datos serán cosechados por DACyTAr.

¿Cómo es el proceso?

Sencillo, se competa un formulario que a continuación le mostramos dónde se localiza y el personal especializado de la OCA, se contactará con Ud. para solicitarle más información. Actualmente el proceso es bajo la modalidad a distancia. Si le surgen dudas podemos encontrarnos en una reunión virtual (meet). Luego de la pandemia se mantendrá esa modalidad, pero también serán muy bienvenidos a las oficinas de la OCA, en el 3° Piso del Pabellón Argentina. Incluimos luego, un video para que nos localice.

25 of 44

Repositorio Digital de la UNC - Acceso directo a los Datos Primarios

https://rdu.unc.edu.ar/handle/11086/12911

26 of 44

https://rdu.unc.edu.ar/handle/11086/12911

Debe cliquear dónde dice formulario en rojo

27 of 44

28 of 44

Proyecto a mediano plazo . Políticas Datos UNC

2021 Primer semestre. Redacción de las Políticas para Datos Primarios de la UNC.

¿Quiénes participarán?

La OCA elaborará un documento base, y lo pondrá a debate de las/los Secretarias/os de Ciencia y Técnica y las/los Secretarias/os de Asuntos Académicos de Grado y Posgrado y otros protagonistas de la comunidad universitaria.

Se procederá de forma similar a la redacción de las “Políticas Institucionales de Acceso Abierto para Publicaciones de la Universidad Nacional de Córdoba”, sancionadas por el HCS en 2017.

Este procedimiento puede variar de acuerdo a las sugerencias de las autoridades de la UNC.

29 of 44

¿Dónde localizo a la Oficina de Conocimiento Abierto?

30 of 44

PRINCIPIOS FAIR �para el manejo y administración de datos científicos

El MINCYT promueve los Principios FAIR como una forma de producir, gestionar y compartir datos científicos.

31 of 44

PRINCIPIOS FAIR

Ponen énfasis específico en mejorar la capacidad de las computadoras para encontrar y utilizar automáticamente los datos o cualquier objeto digital.

32 of 44

DACyTAr - Principios FAIR

  • Fueron publicados por: Nature Publishing Group
  • revista Scientific Data (2016) Buenas prácticas

  • “Los Principios FAIR buscan solucionar la ausencia de buenas prácticas para la publicación de datos científicos que sean ampliamente compartidas, claramente articuladas y ampliamente aplicadas”.*

33 of 44

LOCALIZABLES �Los datos y metadatos pueden ser localizados por la comunidad después de su publicación, mediante herramientas de búsqueda.

  • ¿Se encuentran en un repositorio?
  • ¿Tienen DOI?
  • ¿Se encuentran en Google?
  • ¿Tienen metadatos estandarizados?

34 of 44

Principios FAIR

  • F: Localizables. Los datos y metadatos pueden ser encontrados por la comunidad después de su publicación, mediante herramientas de búsqueda.

  • F1. Asignarles un identificador único y persistente a los datos y los metadatos,
  • F2. Describir los datos con metadatos de manera prolija,
  • F3. Registrar/Indexar los datos y los metadatos en un recurso de búsqueda,
  • F4. En los metadatos se debe especificar el identificador de los datos que se describen.

35 of 44

ACCESIBLES �Los datos y metadatos pueden ser descargados por otros investigadores utilizando sus identificadores

  • ¿Se pueden descargar?
  • ¿Tienen limitaciones de uso?
  • ¿Son gratuitos?
  • ¿Se pueden ver/abrir?

36 of 44

Principios FAIR

  • A: Accesibles. Los datos y metadatos están accesibles y por ello pueden ser descargados por otros investigadores utilizando sus identificadores.
  • A1 Los datos y los metadatos pueden ser recuperados por sus identificadores mediante protocolos estandarizados de comunicación,
  • A1.1 Los protocolos tienen que ser abiertos, gratuitos e implementados universalmente,
  • A1.2 El protocolo debe de permitir procedimientos para la autentificación y la autorización (por si fuera necesario).
  • A2 Los metadatos deben de estar accesibles, incluso cuando los datos ya no estuvieran disponibles.

37 of 44

INTEROPERABLES �Los datos y metadatos deben estar descritos utilizando estándares abiertos, para permitir su intercambio y su reutilización.

  • ¿Son estandarizados?
  • ¿Están en un formato abierto? (ASCII, CSV, TIFF, WAV)
  • ¿Requieren diccionarios para ser entendibles?
  • ¿Pueden ser fácilmente utilizados por humanos y computadoras?

38 of 44

Principios FAIR

  • I Interoperables. Tanto los datos como los metadatos deben de estar descritos siguiendo las reglas de la comunidad, utilizando estándares abiertos, para permitir su intercambio y su reutilización.
  • I1. Los datos y los metadatos deben de usar un lenguaje formal, accesible, compartible y ampliamente aplicable para representar el conocimiento
  • I2. Los datos y los metadatos usan vocabularios que sigan los principios FAIR
  • I3. Los datos y los metadatos incluyen referencias cualificadas a otros datos o metadatos

39 of 44

REUTILIZABLES �Los datos y los metadatos pueden ser reutilizados por otros investigadores, al quedar clara su procedencia y las condiciones de reutilización

  • Calidad de los datos
  • Completos
  • Entendibles

40 of 44

Principios FAIR

  • R Reutilizables. Los datos y los metadatos pueden ser reutilizados por otros investigadores, al quedar clara su procedencia y las condiciones de reutilización.

  • R1. Los datos y los metadatos contienen una multitud de atributos precisos y relevantes

  • R1.1. Los datos y los metadatos se publican con una licencia clara y accesible sobre su uso y reutilización

  • R1.2. Los datos y los metadatos se asocian con información sobre su procedencia

  • R1.3. Los datos y los metadatos siguen los estándares relevantes que usa la comunidad del dominio concreto

41 of 44

Bibliografía

42 of 44

Bibliografía

43 of 44

Oficina de Conocimiento Abierto

44 of 44

¡Gracias por su atención!

Integrantes equipo Oficina Conocimiento Abierto

Alejandra Nardi (Directora)

Lucrecia García

Paola Murat

Emilio Di Domenico

Alexis Febre

Mario Pizzi

Javier Ortiz Vargas