Queremos modelos que entiendan y hablen el español de las 600M personas hispanohablantes. ¿Nos ayudas?
Estamos recolectando corpus de diferentes países, registros y dominios. ¡Cuantas más variedades de la lengua, mejor!
Son bienvenidos todos los tipos de corpus: entrenamiento y evaluación, todas las tareas de comprensión (NLU) y generación (NLG), todas las modalidades (texto, audio e imágenes con descripción). También buscamos corpus en otras lenguas habladas en países hispanohablantes (e.g., catalán, quechua).
Importante:
- Si quieres compartir varios corpus, rellena este formulario una vez por corpus.
- Intenta proveer información tan detallada como puedas, si no sabes la respuesta de algún campo escribe NSNC, ¡muchas gracias!
Si tienes cualquier duda manda un email a info@somosnlp.org o contáctanos por Discord.
¡Muchas gracias por apoyarnos en nuestra misión de democratizar el PLN en español!