21522 Anàlisi Lingüística i Corpus
Curs 2012-13
Professors: Alba Coll, Amor Montané i Lluís de Yzaguirre
Seminari
PRÀCTICA 5: Cerques a corpus escrits
L’objectiu d’aquesta pràctica és aprofundir en alguns dels aspectes més rellevants sobre l’ús i consulta dels corpus accessibles en línia, prestant especial atenció a la utilitat dels corpus com a resposta a qüestions que se’ns poden plantejar sobre l’ús d’una determinada llengua.
1. Entreu al programa de coavaluació i apunteu-vos-hi.
2. Creeu una carpeta per a la cinquena pràctica (ALIC_Uxxxxx_p5).
3. Creeu un document de text per anar emmagatzemant els resultats de la pràctica i deseu-lo en la carpeta corresponent a la cinquena pràctica (ALIC_Uxxxxx_p5).
4. Consulteu almenys tres corpus dels que hi ha a l'enllaç corpus públics i contesteu les preguntes del formulari per a cada corpus consultat.
NOTA: Es recomana llegir abans l'article de Torruella i Llisterri (1999) que hi ha a la bibliografia.
5. Quan hàgiu contestat les preguntes del formulari, i abans d’enviar-lo mitjançant el botó corresponent, feu-ne una captura de pantalla (on es vegi des de la pregunta “Nom del corpus descrit*” fins a les observacions) i enganxeu-la al document de text. Llavors, envieu el formulari. Al final, doncs, heu de tenir 3 captures de pantalla, una per a cada corpus consultat, i heu d’haver enviat 3 formularis.
6. Després d’haver consultat almenys tres corpus, indica quin és el que t’ha interessat més i resumeix en el document els motius d’aquest interès.
7. En acabar la pràctica, deseu el document, comprimiu la carpeta corresponent en format .ZIP, entreu de nou al programa de coavaluació, consulteu els resultats del repartiment i envieu la pràctica a qui correspongui seguint les instruccions per enviar les pràctiques.
Si en consultar els corpus, veieu que algun us pot ser útil per als vostres interessos, aquí teniu una graella de descripció de les característiques dels corpus, que us servirà per recopilar-los i classificar-los.
CRITERIS | CLASSIFICACIÓ | |
Segons origen dades | oral | |
escrit | ||
ambdós | ||
Segons especificitat textos | general | |
especialitzat | ||
genèric | ||
canònic | ||
Segons nombre llengües | monolingüe | |
bilingüe | ||
multilingüe | ||
Segons disposició interna | comparable | |
paral·lel | ||
Segons quantitat textos | textuals | |
de referència | ||
lèxic (sample corpus) | ||
Segons estat de la llengua | sincrònic | |
diacrònic | ||
històric | ||
contemporani | ||
Segons autoria | d’aprenent | |
de llengua nativa | ||
Segons codificació i anotació | simple | |
codificat o anotat | ||
Segons disponibilitat | públic | |
privat o restringit | ||
Segons proporció | obert | |
tancat | ||
Segons documentació | documentat | |
no documentat |
Reelaborat a partit de la versió feta amb l'Araceli Alonso
Universitat Pompeu Fabra – Alba Coll, Amor Montané i Lluís de Yzaguirre Aquests materials formen part del curs de Lingüística de Corpus que els seus autors imparteixen a la UPF |