21522 Anàlisi Lingüística i Corpus

Curs 2012-13

Professors: Alba Coll, Amor Montané i Lluís de Yzaguirre

Seminari

Treball de corpus personal

1.- Triar una finalitat hipotètica en un escenari professional imaginari; per exemple:

sóc un lingüista forense que haig d'avaluar l'autoria d'un text dubitat en anglès en comparació a quatre textos de quatre sospitosos. Detecto intuïtivament alguna cosa que grinyola amb l'ús d'algun phrasal verb. Decideixo mesurar en un corpus de llengua corrent la proporció de diverses combinacions de preposicions amb quatre verbs concrets. Després ho comparo amb un corpus literari per veure la diferència i finalment ho mesuro en els textos aportats pel jutjat.

En qualsevol cas, estem suposant un corpus monolingüe, sense cap altra restricció quant a caràcter literari o col·loquial, tècnic o jurídic, etc. Assegureu-vos que no incloeu documents PDF, que donen molts problemes amb el guionatge.

2.- Crear un document descriptiu del treball que exposi la hipòtesi, la procedència del(s) text(os) a analitzar i els problemes que hi pugui haver hagut fins ací o en qualsevol altre pas del procés.

3.- Aplicar els filtres necessaris per obtenir els llistats i les dades quantitatives necessaris. Tots els llistats generats (fins els que siguin intermediàris) es guarden en una carpeta que caldrà aportar al final. Ens referim tant a llistats de paraules amb freqüències com a concordances Eventualment, es poden fer captures de pantalla que mostrin els passos intermedis per no haver de fer-ne descripcions detallistes.

4.- En el document final caldrà que l'estudiant valori les limitacions que li han sorgit pel fet d'emprar l'eina TEXTSTAT o les que s'han derivat de treballar amb un corpus cru (sense enriquiment). També hi farà constar si li ha calgut ajuda per refinar alguna expressió regular que es resistia a filtrar els resultats desitjats.

5.- Calendari

dilluns, 11 de març (a les 22h)

límit per a la tramesa de la proposta

divendres, 22  de març

darrer dia per obtenir tutories

dimarts, 2 d'abril

primer laborable després de pasqua

dimecres, 3 d'abril

darrer dia per lliurar tot el treball

divendres, 5 d'abril

revisió de notes