21522 Anàlisi Lingüística i Corpus

Curs 2012-13

Professors: Alba Coll, Amor Montané i Lluís de Yzaguirre

Seminari

PRÀCTICA 5: Cerques a corpus escrits

L’objectiu d’aquesta pràctica és aprofundir en alguns dels aspectes més rellevants sobre l’ús i consulta dels corpus accessibles en línia, prestant especial atenció a la utilitat dels corpus com a resposta a qüestions que se’ns poden plantejar sobre l’ús d’una determinada llengua.

1. Entreu al programa de coavaluació i apunteu-vos-hi.

2. Creeu una carpeta per a la cinquena pràctica (ALIC_Uxxxxx_p5).

3. Creeu un document de text per anar emmagatzemant els resultats de la pràctica i deseu-lo en la carpeta corresponent a la cinquena pràctica (ALIC_Uxxxxx_p5).

4. Consulteu almenys tres corpus dels que hi ha a l'enllaç corpus públics i contesteu les preguntes del formulari per a cada corpus consultat.

NOTA: Es recomana llegir abans l'article de Torruella i Llisterri (1999) que hi ha a la bibliografia.

5. Quan hàgiu contestat les preguntes del formulari, i abans d’enviar-lo mitjançant el botó corresponent, feu-ne una captura de pantalla (on es vegi des de la pregunta “Nom del corpus descrit*” fins a les observacions) i enganxeu-la al document de text. Llavors, envieu el formulari. Al final, doncs, heu de tenir 3 captures de pantalla, una per a cada corpus consultat, i heu d’haver enviat 3 formularis.

6. Després d’haver consultat almenys tres corpus, indica quin és el que t’ha interessat més i resumeix en el document els motius d’aquest interès.

7. En acabar la pràctica, deseu el document, comprimiu la carpeta corresponent en format .ZIP, entreu de nou al programa de coavaluació, consulteu els resultats del repartiment i envieu la pràctica a qui correspongui seguint les instruccions per enviar les pràctiques.

Si en consultar els corpus, veieu que algun us pot ser útil per als vostres interessos, aquí teniu una graella de descripció de les característiques dels corpus, que us servirà per recopilar-los i classificar-los.

CRITERIS

CLASSIFICACIÓ

Segons origen dades

oral

escrit

ambdós

Segons especificitat textos

general

especialitzat

genèric

canònic

Segons nombre llengües

monolingüe

bilingüe

multilingüe

Segons disposició interna

comparable

paral·lel

Segons quantitat textos

textuals

de referència

lèxic (sample corpus)

Segons estat de la llengua

sincrònic

diacrònic

històric

contemporani

Segons autoria

d’aprenent

de llengua nativa

Segons codificació i anotació

simple

codificat o anotat

Segons disponibilitat

públic

privat o restringit

Segons proporció

obert

tancat

Segons documentació

documentat

no documentat

Reelaborat a partit de la versió feta amb l'Araceli Alonso

Universitat Pompeu Fabra – Alba Coll, Amor Montané i Lluís de Yzaguirre

Aquests materials formen part del curs de Lingüística de Corpus que els seus autors imparteixen a la UPF