21522 Anàlisi Lingüística i Corpus

Curs 2012-13

Professors: Alba Coll, Amor Montané i Lluís de Yzaguirre

Seminari

PRÀCTICA 3: Naveguem per un corpus oral amb REGEX

Aquesta pràctica té com a objectiu que us familiaritzeu amb els corpus orals. Continuarem treballant amb les expressions regulars per consolidar els coneixements adquirits la setmana passada, però aquest cop les aplicarem a un corpus oral.

Per dur a terme aquesta pràctica, farem servir el navegador Google Chrome (ja que permet escoltar el so associat al corpus oral) i uns cascos individuals.

1. Entreu al programa de coavaluació i apunteu-vos-hi.

2. Creeu una carpeta per a la tercera pràctica (ALIC_Uxxxxx_p3).

3. Creeu un document de text per anar emmagatzemant els resultats de la pràctica i deseu-lo en la carpeta corresponent a la tercera pràctica (ALIC_Uxxxxx_p3).

4. Accediu a l’aplicació del corpus oral RETOC i trieu una mostra de la taula. Indiqueu en el document de text quin número de mostra heu escollit.

5. Un cop escollida la mostra, escolliu l’opció de cercar en el text amb REGEX (del menú de l’esquerra de la pantalla).

6. A continuació, aplicarem col·lectivament la primera REGEX de la llista següent, cadascú a la seva mostra: llista de REGEX (obriu-la amb el botó dret en una pestanya nova).

7. Si heu obtingut algun resultat, trieu un dels fragments resultants i escolteu-lo (amb els cascos). Si no heu obtingut resultats, proveu la REGEX següent i seguiu el mateix procediment.

8. Deseu l’arxiu de so a la carpeta corresponent a la tercera pràctica (ALIC_Uxxxxx_p3). Recordeu que, per fer-ho, cal que cliqueu amb el botó dret del ratolí sobre la línia de progressió del so i escolliu l’opció Desa el vídeo com a. L’arxiu de so se us desarà amb l’extensió .WAV.

9. Tot seguit, copieu la REGEX aplicada i el text del fragment que heu escoltat al document de resultats i deixeu constància de les diferències que detecteu entre l’audició i la transcripció ortogràfica o feu constar que no heu trobat diferències.

10. A continuació, aplicarem algunes de les altres REGEX de la llista per ordre, cadascú a la seva mostra.

11. Copieu els resultats de l’aplicació de cadascuna de les REGEX al document de text o, si no heu obtingut resultats, deixeu constància de no haver-ne obtingut. Copieu tant l'expressió regular aplicada com el text resultant.

12. Després d’aplicar cada REGEX, compareu els vostres resultats en parelles per veure si el company o companya ha tingut més o menys èxit amb l’aplicació de la mateixa REGEX en la seva mostra (que ha de ser diferent). Comenteu-ho al document de text i resumiu la funció que penseu que té cada expressió regular aplicada.

13. En acabar la pràctica, deseu el document, comprimiu la carpeta corresponent en format .ZIP (recordeu que ha d’incloure un arxiu de text i un arxiu de so), entreu de nou al programa de coavaluació, consulteu els resultats del repartiment i envieu la pràctica a qui correspongui seguint les instruccions per enviar les pràctiques.

Reelaborat a partir de la versió feta amb l'Araceli Alonso 

Universitat Pompeu Fabra – Alba Coll, Amor Montané i Lluís de Yzaguirre

Aquests materials formen part del curs de Lingüística de Corpus que els seus autors imparteixen a la UPF