21522 Anàlisi Lingüística i Corpus

Curs 2012-13

Professors: Alba Coll, Amor Montané i Lluís de Yzaguirre

Seminari

PRÀCTICA 4: transcripció d’un corpus oral

Aquesta pràctica té com objectiu conèixer la dificultat real de produir corpus orals. Tothom transcriurà un minut d’una conferència emesa per BTV i després farà una estimació de la seva productivitat.

Abans que res, entreu al programa de coavaluació.

Per ordre correlatiu, a cada estudiant li és assignat un fragment d’un minut d’un corpus oral. Cal que us fixeu en el número del registre que té assignat el següent, perquè si hi arribeu ja no l’heu de transcriure!

Núm de registre

seminari 103

83

00:03:58:045

00:04:03:690

104

00:04:59:955

00:05:03:250

131

00:05:59:455

00:06:00:950

153

00:06:56:025

00:07:01:520

179

00:07:59:380

00:08:02:270

200

00:08:56:480

00:09:00:290

224

00:09:59:792

00:10:01:910

247

00:10:59:995

00:11:04:465

268

00:11:56:055

00:12:00:410

294

00:12:56:990

00:13:00:280

319

00:13:59:345

00:14:01:875

341

00:14:55:835

00:15:00:295

362

00:15:59:055

00:16:01:325

386

00:16:59:438

00:17:01:525

399

00:17:41:255

00:00:10:400

Seminari 101

406

00:17:59:760

00:18:05:490

425

00:18:54:285

00:00:11:700

426

00:18:59:375

00:19:01:700

447

00:19:57:205

00:20:00:490

471

00:20:59:787

00:21:00:525

494

00:21:59:715

00:22:00:845

521

00:22:56:105

00:23:00:170

544

00:23:59:235

00:24:02:375

562

00:24:57:030

00:25:00:805

586

00:25:59:915

00:26:02:245

611

00:26:57:495

00:27:02:035

631

00:27:58:225

00:28:03:035

654

00:28:59:695

00:29:01:905

680

00:29:57:330

00:30:00:970

715

00:30:59:390

00:31:01:895

Seminari 102

740

00:31:59:195

00:32:04:205

763

00:32:59:255

00:33:03:185

784

00:33:59:975

00:34:00:285

785

00:34:00:285

00:00:20:200

808

00:34:59:055

00:35:03:420

828

00:35:57:190

00:36:00:605

855

00:36:57:575

00:37:00:960

880

00:37:59:705

00:38:01:735

902

00:38:58:535

00:39:01:075

925

00:39:58:595

00:40:03:555

947

00:40:58:920

00:41:00:580

971

00:41:59:875

00:42:01:325

999

00:42:59:582

00:43:03:915

1023

00:43:59:720

00:44:01:920

1050

00:44:58:160

00:45:00:595

disponibles

1076

00:45:57:115

00:46:02:085

1099

00:46:59:320

00:47:04:530

1121

00:47:59:055

00:48:03:120

1143

00:48:59:832

00:49:02:165

1166

00:49:58:740

00:50:00:990

1190

00:50:58:035

00:51:03:595

1213

00:51:59:880

00:52:01:575

1237

00:52:59:040

00:53:01:305

1256

00:53:44:110

00:00:32:800

1263

00:53:59:905

00:54:01:975

1299

00:54:59:705

00:55:00:060

1334

00:55:57:775

00:56:00:045

1361

00:56:58:790

00:57:03:838

1384

00:57:57:495

00:58:01:930

1408

00:58:59:795

00:59:02:075

1436

00:59:59:165

01:00:01:075

1456

01:00:57:750

01:01:00:320

1482

01:01:59:400

01:02:03:455

Per raons tècniques, el navegador que emprarem serà el Chrome, que ens resol adequadament la integració de l’àudio dins de les pàgines web. Tot seguit, accediu al programa de transcripció i aneu al registre que us pertoca:

http://retoc.iula.upf.edu/CGIs/sincro.cgi?operacio=previ&numMostra=98

Clicarem a la imatge  que no té requadre vermell del registre que volem modificar i se’ns activarà la veu i un diàleg d’edició per entrar la transcripció ortogràfica del fragment que estem escoltant:

 

Després de “desar” el primer fragment, ens sortirà el següent. Si apareix ple, vol dir que hem completat el nostre minut i ens hem trobat el primer fragment d’un altre company. Quan haurem transcrit el minut que ens pertoca, accedirem a l’eina de consulta del corpus per tal que ens mostri allò que hem entrat:

http://retoc.iula.upf.edu/CGIs/retoc.cgi?operacio=previText&registre2=C2&numMostra=98

Tot seguit, demanarem el llistat compacte i seleccionarem els registres que hem transcrit:

i els copiarem a un document de text. Un cop el document de text contingui el nostre minut de transcripció, demanarem el recompte de paraules, farem una captura de pantalla parcial (només els resultats del recompte de paraules) i l’enganxarem a continuació:

Tot seguit comptarem quants fragments hem transcrit, ho multiplicarem per dos i ho restarem del nombre de paraules: en l’exemple anterior hi ha 5 registres i diu que hi ha 58 paraules; considerarem que n’hi ha 48, perquè en el recompte ha inclòs el número de registre i l’enllaç que hi ha a la segona columna. Tot seguit, escriviu “Nombre net de paraules = XX” i deseu el document en una carpeta seguint les instruccions de l’apartat “Tramesa comprimida” de les instruccions de l'avís sobre el correu.

Si ja som en els minuts finals del  seminari, entreu al programa de coavaluació per saber qui us coavaluarà i ja podeu enviar-li, seguint les intruccions habituals, el document.

Universitat Pompeu Fabra – Alba Coll, Amor Montané i Lluís de Yzaguirre

Aquests materials formen part del curs de Lingüística de Corpus que els seus autors imparteixen a la UPF