國立臺中圖書館

獎助博、碩士班學生研撰圖書資訊學位論文申請表

一、基本資料表

 姓    名

布丁

出生年月日7

 身分證字號

 戶籍地址

聯絡電話

 通訊地址  

聯絡電話

E-MAIL

手機電話

 目前就讀

 學    校

 研 究 所

 年    級

 經     歷

 上一階段

   畢業

 科系所別

 專     長

   過去曾發表之

  論文及研究成果

 申請獎助計畫名稱

  申請或已接受

  其他獎助資料

 單位名稱:              □申請中;□已接受

 金額:

 性質:

 所長簽章

 研究所蓋章

註:請以掛號郵寄至臺中市404-44精武路291-3號國立臺中圖書館收。(請於信封上註明:申請『獎助博碩士班學生研撰圖書資訊學位論文』)


二、證明文件:(請貼身分證及學生證正、反面影本)

三、推薦表:指導教授

 姓   名

 服務機構及職稱

 通  訊  地  址

及E-MAIL

 電   話  

(公)
(手機)

 傳   真

  推薦內容:

 

                                 

推薦人:               

                                    民國    年    月    日

                                   

四、論文計畫書:

基於閱讀標註策略之知識萃取在支援數位學習上的應用研究

第一章 緒論

第一節 研究動機

標註(annotation)應用於各領域已經不少研究的成果被提出,像是教育(Nokelainen et al., 2003; Simpson & Nist, 1990)、數位圖書館(Agosti et al., 2004; Marshall, 1997; Arko et al., 2006; Wolfe, 2008; Chen et al., 2008)、以及實作技術(Maurer, 1996; O'Hara & Sellen, 1997; Roscheisen et al., 1997; Yee, 2002)等不同領域。過去研究所發展的各種數位標註工具,可以將使用者以標註形式留下的回饋與系統典藏資源整合,共同儲存在資料庫當中。然而大多數研究皆專注於標註的使用、儲存與檢索,目前並未有針對大量讀者閱讀標註提出有效的知識萃取方法,並以閱讀標註策略支援閱讀學習的相關研究被提出。因此本研究欲利用讀者為文獻增加的閱讀標註,應用資料探勘技術從標註中萃取知識並回饋學習者,以提昇學習者的閱讀成效,以此發展出一套完整的閱讀標註策略。

標註是使用者將閱讀過程、知識與策略以劃線、作記號、加入註解、用螢光筆強調以保留在文獻上的常見行為。標註現象自古有之,例如批注一直都是中國文學鑑賞與評論的重要形式和傳統的有效讀書方法之一(常唯, 2008)。使用標註的歷史可以追溯到中古世紀的手抄時代。當時的學者利用行距之間與文件邊欄的標註,達到分享知識、辯證所讀文獻內容以及記錄不同閱讀策略的功能。在近代的教學策略中,許多教師提倡標註的分享有助於培養寫作能力。標註不僅可以讓教師用以討論不同的閱讀策略,也可以幫助學生看到他們在閱讀過程中的規律或習慣(Wolfe & Neuwirth, 2001)。例如Mariolina Salvatori(1996)曾經發給學生標註過的文獻影本教材,作為討論不同閱讀過程的教學策略;Andrea Lunsford與John Ruszkiewicz(2000)則是利用多位學習者的標註,來幫助學生瞭解其他人閱讀的狀況,並且提供其它讀者對於文獻的不同解釋概況。

標註在教育的應用上,國內外均有豐碩的研究成果。CoNote研究標註分享用於合作學習上(Davis & Huttenlocher, 1995)、AnnotatED (Annotations for Education)為Knowledge Sea教材典藏系統提供了標註與基於點閱量的社會指引支援(Social Navigation Supput)功能(Farzan & Brusilovsky, 2005)。開放標註與標籤系統(Open Annoation and Tagging System,OATS)則在標註中加入合作式標籤(Collaborative Tagging),探討此作法應用於數位學習的成效性(Bateman et al., 2006)。Matthias、Brust與Steffen(Brust & Rothkugel, 2007)提出COLLAGE(Collaborative Artefact Gathering Environment)多媒體註記分享系統,具跨文件、跨應用程式功能,可詳實紀錄學習者學習過程,在任何時間、任何地點,進行合作學習。

國內也已經有應用標註於教育的研究。谷圳(2003)針對不同的學習環境設計了一套「無縫式」的標註系統,讓學習者可以利用電腦與手機閱讀教材,延伸學生線上學習的時間與空間。吳玓玲(2004)針對標註系統在協同學習、同儕互評及回饋機制上的功效進行探討。程仲凱(2004)提出「電腦閱讀註記輔助摘要學習系統」,協助教師彙整觀看全班學生的閱讀疑難與重點標註,讓學生從學習過程中得到教學回饋,並協助學生從重點寫出精簡整理過的大意。

這些在閱讀、教學過程中所留下來的標註,對於後來的讀者有相當高的利用價值,Marshall(1997)研究書本標註的結果能證實這一點。而Wolfe(2008)的實驗發現,在同一份文獻上呈現出不同讀者的觀點,有助於刺激學生進行批判性反思與辯論的行為,因而提倡數位圖書館與Web 2.0的應用軟體設計應該要考量到多面向標註應用於學習的框架。陳志銘(2008)也建議從讀者閱讀標註中找出具有價值的知識,將讓數位圖書館具備數位學習的功能特色。

儘管標註在教育上的重要性已經被驗證,也有各式各樣的應用模式被提出,但針對應用標註內容、萃取知識的研究卻不多,也較少在標住工據當中運用閱讀標註策略。基於以上諸多原因,促使本研究想要發展一套有助於閱讀學習成效的基於閱讀標註策略之知識萃取方法,能夠從讀者閱讀過程所留下的標註資訊中萃取有效知識,能夠促進其他讀者反思與擴大閱讀深度與廣度。

第二節 研究目的

  1. 發展能夠提昇學習者閱讀成效的閱讀標註策略,能夠基於讀者的閱讀標註,萃取出適合該篇文獻的閱讀標註策略,以回饋學習者刺激閱讀學習成效。
  2. 將基於閱讀標註策略的知識萃取方法實作在標註工具當中,並且整合到數位圖書館或數位典藏系統。使本研究發展的閱讀標註策略能夠供人使用。
  3. 探討基於閱讀標註策略之知識萃取方法對於學習者閱讀學習成效的影響,以驗證此方法是否有效。

第三節 問題陳述

  1. 如何發展基於閱讀標註策略之知識萃取方法?
  2. 此方法應該實作在什麼標註工具當中?
  1. 具備閱讀標註策略的標註工具適合整合在什麼系統中?
  2. 閱讀標註策略之知識萃取方法是如何影響學習者的閱讀學習成效?
  3. 如何評估閱讀學習策略之知識萃取方法,確認此方法能夠提昇學習者的閱讀學習成效?

第四節 預期成果

本研究欲發展具備知識萃取功能之閱讀標註工具,此工具可用於標註任意HTML網頁上的數位內容,並輕易地嵌入各種數位圖書館或數位典藏系統中,成為系統的一部分子功能。具備閱讀標註工具支援的數位圖書館系統,除了擁有支援閱讀學習的特色之外,標註內容更能為典藏的館藏內容加值。此外,藉由使用者以標註形式貢獻的知識,可以持續不斷地豐富數位圖書館的館藏內容,有助於數位圖書館的永續經營,以及發展具有使用者參與的Web 2.0特色數位圖書館系統。

而本研究發展的基於閱讀標註策略之知識萃取方法,將可以成為未來標註研究領域基礎,供後人繼續進行更深入的研究。

第二章 文獻探討

  1. 標註應用於教學策略

本研究希望從既有的標註資料當中,萃取出能夠提昇閱讀學習成效的知識以回饋給學習者,為此必須從過去的研究中探討標註類型對於讀者的意義,以及以標註為基礎的學習策略相關研究現況,從中分析出可行的標註學習模式。

標註的常見型態,可參考Marshall(1998)對於學生購買二手教科書的研究。他分析了學生的看法與學生討論的標註內容,並歸納出五種類型的標註元素,各別是標註與文字之間的關聯(如圖 1)、用括號之類的錨點、強調符號、用數字標號來重組文字、用螢光筆顏色來區別標註的結構。

Marshall(1997)曾經做過一篇分析大學教科書上標註形式與功能的研究。他分析了150本學生在課堂中閱讀、使用過的教科書,這些教科書又可分為數學、哲學、英文等15種不同類型的領域。這些教科書的標註形式最終可以歸納為三種面向:標註是在文字中,還是在邊欄或其他空白處?標註是簡略的(telegraphic)——只有個人才知道的編碼——還是用文字詳細說明其意義?標註是可以移除的,還是已經變成書中的一部分?藉由標註形式的分析,可以從中重新建構六種具有明顯可驗證的標註功能。有些形式所表達的功能可能不只一種, Marshall提出的六種標註功能詳細敘述如下:

  1. 標註是一種「程序訊號(procedural signal)」,由學生部份標註中可以發現,標註可以指出哪邊是作業的起始位置、哪些是重要的標註、以及哪些是接下來需要閱讀的標註。
  1. 標註是一種「位置記號(placemark)」。從作業當中可以發現到,學生框起了文件的某一部份,然後把化學反應、字彙定義等期末考要背的資訊寫在這部份的最後。
  2. 標註是一種處理問題方法的發生位置。
  3. 標註記錄著解釋活動,不論是從另一位讀者(如專家的解釋)、或是精讀之後的結果(學生自己的解釋)。
  4. 這些標註動作可清楚表現出讀者注意力的閱讀記錄。
  5. 這些標註可能偶爾會反映出教材被不同人閱讀的的流通過程。

Simpson與Nist(1990)在課堂中請學生分享了讀書時常用的傳統標註策略,像是螢光筆強調、重讀、寫下大綱(outline)、以及下注釋,而他們認為這些策略有所不足。根據他們長年來的標註教學經驗,他們提出一套教科書的標註策略,並以實驗驗證此方法可比傳統的方法更能提昇大學生的讀書效率與效果。具體來說,Simpson與Nist提出七種標註策略:

  1. 用自己的話,把摘要寫在文件邊欄。
  2. 條列多個概念 (例如,原因、影響、特色),並組成特定的形式。
  3. 把概念的例子寫在邊欄處,標註「EX」。
  4. 以文字敘述圖表中的關鍵資訊。
  5. 記下可能的考試問題。
  6. 在覺得被搞混、迷惑的段落旁邊記下「?」問號標誌。
  7. 選擇在關鍵文字或詞彙下劃底線。

Simpson與Nist設計的標註教案長達三週,每週一個主題循環進行。第一堂課先跟學生介紹閱讀技巧,以及各種標註策略使用上的優缺點,並且指派作業要求學生回家閱讀並進行標註。之後幾天則是以問答的方式討論優良標註的特色,並將學生分成兩人一組,用一套查核表(見表 1)檢查對方的標註,並發下教師標註過的文獻用以比較、激發討論。課程進行過程中,教師會時常跟學生討論他們常犯的問題,例如標註太多、標註太少或不想標註、以及他們只有敘述標題而不是想法等。接著幾天之後則是發下閱讀作業,到了週末再考試以檢驗他們的學習成效。

最後,Simpson與Nist討論該怎麼處理標註新手常犯的錯誤。為了改善這些錯誤,Simpson與Nist鼓勵教師積極說服學生使用標註策略,並且用一套教學程序來讓學生熟悉標註策略、抓住重點。然而Simpson與Nist的標註策略教學大部分依賴著教師的專業經驗與判斷,因此教師引導學生使用標註策略的影響,乃是標註能否成功支援閱讀學習的關鍵。

儘管標註應用於教育領域中仍有許多值得探討的研究,上述的研究已經能夠帶給本研究一些啟發,足以作為設計標註學習模式的參考。

第二節 讀者標註共識

在多人合作進行閱讀標註的環境下,系統要如何管理日益增加的標註成為一個研究議題(Wolfe, 2008)。本研究的主要目的在於從已經儲存的標註中萃取出具有價值的標註知識,而篩選標註的依據與理論基礎,將來自於標註教學策略以及讀者對於標註價值的認知。本節將探討關於標註價值的相關研究,並從中發現到讀者對於標註的共識現象,以探究如何從標註中萃取知識。

Marshall(1998)透過學生購買二手書的看法與模式來找尋標註的價值。他從學生的意見中發現,前一位擁有者留下的標註的確有它的價值,但前提是這些標註沒有省略到難以理解。有經驗的買書者會傾向於選擇在邊欄有詳細註釋的書籍,而不是只有用螢光筆強調的書籍。另外歸納購書者的說法,指出他們比較偏好在課堂上的註解,也就是他們認為教師提示的權威性註解會比學生個人解釋更有價值。此外,該研究也提到大學新生不太知道該在書上記些什麼,而高年級學生則比較知道要怎麼下註解,並能夠瞭解其他人註解的價值。

Marshall根據二手書標註的分析提出一種現象,發現之前的標註者會留下一些鉛筆畫的底線,而之後的標註者不僅用螢光筆強調他們選擇的文字,也會畫在之前的標註上。這種共識的現象表現出這個段落的重要性,而且這表示標註在功能上可能會由幫助記憶與標註位置,轉變成一種吸引下一位讀者注意的記號。

同樣的,Marshall(1998)在分析大學生教科書標註時也發現到,如果多位標註者下標註的範圍都長達文獻的四分之一或甚至是一半,那麼至少會有一部份的標註會重複出現在文件同一個地方。他將這種句子被重複標註的現象稱之為「多方共識(n-way consensus)」。圖 2是Marshall研究對象中四份不同人標註的教科書片段,而他們剛好都標註在類似的範圍,而產生多方共識的現象。他認為藉由使用讀者的共識以及讀者強調的符號,不同等級的細節可以被過濾,文字可以被重組、或共識可用來作摘要。不同於網頁為主的社群用的評分機制,這種方法是基於讀者閱讀的行為,而有其客觀性。

Bradshaw與Light(2007)承繼Marshall的發現,繼續探究多位讀者閱讀同一篇文獻時標註的重疊,並將這種現象稱為「標註共識(annotation consensus)」。他們更嚴謹地蒐集了四到七位研究生各自閱讀並標註過的16份文獻,並且分析標註的散佈狀況、重複次數等數據。研究結果發現,標註共識的現象會分佈在整篇文獻,而不會集中在少數章節,而出現共識的位置也沒有明顯的規律。他們的研究中發現資料文獻中平均大約有1/4的段落發生標註共識,這表示之後的讀者可以先閱讀這些片段以獲得基本的知識。需要注意的是,他們分析的對象是各別獨立進行標註,與現今許多標註工具提供即時看到其他人標註的情境會有所差別。

基於讀者標註產生共識的篩選機制,Bradshaw與Light提出了「段落推薦模型」,以有效地壓縮研究者必須閱讀的資訊量,達到節省閱讀時間的效果。以標註共識為基礎的段落推薦模型,可以從Marshall(1998)提出的多方共識應用看到具體的例子。在圖 3的A部份左半邊是作者在書中設定的架構,而右邊則可擴展出基於這一段發生的讀者多方共識。B部份則是用深淺不同的顏色表示這些段落共識的程度高低,這也包括了未產生共識的部份。

無獨有偶的,Bateman、Farzan、Brusilovsky、McCalla(2006)所開發的多人合作式開放標註與標籤系統(OATS)中,螢光筆強調的顯示畫面也可以看到所有人對文獻中各文字的共識程度。他們將社會指引支援(Social Navigation Support,SNS)的概念應用在標註中,稱之為社會標註支援(social annotation support)。OATS以四種不同等級代表不同的共識程度:沒有人強調(0人)、低程度強調(1到3人)、中程度強調(4到8人)或是高程度強調(9人以上強調)。從圖 4課程管理系統iHelp結合OATS所展示的社群用螢光筆強調的畫面中可以看到,共識程度用視覺化的顏色表現出來,越深的顏色表示共識程度越高。

然而,量化標註共識之後將會引發其他問題。就如Marshall(1998)所警示的,儘管標註共識密集的段落會隨著使用者增加而吸引越多標註,這並不表示共識程度較低的部份就比較沒有意義。事實上,這就是社會指引支援研究中一個備受爭議的問題(Dieberger et al., 2000)。標註累積的資料能顯示出數量較大的資訊,也就是較讓人注意的部份,但就如Harper(2002)所證實的結果,儘管有些少部份的資訊也是相當重要,但也會因為沒有其他人去閱讀、開啟,而讓後來的人看到這些資訊使用的人少就誤以為它不重要。

另一個問題在於標註持續累積之後,如OATS的社會標註支援中固定次數的計算方式將會失去過濾的意義。資料探勘領域前處理方法之中的資料離散化(data discretization)可以用來解決這個問題(Han, 2001)。先前的研究中也有用資料分群法K-means將連續的數值區分成高、中、低三個不同區間的作法(Chen & Liu, 2007)。透過電腦計算結果區分不同程度,會比手動設定門檻值更具彈性且更為客觀。

以標註重複次數歸納出的標註共識,能夠代表讀者關注的焦點。這種社會指引支援的概念,可以成為本研究知識萃取的方向依據。儘管如此,欲從這些標註以及成為焦點的段落中萃取出能提昇讀者學習成效的知識,仍需要搭配有效學習理論上的支持與驗證,才能設計出合理的基於閱讀標註知識萃取方法,進而發展出有效的閱讀標註學習模式。

第三節 多人合作式標註工具

標註工具發展至今,已經有各種不同的架構、功能被提出。在不同使用的情境下,設計標註工具的考量點也不盡相同。本節將探討相關研究中標註工具的各種設計因素以及使用情境,以使本研究欲發展的標註工具能夠更符合使用者的需求。

Wolfe(2002)彙整各種標註軟體與技術,提出標註工具設計時主要七種變化因素。

  1. 輸入(input):標註工具可接受的輸入類型,包括鍵盤輸入的文字型標註、麥克風輸入的聲音型標註、以滑鼠或繪圖板進行的自由繪圖、或是結合電子筆(例如PalmPilot)在文字上自由繪圖等。
  2. 標註介面:標註的內容可以從主要文件上另開視窗顯示、以螢光筆強調重點方式顯示在文字樣式上、在文字上自由繪圖、直接插入在內文當中、或是在主要文件旁插入一欄顯示標註文字。在多人討論環境裡面,讀者為了能夠分享他人的標註,技術上最好能夠支援討論回應串介面(threaded-reply interface),如此一來讀者較能輕易瀏覽其他人對於標註的回應。
  3. 被標註的文字類型:可能是獨立的文字文件、網頁、聲音檔、影片檔、電子文件或是對於標註的標註。
  4. 定位錨點(anchor):允許讀者標註的對象,可能是在一段文字、指定段落、整篇文章、獨立的像素位置。有些技術可讓讀者針對不連續多段文字進行標註。
  5. 儲存位置:主要分成儲存在跟主要文件相同的位置,或是主要文件跟標註分別獨立儲存,通常是在資料庫當中兩種。標註儲存在資料庫可擁有較大彈性,便於應用在檢索、過濾與多人環境中分享標註。
  6. 檢索與過濾:讀者可以透過標註的各項資訊來找到已經儲存的標註。常見可以作者、撰寫日期或時間、權限(允許誰看這些標註)、標註輸入型態與目的等進行檢索。
  7. 其他特殊功能:例如CritLink(Yee, 2002)與Microsoft Office Word 2000(Microsoft, 1999)提供了自動通知功能。當文件標註被更新時,作者就會收到一封自動提醒的電子郵件。

Wolfe也歸納了標註使用的四種情境,並說明各情境中標註工具的設計要點與列舉相關軟體。這四種情境包括讀者要給自己看的標註(例如學生在讀書的時候的文字、或是研究者記錄他們想要資料的參考記錄)、讀者想給作者看的標註(例如編輯者或教師在作業流程中下的註解)、讀者想要給其他讀者分享的標註(例如圖書館讀者有時候會違規地下註解,或是編輯者下註解給其他編輯者看)、作者想要給讀者的標註(例如Eliot(1922)所作的現代詩「The Wasteland」中的標註)。

在讀者為了跟其他讀者分享標註的情境中,讀者可藉由標註工具把他們的評論與文獻片段結合在一起,因此他們可以利用標註工具評論文獻並進行討論。讀者針對其他讀者的標註進行互動的模式有兩種:標註被當作其他文字一樣,而其他標註可以像在原始文獻一樣進行標註。這種模式的優點在於保持一貫的標註動作,而他會讓原始與二次文字(即讀者的標註)的界線變得複雜,而引發其他問題。在這種模式之下的標註討論很容易變得過於複雜。因為沒有類似討論串(thread)的介面可供瀏覽,標註的深度越多層越容易造成讀者混亂。第二種模型是把標註以回覆討論串架構(threaded-teply structure)呈現,雖然這種架構會打破標註給人的印象,但讀者與讀者卻比較容易進行交談、分享知識。

多人討論的標註系統也會因為標註對象、標註與主要文獻之間關聯的不同而有所變化。同時也要考慮到讀者的權限設定需求,Annotator(O'Hara & Sellen, 1997)、CritLink(Yee, 2002)與DEBORA(Nichols et al., 2000)皆允許讀者設定他們標註的公開等級,可為私人的、公開的或限制特定群組才能閱讀。有些合作標註系統允許在多份不同文件之間交互參照(cross-reference),因此教師可以利用標註來建立文件之間的連結以供學生閱讀(Vannevar, 1945)。

陳聯(2006)詳細地介紹了在網頁中標註工具的實作方法,可允許讀者在Microsoft Internet Explorer等瀏覽器中對任意伺服器上的網頁直接地進行標註,而且可任意指定標註位置,標註資料與被標註的網頁分別儲存,還具備標註的修改、刪除和移動,以及標註資料的共享與重組等功能。圖 5描述此標註工具模型的運作流程,共有6個步驟:

  1. 客戶端(client)登入到標註伺服器後,提交被標註頁面的網址到標註伺服器;
  2. 標註伺服器傳回到該網址相關的標註訊息;
  3. 客戶端根據網址重新定向到被標註伺服器;
  4. 被標註伺服器傳回該網址對應的網頁頁面到客戶端;
  5. 在瀏覽器中,被標註網頁頁面一旦讀取完畢,再將步驟2回傳的標註資料嵌入到被標註網頁的HTML程式碼中;
  6. 當有新增或修改的標註訊息,即儲存於標註伺服器中。

除此之外,尚有許多研究提出許多值得參考的標註架構。Agosti、Ferro、Frommholz與Thiel(2004)提出標註工具整合模型,並一一說明該如何組織標註工具架構與將標註與資訊資源連結起來;Shevade與Sunaram(2005)提出合作式標註架構,讓讀者社群可以在共享典藏文件上進行合作標註,該系統並基於媒體特色、使用情境、經驗關聯(commonsensical relationships)與語意關聯(linguistic relationships)的資訊提供使用者個人化的建議。也有許多研究發展的標註工具以開放原始碼提供研究者參考,像是CritLink(Yee, 2002)或OATS(Bateman et al., 2006),這些研究結果皆可成為本研究發展標註工具的基石,讓系統開發更為周全。

第三章 基於閱讀標註策略之知識萃取方法

基於閱讀標註策略為本研究的理論基礎,而從讀者的閱讀標註中萃取知識則為本研究欲發展核心技術。知識萃取方法除了從讀者標註內容文字當中萃取出合適的資料之外,還包涵了學習並應用標註策略的學習理論。本章將依序說明知識萃取策略的運作流程,接著說明標註類別的設計理念,最後提出以標註共識萃取具有影響學習成效的標註知識的方法。

第一節 知識萃取策略運作流程

依據第二章文獻探討,本研究將從標註工具的設計中規範具有學習意義的標註策略,使讀者在閱讀文獻的過程中即以符合學習理論的程序進行標註動作。接著系統從眾多讀者的標註資料中,萃取出大多數讀者的策略共識,以判斷是否應該給予讀者策略上的提示,同時萃取與提示相對應的建議,並於適合時機將建議回饋給讀者,以刺激讀者反思、提昇讀者學習成效。而讀者對於標註工具建議的反應,也將回饋給系統作為修正標註共識建議的依據。知識萃取策略流程如圖 7,細線框為讀者的動作部份,粗線框且斜體字則是標註工具的運作部份。

第二節 標註類別設計理念

本研究標註的類別設計是基於參考Simpson及Nist所提出的閱讀標註策略(1990)訂定,共分成「摘要」、「概念」、「舉例」、「考題」、「困惑」、「質疑」與「其他」七種類別。表 2 標註類別設計對照表詳列每一個標註類別的策略與意義,不同類別標註背後代表的閱讀省思意義皆有所差異,因此希望讀者填入的資料也不盡不同。例如:類別「摘要」是對應到「段落摘要」策略,希望讀者能用自己的話,寫入一段摘要;「舉例」則是對應「舉例標註」策略,讀者除了可用文字描述舉例之外,也可以引用網路資源或上傳檔案。而這之中,「自訂」類別則是允許讀者自行設定,鼓勵讀者發展自己的編碼法,但仍需以原有的閱讀標註策略為重。讀者可針對各種標註類別設定顯示強調顏色與對應圖案,被標註該類別的文字不僅將強調顯示讀者指定的顏色,旁邊邊欄也會顯示讀者指定的圖案,以方便讀者瀏覽文獻時能夠快速找到自己的標註。

在新增標註的時候,標註工具便會提示讀者選擇標註的類別(如圖 6)。標註類別的選擇會影響輸入表單的型態,以符合該標註類別所期望的資料類型。例如圖 6中選擇的「摘要」類別是要求讀者輸入一段文字,故表單空位較大;圖 8則選擇「概念」類別,故需要讀者輸入一到多個相關概念的字詞。

這七種標註類別可讓讀者學習使用具有閱讀學習理論基礎的標註策略進行有效閱讀標註,除此之外,標註類別還可用於發展各種基於不同標註類別之知識萃取策略。下一節說明本研究擬提出的知識萃取方法。

第三節 標註策略共識萃取

當閱讀標註工具資料庫累積了大量讀者的標註資料之後,便可進一步萃取大部分讀者的標註策略知識,以作為提示其他讀者修正標註策略的依據。

本研究參考Simpson與Nist(1990)提出的標註稽核表(見表 1),歸納出標註過多、標註過少、其他建議、完美四種建議。表 3列出建議類別的設計概要,各種建議類別底下不同的判斷條件,而各判斷條件有其依據的來源與提示讀者的時機。舉例來說,假使如果學習者標註的內文太多是來自於文獻本身,那麼系統應該提示訊息,請學習者避免使用錯誤的標註策略。

標註稽核策略判斷需要依賴大多數讀者的標註共識。所謂的標註共識,是指大多數讀者針對不同標註類別進行閱讀標註時的共同標註行為或內容。以內文重點範圍標註為例,假設圖 9表示內文與各讀者標註之間的關係,下方的「Word1」、「Word2」表示文件中各單字,上方「User1」、「User2」的框表示各讀者標註的範圍。各單字與讀者標註重複的次數,將可分析出諸如「高」、「中」、「低」三種不同標註共識程度。例如圖 9中Word2到Word4皆有3到4位讀者標註,相較於其他被標註之內文單字,可以判定Word2到Word4的標註共識程度為「高」。

標註工具可以高程度標註策略共識的提供讀者調整自己閱讀策略的建議。相同於上例的標註行為,如果標註Word 2到Word 4的4位讀者使用「質疑」標註類別,那麼這段由大多數讀者標註共識所關注的文字,可能就是一段值得其他讀者對此進行辯證的文章內容,可依據此提醒讀者進行更深層次的閱讀反思。搭配表 4 標註建議設計概念表,便可於合適的時機進行提示,作為讀者對於多數讀者標註策略共識的反思依據。

第四節 標註知識萃取

除了依據標註類別來萃取標註策略共識之外,本研究也將基於不同標註類別對於閱讀知識內涵的特性,提出針對特定標註類別中標註內容的知識萃取方法,以萃取出有助於讀者進一步參考閱讀的知識內容。例如針對「摘要」標註類別,以文字探勘技術的多文件摘要方法萃取出具代表性的閱讀想法摘要;或著針對「舉例」標註類別彙整讀者列舉的例子,以成為延伸閱讀清單等方法,進行基於不同標註類別之標註內容的有效知識萃取。以下進一步說明整合閱讀標註策略共識以及基於標註知識萃取提昇閱讀成效的兩種可能應用模式:

圖 11展示以「摘要」標註策略類別的萃取畫面,標註工具將先依照標註策略共識來提示讀者修正閱讀策略,例如字數與其他讀者的標註差距太多,或是用詞淺字與其他讀者有所不同等。接著再從其他讀者的「摘要」類別中,過濾掉不符合大多數讀者閱讀標註策略共識的標註之後,再以多文件摘要技術萃取出代表性的標註摘要或是多觀點的標註摘要,並推薦給讀者以刺激讀者對其他人的標註進行反思。

除了從標註內容中萃取知識之外,也可以從眾多讀者標註類別的混亂程度,萃取出讀者使用標註策略的不一致性,透過強調具有多樣化觀點的段落,以刺激讀者對於多種策略使用上的反思。以圖 10中亮黃色強調部份「underlining and highlighting」為例,多位讀者在閱讀標註時對於這兩個文字使用了「質疑」、「困惑」與「摘要」等不同的標註類別,表示讀者使用的閱讀標註策略有所分歧,接著依據讀者所使用的標註類別可計算出熵(entropy),也就是標註類別的混亂程度。最後在全文件中篩選出高混亂程度的段落,將之以亮黃色強調顯示,以吸引讀者注意力。讀者在閱讀具有多種不同標註策略的段落之後,便可從中進行不同面相的深層反思與學習。

藉由閱讀標註工具所產生之大量使用者的閱讀標註行為與閱讀標註內容,如何基於閱讀標註策略利用資料探勘方法從中萃取出有用的閱讀標註策略與標註知識輔助讀者的閱讀學習,仍具有相當潛力的可發揮空間。未來本研究將致力於合理且有效的標註策略與標註知識萃取方法,並將發展之具知識萃取功能的閱讀標註工具整合於數位圖書館系統中,一方面有助於數位圖書館典藏讀者閱讀知識,促進典藏內容的知識加值與知識分享;另一方面則是讓數位圖書館具有直接支援數位學習的機制,如此也有助於數位圖書館經營學習社群,發展具有使用者參與之Web 2.0數位圖書館系統。

圖 10 強調讀者標註策略類別混雜的文字

圖 11 標註工具萃取「摘要」策略提示與建議

第四章 研究方法與步驟

第一節 研究架構

本研究將標註策略、標註共識與多人合作式標註的概念整合,並基於資料探勘技術發展基於閱讀標註策略之知識萃取功能,並實作於標註工具,輔助讀者在數位圖書館或數位典藏系統中進行閱讀學習。

標註策略萃取可作為有效提昇讀者閱讀能力的一種學習策略;標註共識則能幫助讀者萃取可靠有效的標註知識,提昇閱讀的廣度與深度;多人合作式標註工具的設計則能提供一個合作式的閱讀標註學習環境,以同儕刺激學習的方式,幫助學習者進行閱讀知識的辯證與反思。以上從文獻探討所提出的三個概念,將作為支撐本研究發展有效之具知識萃取功能閱讀標註工具的理論基礎。

本研究發展閱讀標註策略以提昇學習者閱讀學習成效。其作法是讀者先透過標註工具增加閱讀標註,然後再藉由本研究的知識萃取方法萃取隱含在眾多讀者標註當中的知識並回饋給讀者,用以鼓勵學習者的反思、批判,刺激學習者的更具內涵的閱讀標註。整體的策略將可以有助於提昇讀者閱讀的深度與成效。最後再以準實驗研究法、問卷訪談法與深入訪談法驗證閱讀標註策略的成效性。整體研究架構概念圖如圖 12所示。

第二節 研究方法

依照本研究的目的,本研究將基於文獻分析法歸納過去閱讀標註的相關文獻,發展設計具備知識萃取功能之閱讀標註工具。再以準實驗研究法比較具有知識萃取功能之閱讀標註工具輔助學習之學習者,是否優於不具知識萃取功能輔助之閱讀標註工具學習者的學習成效。最後使用問卷調查法與深度訪談法分析閱讀標註策略之知識萃取方法對於學習者的影響,並藉以本系統的使用滿意度及取得系統的改進建議,最後再歸納整個研究的結論及未來發展的方向。

一、文獻分析法

本研究利用文獻分析法蒐集標註應用於閱讀學習策略、標註共識與多人合作式標註工具設計之相關文獻,藉由比較、歸納先前研究的過程與結果,歸納出發展具備知識萃取之標註工具的理論與實作策略,並作為實驗進行、資料分析方法之參考依據。

二、準實驗研究法

為了驗證具備知識萃取功能之閱讀標註工具之學習成效,本研究將採準實驗研究法實地邀請讀者使用標註工具,以進行整體系統成效的評估。實驗樣本由參與合作課程之學校選取,利用隨機抽樣分派的方式抽取兩班的學習者,使不同班級的學習者接受不同的實驗處理。樣本分為實驗組與控制組,兩組學習者針對相同的論文課程進行閱讀學習,但是使用不同的標註工具。實驗組使用的標註工具具備知識萃取之功能,而控制組使用不具知識萃取功能之閱讀標註工具進行閱讀學習。

在實驗的一開始,研究者先說明本研究的目的與閱讀標註策略的好處,以吸引學習者願意使用閱讀標註策略。接著學習者會被要求進行被指派閱讀內容之前測作業,以作為檢定學習者本身具備的先備知識是否有所差異的依據;在實驗過程中,研究者會先做閱讀標註系統使用說明,然後由學習者使用不同的標註工具進行論文閱讀,以完成指派之論文閱讀作業;最後,當學習者完成閱讀論文作業之後,本研究將會再進行後測作業作為檢定前後測學習成效是否具有差異之依據。本研究實驗過程所蒐集之數據將進行量化分析以歸納研究結論。

三、問卷調查法與深度訪談法

為了能夠更進一步地瞭解基於閱讀標註策略之知識萃取方法是如何影響學習者的學習成效,本研究除準實驗研究法外,也將採用問卷調查法與一對一的深度訪談法來取得學習者使用系統的背後想法。

本研究將依據過去閱讀標註策略的相關研究以及本研究設計的閱讀標註策略來擬定問卷問項與訪談大綱,調查學習者對於閱讀標註策略之合適性、知識萃取之正確性、該策略對於學習的影響以及系統滿意程度進行評比,並闡述使用過程經驗,最後提出對於本研究的建議。

最後說明研究對象選擇的過程,問卷調查法以全體受試者為對象,而深度訪談因受限於時間、人力,將會以隨機抽樣選擇五到六位學生,並依據實驗數據分析結果,以立意抽樣的方式選擇分析結果較為特殊的受試者進行訪談,以蒐集普遍與特殊兩種學習者的資料。

第三節 研究對象

本研究發展之閱讀標註策略需要實際設計實驗以驗證其對於學習的成效,而研究對象將依據本研究的目的、先前的相關研究來選擇。為了使本研究的閱讀標註策略能夠最有效地提昇學習者學習成效,本節將說明選擇研究對象的條件與考量。

參考先前的研究(Bradshaw & Light, 2007; Marshall, 1998; Simpson & Nist, 1990),本研究將選擇大學通識課程中修課的同學為主要研究對象。通識課程的組成通常來自多種不同科系學生,學科背景各不相同;而通識課課程的主題,特別是社會學、傳播學的課程往往具有促進批判、思考與多方意見等特色,預期學習者在利用標註工具輔助學習的過程中,能夠激發出不同觀點的標註資料。學習者的類型則以閱讀、標註能力尚為生疏的大學一年級、二年級學生為佳,並皆具備基礎的電腦資訊素養、熟悉網頁操作方法。實驗組與控制組學習者皆被要求進行論文研讀活動,活動內容為閱讀並標註數篇的研究論文,此論文務求容易理解、但卻引人深思,而且以學習者熟悉之語言為佳,最後完成研讀活動之後進行閱讀成果測驗。

本研究將受試學習者樣本分為實驗組以及控制組,以有無知識萃取功能的標註工具為自變項,而檢測學習者閱讀與標註結果所表現的學習成效為依變項,蒐集學習者在論文研讀活動的學習歷程與前測、後測成績等各種資料。研究對象的人數將參考統計理論,採實驗組與控制組兩組個別最好超過30人的樣本方式進行,預期才能取得較具可信的實驗結果。

第四節 研究工具

本節將介紹本研究所使用的其他研究工具,包括「多人合作式標註工具」、「全國通識課程資料庫」、檢測學習成效的「前測」與「後測」、蒐集研究對象深層資料的「系統滿意度問卷」與「訪談大綱」。

一、多人合作式標註工具

本研究欲發展基於閱讀策略之知識萃取功能將實作在標註工具之中。此標註工具將應用於網路多人合作標註的情境中,多位讀者可以針對任意同一份網頁頁面進行標註。系統架構將以AJAX(Asynchronous JavaScript And XML)模式建構,並確保此標註工具可在現今常見的網路瀏覽器(如Microsoft Internet Explorer 6與7、Mozilla Firefox 3或是Google瀏覽器Chrome)上正常運行,以因應不同平台使用者的需求。

此標註工具允許讀者可針對HTML(HyperText Markup Language)網頁內容上的文字資料進行標註,標註對象可為一段文字、一句話、整個段落或是圖片、表格,標註的類型則為注釋或螢光筆強調兩種。當讀者欲進行標註或閱讀已被標註的文字時,標註工具將會顯示類似黏貼註(sticky note)的操作介面,如圖 13所示。在黏貼註介面中,讀者可以進行新增並選擇標註類別、編輯、刪除標註等動作,同時也會顯示已經儲存的標註。讀者的身份記錄與標註資料將儲存於資料庫中,以利發展具支援數位學習之閱讀標註萃取方法,擴大各種應用的彈性。除此之外,此標註工具也應提供檢索功能,可針對同一份文件內的標註者、標註內容、標註類型、被標註的資料進行全文檢索。

圖 13 以討論回應串顯示
其他讀者標註內容的黏貼標註介面

最後,考量到此標註工具除了支援個人學習之外,還希望能夠促進讀者與讀者之間的知識分享與交流,因此標註工具應允許讀者設定標註的開放等級,可選擇跟其他讀者分享或是讀者私人記事;另一方面,讀者之間以回應他人標註的方式進行交流,讀者可以指定其他讀者的標註以進行回應,而讀者討論的資料則將以討論回應串(thread-reply)的方式顯示(如圖 13),如此的介面設計將可以更方便讀者瀏覽與操作閱讀標註工具。

標註工具已經有相當多的研究,而不少研究成果也以開放原始碼的形式提供其他人下載、研究。因此本研究欲從現有研究成果中選出最為符合基於閱讀策略之知識萃取功能使用情境與需求的標註工具,以成為發展閱讀標註策略的基礎架構,並節省系統開發所需的時間。

二、全國通識課程資料庫

基於研究對象之選擇考量,本研究將以全國通識課程資料庫(如圖 14)作為閱讀標註工具支援閱讀學習之應用的環境。全國通識課程資料庫是「教育部通識教育資源平台建構與永續發展計畫」所發展的開放式經典通識課程數位典藏平台(林從一 et al., 2008)。該計畫是承襲美國麻省理工學院(Massachusetts Institute of Technology,MIT)開放式課程計畫的精神,以及響應教育部「網路學習發展計畫(2006)」,以分享學校教學資源、取之於社會、用之於社會之精神,將課程授權開放於網路上與全世界共享。

全國通識課程網資料庫豐富的通識資源,可支援通識課程教材的來源,以利授課活動的進行。系統功能方面,該資料庫是以DSpace機構典藏系統(MIT Libraries, 2002)為基礎開發而成,擁有完善的典藏架構與權限控管設定。本研究選擇將具知識萃取之閱讀標註工具應用於全國通識課程網資料庫,除了該資料庫具備條件符合本研究之研究對象學習所需環境、控制實驗進行的能力外,也期望能以此閱讀標註工具來提昇全國通識課程網資料庫支援有效數位學習的應用層面。

三、前置標註資料成員

本研究為了建制具知識萃取功能之閱讀標註工具能萃取輔助閱讀之知識,在系統建置之時需先蒐集前置標註資料,以便在實驗進行時能有萃取之依據。本研究預計將邀請五到六位成員參與前置標註資料的建置作業,這些成員將針對受試學習者在實驗中被要求閱讀的論文進行先期標註,因此需對該主題有一定程度的瞭解、並熟悉標註工具之使用。基於以上考量,前置標註資料的建置以課堂教師或研究生、已通過修課學生為宜。本研究預計將請課堂教師推薦合適前置標註資料成員。

四、前測與後測

本研究以前測與後測來檢驗標註工具是否具有提昇研究對象的知識水準,來衡量標註工具對於幫助閱讀學習是否具有助益的依據。測驗的內容將依據研究對象課程中所研讀之論文主題,由授課教師與研究者共同設計,以確定研究信度與具備專家內容效度。測驗題型參考相關研究文獻設計,以多重選擇題與問答題方式進行。前測與後測的結果分數由課堂教師進行統一評定,最後再由研究者進行分析歸納。

五、系統滿意度問卷與訪談大綱

為了深入瞭解研究對象使用標註工具支援閱讀學習之深層想法,本研究以系統滿意度問卷與訪談大綱蒐集量化與質性的資料進行分析。系統滿意度問卷與訪談大綱將針對標註工具介面設計滿意度、標註工具萃取知識之正確性看法、標註工具如何影響研究對象的學習、系統建議等四個面向進行調查。系統滿意度問卷將以Likert五點量表(Likert, 1932)調查研究對象對於各個問項的認同程度。

第六節 研究實施步驟

  1. 確定研究主題。
  1. 擬定研究目的。
  2. 蒐集相關文獻,進行文獻分析。
  3. 擬定研究方法。
  4. 根據文獻分析,發展具知識萃取功能之閱讀標註工具,並將閱讀標註工具整合至「全國通識課程資料庫」上;同時邀請研究對象。
  5. 請前置標註資料成員對「全國通識課程資料庫」上由授課教師指定閱讀的文獻進行閱讀標註,以累積標註資料。
  6. 研究對象前測。
  7. 實驗進行。
  8. 研究對象後測。
  9. 對研究對象進行問卷調查與深入訪談。
  10. 研究結果分析。
  11. 提出結論與建議。

詳細流程如圖 15。


參考文獻

Agosti, M., Ferro, N., Frommholz, I., & Thiel, U. (2004). Annotations in Digital Libraries and Collaboratories-Facets, Models and Usage. LECTURE NOTES IN COMPUTER SCIENCE, 244-255.

Bateman, S., Farzan, R., Brusilovsky, P., & McCalla, G. (2006). OATS: The Open Annotation and Tagging System. the Proc. of I2LOR ‘06, Montreal. Retrieved from http://fox.usask.ca/files/oats-lornet.pdf.

Bradshaw, S., & Light, M. (2007). Annotation consensus: implications for passage recommendation in scientific literature. In Proceedings of the eighteenth conference on Hypertext and hypermedia (pp. 209-216). Manchester, UK: ACM. doi: 10.1145/1286240.1286300.

Brust, M. R., & Rothkugel, S. (2007). On Anomalies in Annotation Systems. Arxiv preprint arXiv:0706.1087.

Chen, C., & Liu, C. (2007). Personalized e-news monitoring agent system for tracking user-interested Chinese news events. Applied Intelligence. doi: 10.1007/s10489-007-0106-7.

Chen, C., Wang, M., Tsay, M., Zhang, D., & Chen, Y. (2008). Developing a Taiwan Libraries' History Digital Library with Reader Knowledge Archiving and Sharing Services Based on DSpace Platform. In Lecture Notes in Computer Science.

Davis, J. R., & Huttenlocher, D. P. (1995). Shared annotation for cooperative learning. In The first international conference on Computer support for collaborative learning table of contents (pp. 84-88). Lawrence Erlbaum Associates, Inc. Mahwah, NJ, USA.

Dieberger, A., Dourish, P., Hoeoek, K., Resnick, P., & Wexelblat, A. (2000). Social navigation: techniques for building more usable systems. interactions, 7(6), 36-45.

Digital Library Federation. (1998). A working definition of digital library. Digital Library Federation (DLF). Retrieved October 21, 2008, from http://www.diglib.org/about/dldefinition.htm.

Eliot, T. (1922). The Waste Land. Bartleby.com. Retrieved December 18, 2008, from http://www.bartleby.com/201/1.html.

Farzan, R., & Brusilovsky, P. (2005). Social Navigation Support Through Annotation-Based Group Modeling. LECTURE NOTES IN COMPUTER SCIENCE, 3538, 463.

Han, J. (2001). Data Mining: Concepts and Techniques. San Francisco: Morgan Kaufmann Publishers.

Harper, H. R. (2002). Information that counts: a sociological view of information navigation. Designing Information Spaces: The Social Navigation Approach, 343–353.

Likert, R. (1932). A Technique for the Measurement of Attitudes. New York: [s.n.].

Lunsford, A. (2000). The Presence of Others: Voices and Images That Call for Response (3日 ed.). Boston: Bedford/St. Martin's.

Marshall, C. C. (1997). Annotation: from paper books to the digital library. In Proceedings of the second ACM international conference on Digital libraries (pp. 131-140). ACM New York, NY, USA.

Marshall, C. C. (1998). Toward an ecology of hypertext annotation. In Proceedings of the ninth ACM conference on Hypertext and hypermedia: links, objects, time and space---structure in hypermedia systems: links, objects, time and space---structure in hypermedia systems (pp. 40-49). ACM New York, NY, USA.

Merriam-Webster. (2008). annotation. Merriam-Webster Online Dictionary. Retrieved December 13, 2008, from http://www.merriam-webster.com/dictionary/annotation.

Microsoft. (1999). Word 2000 說明及使用方法 - Word - Microsoft Office Online. Microsoft Office Online. Retrieved December 18, 2008, from http://office.microsoft.com/zh-tw/word/FX100649281028.aspx?CTT=96&Origin=CL100636481028.

MIT Libraries. (2002). dspace.org. dspace.org. Retrieved October 20, 2008, from http://www.dspace.org/.

Nichols, D. M., Pemberton, D., Dalhoumi, S., Larouk, O., Belisle, C., & Twidale, M. B. (2000). DEBORA: Developing an Interface to Support Collaboration in a Digital Library. LECTURE NOTES IN COMPUTER SCIENCE, 239-248.

O'Hara, K., & Sellen, A. (1997). A comparison of reading paper and on-line documents. In Proceedings of the SIGCHI conference on Human factors in computing systems (pp. 335-342). ACM New York, NY, USA.

Salvatori, M. (1996). The" Argument of Reading" in the Teaching of Composition. Argument Revisited, Argument Redefined: Negotiating Meaning in the Composition Classroom.

Shevade, B., & Sundaram, H. (2005). A Collaborative Annotation Framework. In Multimedia and Expo, 2005. ICME 2005. IEEE International Conference on (pp. 1346-1349). doi: 10.1109/ICME.2005.1521679.

Simpson, M. L., & Nist, S. L. (1990). Textbook Annotation: An Effective and Efficient Study Strategy for College Students. Journal of Reading, 34(2), 122-129.

Vannevar, B. (1945). As we may think. The Atlantic Monthly, July.

Wolfe, J. (2002). Annotation technologies: A software and research review. Computers and Composition, 19(4), 471-497.

Wolfe, J. (2008). Annotations and the collaborative digital library: Effects of an aligned annotation interface on student argumentation and reading strategies. International Journal of Computer-Supported Collaborative Learning, 3(2), 141-164.

Wolfe, J. L., & Neuwirth, C. M. (2001). From the Margins to the Center: The Future of Annotation. Journal of Business and Technical Communication, 15(3), 333.

Yee, K. P. (2002). CritLink: Advanced Hyperlinks Enable Public Annotation on the Web. In CSCW 2002 conference, New Orleans, December.

吳玓玲(2004)。線上多人批閱及分析系統─以C語言教學為例。碩士論文,中華大學資訊管理系,新竹。

谷圳 (2003)。朝向無縫式的註記與發問學習輔助系統。碩士論文,國立中央大學資訊工程研究所,中壢。

林從一、羅竹芳、黃俊儒、陳志銘 (2008)。全國通識課程資料庫。全國通識課程資料庫

常唯 (2008)。 論網絡環境下用戶標注的價值與應用。圖書情報工作,(1)。doi: CNKI:SUN:TSQB.0.2008-01-005。

程仲凱 (2004)。以電腦閱讀註記輔助提昇學童大意摘要的學習成效。碩士論文,國立中央大學資訊工程學系碩士在職專班,中壢。