’Amis�阿美語萌典團隊
moedict ’Amis Team
’
Nga’ay ho! O misanga’ay to citing no ’Amis a
cefang kami. Ci Lafin kako.
大家好,我們是阿美語萌典團隊,我是Lafin。
團隊
大家好�(打招呼語)
我們
製作、維護者
字典
阿美
過夜
Pasifana’ kako anini to cecay a tilid:
Sakamo'etep a mihecaan.
今天的阿美語每日一字:
10周年。�
字
今天
一
教
10
圖片來源:g0v
第
年
Anoira ko kafokilan a ngiha’ no ’Amis i,
pasifana’en kami.
如果對於阿美語發音有不確定的,歡迎來找我們。
如果有
不知道的、疑惑
聲音
請告訴
我們
原民會在2014年時,有線上版族語字典,卻沒有阿美語。
Miaoski 台灣零時政府第拾次資料科學黑客松提案,徵求參與者。
方敏英字典
這樣一頁的PDF及文字檔,
會讓協作者感覺負擔很大,
參與意願降低。
所以動手拆解PDF檔!?
7
OCR
數位檔
建置鄉民OCR平台
將方敏英傳教師的阿美語字典共449頁PDF,切成切割成14,681條(豆腐條),並用OCR軟體初步辨識。
有了基礎的OCR辨識後,Miaoski建置一個可以校正OCR平台,並在年會最後的閃電短講,宣傳並希望鄉民能夠協力完成這個任務。
8
建置鄉民OCR平台
在第拾次資料科學徵求文字工後,在短短53小時內,就完成14,681列工人辨識。
14,681條列,總共82,180字。
miaoski與Lafin花費一個月將數位檔,調成萌典可以用的格式,以便後續導入。
9
上線
利用g0v萌典專案(Open Source),
開始上線。
阿美萌典技術及授權方式都是採
用CC-BY-NC及開源授權方式,
所有資料包含字典都公開放在
github上,想要利用的人都可以,
在相同授權下使用。
10
目前有什麼字典呢?
方敏英傳教士
方敏英傳教士阿美語字典,是由Miaoski與聖經公會取得授權,在2014g0vsummit開啟一系列阿美族語開源的契機。
透過群眾外包與開源相互配合,讓舊版本圖書數位化不需仰賴政府或是企業這樣龐大的機器,透過民間協作的方式也可以達成,你我都可以成為這個專案的一份子。
12
潘世光神父
在偶然機會下,知道自己部落附近的鐵份部落中有一位神父曾編寫阿美語字典,除了有阿美語-漢語字典外,還有編撰法語-阿美語對照辭典。
衝!試圖用網路搜尋教會電話,打電話找神父,神父因年邁耳朵不好,再n次電話後,終於與神父聯繫上。抵達花蓮與神話初步講述我們的開源計畫與目的後,神父就將字典授權給阿美語萌典。
13
蔡中涵博士
當時有詢問許多民間架設的字典網站,都被婉拒,直到蔡中涵博士聽到開源社群及提供族人更方便學習的資源時,欣然答應提供自編十餘年的辭典供大家使用。
而蔡中涵字典在給予檔案是PDF檔,這又是對於編輯上一大問題。
14
目前成果
現行的是有wed網站為主,在ios及android上則是使用PWA架構,且目前有外掛後台,可以提供蔡中涵博士進行修正。
15
改變什麼?
除了官方版以外的族語字典提供另外一種選擇,雖然仍有缺失,但這個精神希望能夠持續傳承下去,再繼續下一個十年....
16
團隊成員簡介
lafin miku (阿美族)
miaoski (後端)
a-tsioh (後端)
cindylinz (貢獻者)
conrad (貢獻者)
weiting (PM)
rschiang (後端)
markwu (後端)
林阿天
小蟹(kalang)
合作:iTaigi (Liz, PM5)、
語音合成 sing5hong5
Nanay ’alomaloman ko mikapotay tamiyanan
a patenak to sowal no ’Amis ato Satimolan a
Kitakit.
若大家對於阿美語或是世界南島有興趣,也歡迎大家來跟我們交流。
南方
島嶼、國家
說、語言
傳播
嚮往
(表示強烈希望)
參與者、加入者
在我們這邊
(賓格)
越來越多
同級、同群人
謝謝大家!
Aray!