Open Data -來自資訊界的社會運動
雨蒼
美國獨立宣言主要起草人 Thomas Jefferson 曾在1787年寫下這段話:
“And were it left to me to decide whether we should have a government without newspapers or newspapers without a government, I should not hesitate to prefer the latter.But I should mean that every man should receive those papers and be capable of reading them.”
「如果要我在沒有報紙的政府或是只有報紙而沒有政府之間選擇,我會毫不猶豫的選擇後者。我的意思是,所有人都應該可以收到這些報紙,並且能夠閱讀它們。」
開放政府資料
在一個真正民主的社會,選民應該要能理解政府的任何行為,並且有能力去監督政府。這些都需要資訊流通才能做到。資訊的流通可以讓選民在投票的時候更理解他們的選擇,以及這些選擇所帶來的後果。也能讓人民理解政府究竟做了什麼,人們的稅金到底是怎麼花的。
政府在施政的過程中也收集並產生了大量的資訊,例如台灣歷年來的 GDP、物價指數或經濟相關數據等等。這些數據通常是施政團隊在擬定和施行政策時所需要參考的資料。因為政府官僚的組織十分龐大,通常只有具有權限的公務人員或是政務人員才有能力取得這些資料。但人民需要監督政府的施政。如果無法取得,或是無法理解這些資訊,民間的監督就無法落實,人民也容易做出錯誤的決定。所以 Thomas Jefferson 才會特別說明:單純開放資訊還不夠。這些資訊要讓人民可以理解,才是有用的資訊。近年來,由於許多資訊陸續數位化,雲端運算的功能也逐漸普及,世界各國開始發起開放政府資訊(Open Government Data,以下稱為 Open Data)的運動,要求政府開放這些資料,讓民間可以更好的落實對政府的監督,也方便人民對這些資訊進行再處理。美國,英國等國家在2009已經啟用了 Open data 的網站,而其他如澳大利亞,加拿大等政府也陸續於2011年開始 Open data(註1、2)。
Open data 對民眾有哪些利益呢?一般來說,政府的 Open data 對民眾的利益主要有兩個方向:一個方向是監督政府。例如公開議會及立法院的院會紀錄以及影片,可以讓人民清楚自己選出來的立委,究竟在立法院裡是支持怎樣的議案,可以作為投票的參考。或如政府的預算編列,可以讓人民清楚自己的稅金是怎麼被使用的。另一個方向是便民,例如開放查詢門牌號碼的服務,可以讓許多的移動開發者開發相關的應用程式,方便人們使用手機來查詢店家資料。開放歷年來的經濟數據,可以作為人民投資的參考依據,開放公車到站資訊,讓開發者可以製作應用程式,把公車到站資訊傳輸到需要的人的手上(註3);又如不動產交易實價登錄,可以讓人民清楚真正的不動產成交價,防止地產商哄抬不動產價格。畢竟,政府成立的目的是為了服務民眾,這些資料也是使用人民的稅金收集而來的。人民理應有權利要求政府開放這些資料供人民使用。
台灣近期發生最有名的事件,莫過於地產實價登錄相關事件。台灣於2012年8月開始實施實價登錄,也就是不動產交易成功後,需要登錄交易價格到政府;而政府可開放民眾查詢,方便民眾作為不動產購置參考。這可以防止地產商哄抬不動產價格,避免房價不斷飆高。但是台灣內政部在此政策實施後所開放的查詢介面(註4)卻非常不好用。有一群台灣的資訊人員看不下去,自己跳出來撰寫網站,使用網路蜘蛛(註5)去收集內政部的實價登錄查詢網頁裏面的各筆交易資料,並且使用 Google Map 提供的工具做出了非常便民使用的介面(註6)。
如果政府是電力公司
如果把資料用電來比喻,台灣政府運作就像電力公司一樣。平常電力公司(政府)會跟民眾收取電費(稅金),然後透過發電廠,把各處收集來的發電原料(原始資料)轉換成電力(資料)。這個電力公司會製作一些電器(便民服務),用這些電來運作這些電器。不過這些電器的線路是直接接上發電廠的,裡面的電力一般民眾沒有辦法拿去接上自己做的電器。雖然這些電器的效率不是很好,但是服務人民也還算過得去。實價登錄這件事情其實就像是因為依據法律規定,電力公司需要製作一個裝置,讓人民可以享有涼爽的空氣,因此電力公司做了一台使用這些電(實價登錄資料)的電風扇(內政部查詢網站);但是這個電風扇做的不好,很難用,每用幾分鐘還會停止運作。所幸有個開發團隊自己重新做了一台冷氣機(民間版網站)。因為電力公司沒有提供插座,因此他們只好改造了政府的電風扇,找出裡面的線路,把電接上他們的冷氣機(圖1)。如此一來,希望可以涼快一點的消費者只要使用他們的冷氣機就好了。
事實上,為了提升資料使用的親和度,國外政府在Open data的同時往往還會額外提供API(Application Programming Interface,應用程式介面,註7)。API 和網站有什麼不同?API 就像插座,民間開發者製作的各種電器只要接上統一格式的插座,就可以引電來用。無論是電視機,冷氣機,還是洗衣機,只要製作適當的插頭接上插座就可以使用,這樣就不用改裝政府提供的爛電風扇了(圖2)。
圖1、目前台灣作法,政府不提供 API,因此只能從政府提供的網站撈出資料。
圖2、若以國外作法,政府額外提供 API,民間開發者就可以很方便的取得資料。
有人會問:使用政府的資料會不會違法?事實上,以電力公司的比喻來說,這個電風扇的電力是由民眾付出的電費來製作出來的。電力公司該做的,就是提供穩定的電力和統一格式的插座,而民眾要怎麼用這些電,根本就不在電力公司的職責之中;就算有人拿電來犯罪,責任也在犯罪的人身上,而不在電力公司(註8)。
如果使用 API ,電力公司只要提供一個簡單的,格式統一的插座就好;對想要用各種電器的人來說,他們只要在需要的時候在插座上插上插頭,就可以使用他們想要用的各種家電,不用花費時間來破解電力公司做出來的爛電風扇。以台灣實價登錄網站的狀況,開發人員需要花費時間精力在解析政府的網站內容,而且必須每隔一段時間就要重新解析,否則無法取得最新的資料。這只會增加民間版網站的開發成本。
從這件事情來看,就可以很清楚:台灣的政府事實上並不了解 Open data 的原意及意義。甚至在日後的改版中,還將所有的成交價數字改變為圖檔,意圖阻止其他民間版網站開發者使用網路蜘蛛來收集資料(註9)。這就像是電力公司發現消費者會偷接電風扇的電以後,就把電風扇改版,封死各種可能會被接出電的地方,防止消費者使用冷氣機。
在許多專案開發的過程中,往往會出現這種產品不符合客戶需求的狀況。通常會發生這種狀況最大的原因,就是因為資訊不流通,產品提供者無法得知需求者真正需要的是什麼。因此在生活中,如果人們需要一個東西,人們往往會到處去問人,去確認這項東西是否真的滿足自己的需求。甚至如果可以,會動手下去做出一個滿足自己需求的物品出來。畢竟,由使用者動手,做出來的東西最符合需求。也因此,民間開發者製作的網站,往往比政府製作的網站還要好用。
對於這些民間開發人員來說,他們只需要政府提供一個好用的資料查詢 API ,就像插頭一樣,讓開發者可以很快的得到需要的資料。至於這些資料要怎麼利用,相信人民和開發者會找到最有效率的用途。不過相信各位也很清楚,要政府理解並且改變,可能還需要兩三年,甚至更久的時間。
而台灣人等不下去了。
如果我們不動手,或許再也沒有人會動手了
所幸,有一群熱血的開發者站出來。g0v.tw 這個團體在 Yahoo hackday 的活動中,以政府預算的可視化網站(註10)得了獎,並且將獎金捐出來舉辦了一個 Open data 相關的 hackathon 開發活動(註11)。目前預計在活動上會有動作的專案,除了實價登錄網站以外,還包含了解析立法院會議記錄,國營事業預算監督, 空氣品質監測及氣象站資料等等不同的專案。這些開發者在工作上就常常與各種資料打交道,而現在,他們打算將政府的資料想方設法的處理成一般人也能理解的數字和文字。
但是這些開發者也需要幫忙。畢竟這些開發者習慣和電腦打交道,他們需要有人可以協助做一些文件處理,以及和政府機關的接觸和協調。而且,如果更多人參與,這些開發者做出來的成果將會更符合人們的需求。如果您有意願,可以到這個地方(https://hackpad.com/ul6fMthof2S)看看,或是參加這些開發者的活動,看看有什麼地方可以幫的上忙。套句自由軟體開發者最常說的一句話:「如果我們不動手,或許再也沒有人會動手了。」 您的任何一個行動,都可以幫助所有的台灣人更容易取得Thomas Jefferson所提到的「可以理解的資訊」。
希望台灣變得更好嗎?加入他們一起行動吧!