1 iš 9

實價登錄資料公開之系統架構建議

2012/11/8

2 iš 9

大原則

  • 合法範圍內
  • 對承辦人員與廠商最小的負擔
  • 盡可能運用現有的程式

  • 可長可久, 程式自動運作, 無須人力介入
  • 機器人方便抓取
    • 無驗證碼, 位置與檔名可預測
  • 提供每月 diff 與 勘誤

  • 希望在 11/16 之前, 使用 10/16 的資料演練一次開放的流程

3 iš 9

資料輸出點

Internal

Database

實價登錄查詢資料庫

web

server

web

server

web

server

fire

wall

1. 定期更新

2. 資料庫輸出

3. JSON? CSV? HTML?

累積至本月所有資料

4 iš 9

資料處理程序

累積至本月所有資料

累積至上月可公開資料

diff

累積至本月可公開資料

N11_20yymm_rev1_diff.zip

N11_20yymm_rev1_all.zip

壓縮

過濾欄位

5 iš 9

那些資料要公開

  • 目標
    • 房屋
    • 租賃
    • 預售屋

  • 交易明細的內容
    • 已過濾, 無隱私, 可公開的部份
    • 與內政部網站揭露的程度一樣

  • 資料庫的 primary key: case_no ? case_seq?

6 iš 9

檔案格式與編碼:

  • utf-8
  • CSV/XML/SQL

7 iš 9

資料壓縮包

  • 強制登錄後至今累積之所有的資料
  • 每個月與上個月的 diff (包含勘誤)
    • - 349123,台北市吳興街5~50號, ...
    • + 349123,台北市吳興街1~50號, ...

  • 勘誤資料如何表示?
    • Add: new case_no record
    • Modify: case_no with new data
    • Delete: case_no with empty data

8 iš 9

如何發佈這些資料

  • 每月16日 (遇假期延後) ?
  • 資料夾連結放在首頁
  • 無需驗證碼.
  • 每分鐘只能下載一次
    • 否則擋一個小時
  • 檔名格式:
  • N11_20yymm_rev01_all.zip
  • N11_20yymm_rev01_diff.zip
  • Checksum (SHA-256)

9 iš 9

其它

  • 資料來源宣告
    • 內政部地政司-不動產交易實價查詢服務網
  • 如何 link back 到內政部的官方資料?
  • 如何回報問題資料回內政部?
    • 0坪, 0.02坪, 車位與房子分開兩筆總價一樣.
    • 我們的資料錯誤回報表格