D4SG不當黨產處理委員會
專案期末報告
2022/07/23
提案單位: 不當黨產處理委員會
黨產會團隊:林聰賢 呂思翰 王惟聖 廖健凱 廖斯泙
資料英雄團隊:陳潔寧 簡毅慧 李俊穎 蘇彥庭 江泓德
1
專案團隊介紹
2
黨產會團隊
3
林聰賢
專任委員
呂思翰
副研究員
王惟聖
助理秘書
廖健凱
副研究員
廖斯泙
副研究員
資料英雄團隊
4
蘇彥庭
化工業
資料科學家
陳潔寧
資料英雄計畫
資料科學家
江泓德
智庫驅動
資料科學家
簡毅慧
中央通訊社
數位編輯
李俊穎
中央研究院
社會學研究所
研究助理
專案問題說明
5
6
7
8
9
黨產會問題
10
專案解決目標
11
對外呈現: 黨產會成果呈現方式優化
12
對外:閱讀體驗優化
13
報告格式、論述需正式嚴謹
歷史文獻用字艱澀
➔ 民眾較難吸收資訊、理解黨產會工作成果
網頁DEMO
14
15
在調查報告中提取特定主題內容
(掌握資訊份量,避免主題發散)
2. 呈現資訊架構
16
目錄:讓讀者預知內容,掌握閱讀進度
3. 資料視覺化/互動圖表
17
展示數據Insight,也讓讀者可探索單筆資料
4. 資訊摘要、轉譯
18
擷取重要資訊與吸引人的故事,
並將法律/會計/政治術語轉為白話文
5. 素材加工、增加曝光
19
充分利用既有的影音、圖像素材
目標:呈現友善、簡潔的知識視窗
20
優化策略 | 目標 |
聚焦特定切點 | 掌握資訊份量,避免主題發散 |
呈現資訊架構 | 讓讀者預知內容,隨時控制閱讀進度 |
資料視覺化/ 互動圖表 | 讓讀者一眼看出Insight,也可以逐一探索單筆資料 |
資訊摘要、轉譯 | 擷取重要資訊與吸引人的故事, 並將法律/會計/政治術語轉為白話文 |
素材加工 | |
內部研究: 歷史文件搜索優化系統
21
建立專屬黨產會的文字探勘分析流程
以CKIP Tagger模型�進行斷詞與實體辨識
自定義字典
人/組織網絡關係圖
文章推薦
研究員經驗
22
史料文章�黨產會官網-史料故事298篇文章
不當黨產相關史料自定義字典設計
23
自定義詞 | 同義詞 | 實體類別 |
中央電影 | 中影 | org |
中央電影公司 | 中影 | org |
中央電影事業公司 | 中影 | org |
中國青年反共救國團 | 救國團 | org |
中國青年反共救國團總團部 | 救國團 | org |
中國青年救國團 | 救國團 | org |
蔣主任經國 | 蔣經國 | person |
蔣委員經國 | 蔣經國 | person |
搜尋文章與文章推薦作法
24
| 婦聯會 | 軍友社 | 中央委員會 | … |
doc1 | 0 | 0 | 0 | |
doc2 | 0 | 1 | 0 | |
doc3 | 1 | 1 | 0 | |
… | | | | |
社會網絡基本元素與加權方式
25
網絡關係圖作法
26
成果Demo
27
專案程式碼
建議與未來展望
28
Thank you for your attention
29