生成式人工智慧導論
稿紙校正、裁切
賴秋彤-林家弘-曾詠暄
國立臺北科技大學資訊工程系
1
目錄
2
目錄
P.3
紙本切割流程介紹
01.a
4
紙本-旋轉校正及切割
P.5
旋轉校正
裁切
流程及成果如下:
s1_rotate_page.py
s2_crop.py
紙本流程
P.6
1.專案下載
2.建立虛擬環境
3.旋轉校正
4.裁切
旋轉校正-目標
P.7
(以利裁切)
電子檔(PDF)切割流程介紹
01.b
8
切割
P.9
轉檔校正
裁切
s1_pdf2png.py
s2_crop.py
png
流程
P.10
1.專案下載
2.建立虛擬環境
3.轉檔
4.裁切
專案下載
02
11
專案下載
P.12
點擊code
專案下載
P.13
下載壓縮檔
建立虛擬環境
03
14
建立虛擬環境
P.15
建立虛擬環境
P.16
P.17
建立虛擬環境
2
3
1. 在下載中找到.exe
建立虛擬環境
P.18
1.
2.
建立虛擬環境
P.19
建立虛擬環境 : conda create --name fontenv python=3.8
conda create --name fontenv python=3.8
建立虛擬環境
P.20
建立虛擬環境 : conda create --name fontenv python=3.8
輸入 y (y即yes)
成功
conda create --name fontenv python=3.8
建立虛擬環境
P.21
啟用虛擬環境:
啟用 fontenv 環境
conda activate fontenv
建立虛擬環境
P.22
移動至下載的專案資料夾
cd 02-1_crop_paper的路徑
建立虛擬環境
P.23
2. 使用下列指令安裝所需套件:
若使用電子檔書寫,請由下列指令額外手動下載套件
pip install -r requirements.txt
pip install pdf2image
conda install -c conda-forge poppler
旋轉校正-紙本
04.a
24
旋轉校正稿紙
P.25
1. 資料準備:
{學號}_{稿紙標題} \ 每一張掃描檔檔名.jpg (以114598033為例)
以{學號}_{稿紙標題}命名的文件夾
旋轉校正稿紙
P.26
副檔名為 .jpg !
旋轉校正稿紙
P.27
python s1_rotate_page.py
cd …
確認目前環境以及路徑!
python –name {資料夾名稱} s1_rotate_page.py
旋轉校正稿紙
P.28
成功執行後,檔案存於 rotated_{原始檔名} 的資料夾中
旋轉校正稿紙
P.29
檢查旋轉後檔案數量
轉檔校正-電子檔(pdf)
使用pdf2image轉檔
04.b-1
30
稿紙pdf轉換png檔
P.31
資料準備
以 {學號}_{姓名}_{稿紙名稱} 命名的pdf
稿紙pdf轉換png檔
P.32
1. 前面環境建置時,有安裝 poppler,請至檔案總管找出 poppler 的安裝位置,將路徑寫入 s1_pdf2png.py 程式碼中
(註:因為該套件的位置不會被自動抓取,需要手動設定位置)
基本上應該會在這個地方
稿紙pdf轉換png檔
P.33
執行
python s1_pdf2png.py
根據需求輸入:
稿紙pdf轉換png檔
P.34
如何取得路徑?
如果沒看到複製路徑
旋轉校正稿紙
P.35
成功後會有稿紙轉換成png的檔案
轉檔校正-電子檔(pdf)
使用batch file轉檔
04.b-2
36
pdf2png.bat
P.37
轉檔中......
pdf2png.bat
P.38
4. 轉檔成功
可以一次轉多份稿紙
pdf2png.bat 執行失敗解決方法
P.39
操作步驟:
set "POPPLER_BIN=C:\Users\LAB1223\anaconda3\envs\fontenv\Library\bin\pdftoppm.exe"
切割稿紙
05
40
取得CP950
P.41
切割校正稿紙
P.42
切割校正稿紙-稿紙字數統計
P.43
稿紙內容 | 字數統計 |
1. 千字文 | 1000 |
2. 長恨歌 | 840 |
3. 洛神賦 | 912 |
4. 詩經 | 435 |
5. 部首、注音、日文 | 528 |
6. 英文、數字 | 346 |
7. 標點符號 | 356 |
8. 姓氏名字號 | 78 |
切割校正稿紙
P.44
執行裁切程式
需輸入開始切割頁面以及結束頁
python s2_crop_page.py
切割校正稿紙
P.45
參數調整
切割校正稿紙-紙本
P.46
紙本寫字若在切割的時候有缺字,可以將0.12調低至0.1或者0.09之類去做嘗試,因右下角的qrcode位置會因你掃描的機器有所變動,0.12有可能太大會擋住最右下角兩格的偵測。
切割校正稿紙
P.47
切割成功後會產生兩個資料夾: crop 以及 rec_bound
切割校正稿紙
P.48
crop : 切割後的圖片檔
rec_bound: 程式執行時內縮並裁取的範圍
(參考用)
切割校正稿紙
P.49
crop : 切割後的圖片檔
rec_bound: 程式執行時內縮並裁取的範圍
(參考用)
聯絡資訊
06
50
助教聯絡資訊
P.51