[問題] google ocr api的辨識問題

看板Python作者 (有新信件還沒看)時間2年前 (2022/06/23 14:25), 編輯推噓1(101)
留言2則, 1人參與, 2年前最新討論串1/1
一直以來都有使用google cloud vision的api來幫我做圖片辨識 但是最近常會發生 段落亂跳的問題 讓我無法依據過去經驗擷取我要的文字 例如一本書的辨識 過去會一行一行辨識下來 標題 內文 頁碼 但是現在可能會由左至右 的方式 可能變成 標題 頁碼 (因為頁碼在最左邊) 內容 不曉得是不是有什麼參數可以去調整? 還是我必須將圖片的背景改成單一顏色,讓他不會亂區分段落? 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.163.220 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1655965537.A.100.html

06/24 01:02, 2年前 , 1F
辨識結果有附文字框座標 可以用 相對位置+正則表達式判
06/24 01:02, 1F

06/24 01:03, 2年前 , 2F
斷 來決定讀字的順序
06/24 01:03, 2F
文章代碼(AID): #1Yj0TX40 (Python)