[問題] 網頁爬蟲 UTF-8無法解析
各位好
想請教一下各位,目前我正在爬一個Big5的網頁,爬回來後使用
.encode('big5', 'ignore').decode('utf-8', 'ignore') 將其轉碼
但是中文字的部分,全部顯示為亂數了,例如正常的名稱是
Dell E2216H 21.5吋 Monitor(3年到府保)
但轉換後變 Dell E2216H 21.5T Monitor(3~O) 這不知道甚麼東西.....
若是單純使用 .encode('utf-8', 'ignore')的話則會全部轉為字串值,但並不會解析成
中文字....
這會是我哪裡做錯了呢?懇請指點
https://i.imgur.com/yegep71.png
--
◢ ◣
● █≡◥◣ ◢ ◣
】 。 \。【 這個板需要更高竿的酸民
● //﹀\\● ◥ ◤
】 ╰═╯【 ◤
◢◥ ◤◣
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.146.2.131
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1525415808.A.7FF.html
推
05/04 14:51,
6年前
, 1F
05/04 14:51, 1F
推
05/04 15:23,
6年前
, 2F
05/04 15:23, 2F
Windows10(1709)EN / Python 3.6.3
→
05/04 15:25,
6年前
, 3F
05/04 15:25, 3F
→
05/04 15:26,
6年前
, 4F
05/04 15:26, 4F
因為我實在不解,為何會這樣...只好多方嘗試了 冏rz 爬了很多文章
推
05/04 15:29,
6年前
, 5F
05/04 15:29, 5F
→
05/04 15:29,
6年前
, 6F
05/04 15:29, 6F
真的正常了....冏rz 謝謝大神
※ 編輯: KeyBoardKill (122.146.2.131), 05/04/2018 15:36:16
推
05/04 17:41,
6年前
, 7F
05/04 17:41, 7F
推
05/06 07:17,
6年前
, 8F
05/06 07:17, 8F