簡體   English   中英

從圖像中讀取文本時出現 Unicode 解碼錯誤

[英]Unicode Decode Error while reading text from image

我使用此代碼從圖像文件中讀取文本。 從圖像中讀取文本

代碼如下

from PIL import Image
from pytesseract import image_to_string

image = Image.open("image.jpg",'r')

myText = image_to_string(Image.open(open('maxresdefault.jpg')),config='-psm 10')
myText = image_to_string(Image.open(open('maxresdefault.jpg')))
print(myText)

錯誤:UnicodeDecodeError:“charmap”編解碼器無法解碼位置 278 中的字節 0x81:字符映射到

嘗試通過以下方式解決此錯誤: UnicodeDecodeError: 'charmap' codec can't decode byte X in position Y: character maps to <undefined>

然后得到錯誤:

UnicodeDecodeError: 'utf-8' 編解碼器無法解碼位置 0 中的字節 0xff:起始字節無效

根據Image文檔( help(Image.open) ),圖像文件必須以二進制模式打開:

open('maxresdefault.jpg', 'rb')

以二進制格式加載圖像。

更改以下代碼為我解決了問題。

import PIL.Image
pil_image = PIL.Image.open(image_path, "rb")

希望它有幫助!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM