[英]How to extract text from image using pytesseract in colab?
当我尝试在 colab 中使用 pytesseract 时出现此错误。
我不知道如何解决这个问题。 我还安装了pip install tesseract 。 但它不起作用。
有谁知道如何解决这个问题? 或者您还有其他 python 库 OCR 吗?
FileNotFoundError: [Errno 2] No such file or directory: 'tesseract': 'tesseract'
During handling of the above exception, another exception occurred:
TesseractNotFoundError Traceback (most recent call last)
/usr/local/lib/python3.7/dist-packages/pytesseract/pytesseract.py in run_tesseract(input_filename, output_filename_base, extension, lang, config, nice, timeout)
257 if e.errno != ENOENT:
258 raise e
--> 259 raise TesseractNotFoundError()
260
261 with timeout_manager(proc, timeout) as error_string:
TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.
这是我的代码。 我正在尝试检测号码。
import pytesseract
roi = img[ymin:ymax, xmin:xmax]
text = pytesseract.image_to_string(roi, lang='eng')
如果未安装 pytesseract,此代码将在colab中工作。
!sudo apt install tesseract-ocr
!pip install pytesseract
import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open('/path'))
print(text)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.