标签[image-recognition] - 堆栈内存溢出

Object 检测还是图像分类？训练 model 识别扑克牌 - Object detection or image classification? Training a model to recognize playing cards

我最近一直在试验 object 检测，使用 Faster R-CNN 和 YOLOv7 在预先存在的数据集上训练模型。使用UNO 卡片数据集，我根据左上角的符号非常准确地检测到 UNO 卡片的类型。我使用了 object 检测方法，UNO 卡仅被分为 14 类。基于此，我想知道增强 model ...

Pytesseract 没有给出预期的结果 - Pytesseract not giving excpected resaults

将 pytesseract 用于图像到文本以及一些基本的图像增强，问题是我得到了非常奇怪的结果。皮顿这是 image3.png，这是我在控制台中打印的“Nam 65 can gala” image3.png ...

| ValueError：“顺序”层的输入 0 与该层不兼容：预期形状 =(None, 28, 28)，找到的形状 =(None, 28, 3) - | ValueError: Input 0 of layer "sequential" is incompatible with the layer: expected shape=(None, 28, 28), found shape=(None, 28, 3)

当我尝试使用新图像运行此代码时，我总是出错。我希望模型用新图像做出新的预测，但总是出现比例错误。我的错误是： ` ` ValueError：“顺序”层的输入 0 与该层不兼容：预期形状 =(None, 28, 28)，找到的形状 =(None, 28, 3) ...

使用 OpenCV 识别黑白图像 - Recognizing black and white images with OpenCV

我有这组图像：最左边的是参考图像。我想要一个值，告诉我其他图像与最左边的图像有多接近。我尝试了 matchShapes()，为每个轮廓调用它并对值进行平均，但我没有得到有用的结果（例如，最右边的值太高）我还希望匹配只在正确的方向上工作。 ...

如何将多边形坐标转换为矩形（yolo 格式）以进行图像标记？ - How to convert polygon coordinates to rectangle(yolo format) for an image labelling?

我正在尝试通过 OCR 读取水表读数，但是，我的第一步是找到投资回报率。我从 Kaggle 中找到了一个带有 ROI 标记数据的数据集。但它们不是矩形，而是多边形，有的有 5 个点，有的有 8 个点，具体取决于图像。我如何将其转换为 yolo 格式？例如： file name | valu ...

如何在网站截图上查找徽标 - How to find logos on a website screenshot

我正在寻找一种方法来检查给定的徽标是否出现在网页的屏幕截图上。所以基本上，我需要能够在可能包含也可能不包含较小图像的较大图像上找到较小的预定义图像。一个匹配可能是不同的规模，有点不同 colors。我也需要判断出现相似性。需要一些关于要看什么的指示，我以前从未使用过计算机视觉。 ...

如何让 pyTesseract 只从图像中获取数字 - How do I get pyTesseract to only get numbers from an image

我一直在尝试制作一个数独求解器，以 png 形式输入数独游戏。我试图将图像中的数字转换为数字，以便我可以将它们放在列表中并在之后实现算法。然而，pyTesseract 无法清楚地找到图像中的数字并给出不可靠的读数，即使数字看起来很清晰并且图像是计算机生成的。我怎样才能强制 pyTesserac ...

如何提取或获取Detectron边界图像 - How to extract or get the image bounded by Detectron

我正在Detection的帮助下使用我自己创建的训练数据集在图像上创建边界框，而我现在停留在提取边界图像的部分。我只想要边界框内部分的图像。要预测的输入图像。具有边界框轮廓的预测图像。请帮我解决这个问题。结果图像应该是这样的。 ...

检测/分割填充阴影的矩形 OpenCV - Detect/Segment hatch-filled rectangles OpenCV

问题我需要检测巨大图像上的阴影填充矩形。还有其他线路和 forms 连接到填充阴影的矩形。我想要的 output 就像图像右侧的黑色表格一样。所有其他 forms（不是阴影填充的矩形）都将被忽略，并且不在 output 中。我尝试了什么：通过使用 Hough 变换并计算检测到的线的角度 ...

是否可以训练 TensorFlow 图像分类？ - Is it possible to train TensorFlow Image classification?

我想知道是否可以用我自己的图像在 android 工作室中训练 TensorFlow 图像分类，所以它会识别它们。如果是，怎么办？谢谢。 ...

我如何使用 Pyautogui 在屏幕上定位 function 仅在一个应用程序中 window 而不是整个屏幕 - how do i use Pyautogui locate on screen function within only one application window instead of the whole screen

我试图找到一种方法来让我的自动化机器人更快我意识到通过仅在应用程序 window 而不是整个屏幕中搜索会给它一个速度帖子我该怎么做 ...

如何提高我的 cnn 训练的 model 的性能 - How to improve perfomance on my cnn trained model

我的问题听起来很抽象，但我在其他讨论中找不到我的问题的解决方案。我已经创建了自己的图片数据集 (128*128)，以拥有一个识别限速标志的 cnn model。所以我拍了大约 2000 张照片，大约分为 8 类。所以每个标志我有大约 200 张或更多的图片。我已经测试了不同的模型，简单的，困 ...

沿图像传递参数以进行图像识别 - Pass parameters along image for Image Recognition

我处于需要使用图像识别解决方案 label 给定图像的情况，然后根据另一个参数浏览结果。例如，我可能会传递某个城市的市政厅的照片，算法会返回标识可能的市政厅的标签，例如“博洛尼亚市政厅”、“摩德纳市政厅”、ecc...，以及然后，基于另一个参数，位置，它会给我正确的 label，就像参数是`Mod ...

Python LocateOnScreen 无法在全屏模式下工作 - Python LocateOnScreen not working in fullscreen

嘿伙计们，我是 python 的新手，我花了大约 30 个小时试图弄清楚如何解决这个问题。抱歉，这太长了，我试图提供尽可能多的关于我已经尝试过的信息。我正在使用 pyautogui locateOnScreen() 在全屏游戏中寻找在我站立角色范围内行走的猫。问题是当我有 shell 或命令提 ...

是否有正确的方法以编程方式防止短暂的错误识别（在 object 检测应用程序中）触发操作？ - Is there a right way to programmatically prevent a brief wrong recognition (in object detection app) to trigger an action?

赏金将在 7 天后到期。此问题的答案有资格获得+50声望赏金。 Larvouu希望引起对这个问题的更多关注。语境我正在构建一个应用程序，它通过设备的摄像头模块执行实时 object 检测。渲染如下图。假设我尝试识别一个苹果，大多数情况下应用程序会识别一个苹果。但是，有时，应用程序会在 ...

如何将图像与图像文件夹进行比较（然后在它们相似 50% 时做某事） - how to compare an image with a folder of images ( then do a certain thing when they are 50% alike or something )

所以我想知道是否有类似的东西pyautogui.locateOnScreen('picuture.jpg',confidence=x) 我目前正在尝试比较文件夹中的图片，但 pyautogui 仅适用于“onScreen”图像。我不想检查图片是否 1:1 相同，但如果它们相似，使用 pyauto ...

python 识别数字绘图 - python recognize a drawing in numbers

我有一个生成的程序像这样的数字，我需要识别这个数字。 python 中是否有自动执行此操作的 function？ ...

带有 react-native 和 expo 的 OCR - OCR with react-native and expo

我有一个即将推出的项目来构建一个执行 OCR 的应用程序，我想问一下是否有使用 react-native 和 expo 来做 ocr 的项目，因为 react-native 是我首选的框架，而 expo 让它变得非常简单。 ...

Python OpenCv 解析进度条 - Python OpenCv parse progress bar

UPD：添加了工作 MWE。我正在尝试解析游戏中的 HP 数量。我知道图像的宽度并只获得 HP 条填充部分的宽度的想法。然后只是计算它。以前它运行良好。但是最近游戏有了一些更新，颜色也发生了变化。我知道。只是一种颜色。这是我完全工作的 MWE 代码：您可以尝试使用帖子末尾附加 ...

Pytesseract 对手写字母不正确 - Pytesseract works incorrect with handwritten letters

我必须识别手写字母及其坐标，例如这张图片。我试图用 pytesseract 做到这一点，但它只能识别打印的文本并且对我的图像不正确。没时间自己写神经网络，想用一个现成的方案作为pytesseract。我知道它可以做到这一点，但这段代码工作不正常。此代码返回错误答案。我究竟做错了 ...