c# - 如何检测图像中的单词

Question

我需要找出用户单击的图像中的单词。到目前为止，我已经成功地对图像进行了 OCR。我的 c# 应用程序中有一个图片框控件。用户可以在任何文本周围绘制一个框并将其拖动到文本框以填充文本框。我已经完成了这个。但是现在我有一个新要求，说用户可以选择一个文本框，然后单击图像中的一个单词，以便将该单词填充到文本框中。

我不知道如何进行。如何从图像中单独剪切单词部分并将其提供给 OCR。用户可以点击单词的任何部分。

请给我任何指示。我应该遵循什么算法来找到用户点击的单词的边界。如果我找到了边界，我可以使用 copyfromscreen 方法从图像中剪切它，并将其提供给 ocr 引擎以获取文本。

希望我在这里澄清了我的问题。

谢谢和问候，迪内什。

score 2 · Accepted Answer

如果你有 OCR 工作，我最初的方法是尝试以初始点击点为中心的某种搜索。

IE。在用户单击的位置周围制作一个小框，OCR，如果所有噪音，制作一个更大的框，OCR，重复直到 OCR 导致命中。

score 1 · Accepted Answer

如果您有 OCR 数据，则取决于 OCR 库，您可能能够执行反向查找并确定指定像素坐标处的字符。我使用过的 OCR 库为每个字符提供矩形坐标，而这些坐标又可以组合成单词（组合矩形）。那么问题就是确定点击发生在哪个矩形内。

c# - 如何检测图像中的单词

2 回答 2

Related

Reference