Image processing 从照片中裁剪和OCR标签

Image processing 从照片中裁剪和OCR标签,image-processing,ocr,tesseract,Image Processing,Ocr,Tesseract,我需要OCR一些特定的信息从标签,其中大部分是已知的布局。数据的来源是照片,我知道这些照片可能很棘手。数据可以是条形码(简单)、短文本(大部分是已知的单词,在重复时可以随时间学习)和数字(设置格式和长度) 我做了一些研究,Tesseract似乎可以在多个平台上做我想做的事情,但我有几个问题 1) 如何仅裁剪相关标签。很久以前,我为一门大学课程做了一些非常基础的信号处理。我想这并不难。有什么好的图书馆吗 2) 因为我知道布局,有没有一种方法可以将每个特定部分的标签进行OCR 需要什么价值 3) 还

我需要OCR一些特定的信息从标签,其中大部分是已知的布局。数据的来源是照片,我知道这些照片可能很棘手。数据可以是条形码(简单)、短文本(大部分是已知的单词,在重复时可以随时间学习)和数字(设置格式和长度)

我做了一些研究,Tesseract似乎可以在多个平台上做我想做的事情,但我有几个问题

1) 如何仅裁剪相关标签。很久以前,我为一门大学课程做了一些非常基础的信号处理。我想这并不难。有什么好的图书馆吗

2) 因为我知道布局,有没有一种方法可以将每个特定部分的标签进行OCR 需要什么价值

3) 还有关于预处理图片的其他提示吗


4) Tesseract是这项工作的合适工具吗?

我以前没有处理过Tesseract。但是,我们使用另一个名为leadtools的第三方工具包。该工具包可以识别条形码、文本和数字,然后将结果保存为文档格式。它可以满足您的要求,因为它提供了围绕要识别的文本绘制特定区域的方法,并且它还提供了一些预处理图像的方法。
此外,它还提供了自动查找要进行OCR的文件中的区域的功能。有关更多信息,请检查此项

您应该提到leadtools不是免费的,或者如果您为他们工作,请披露