разделение таблицы в изображении на строки пробелами с помощью приложений компьютерного зрения

Я пытаюсь решить то, что я понял, является довольно трудной проблемой для решения из-за моего отсутствия опыта в этой области. Предположим, у меня есть изображение таблицы с 3 строками и 5 столбцами. Каждая строка содержит текст (допустим, пока только английский) или цифры (обычные Индо-арабские цифры). Нет ничего, кроме пробелов между столбцами и между каждой строкой. Теперь, предполагая, что все строки и все столбцы выровнены, моя задача состояла бы в том, чтобы получить алгоритм для распознавания и извлечения каждой строки из документа (не знаю, достаточно ли хорошо я это формулирую).

Может ли кто-то предложить хорошую отправную точку (библиотека , подобный пример , глава учебника, которая имеет дело с чем-то подобным) и т. д.. для меня, чтобы начать.

Мой опыт-наука о данных, но я просто никогда не подвергался компьютерному зрению.

Любая помощь будет оценена.

1 ответ

  1. Вы должны начать с OpenCV, как предложил Racialz. Этот инструмент содержит метод преобразования Hough lines/Hough, который должен быть основным и самым простым способом для вас, чтобы найти и обрезать текст из разделов таблицы. Существует много различных задач для линий, для которых люди используют этот алгоритм (например, тот или иной), но с вашей задачей это было бы намного проще, потому что линии должны быть намного яснее и проще, чем в этих примерах. После того как вы сделаете ваше извлечение, вам после этого будет нужно просмотреть ваш текст, для этого я предложил бы вам использовать tesseract ocr engine. Этот движок является бесплатным, очень простым в использовании, он обеспечивает довольно приличные результаты и позволяет обучать его сканировать определенные типы букв.