Оцифровка - распознование в PDF?

Strike
19/10/2011 23:54
Здравствуйте.
Возник вопрос.
Существуют-ли программы оцифровки изображений в документы PDF с возможностью распознавания-поиска текста , подобно "Fine Rider"-у.
Есть некоторые PDF схемы сохраненные в формате "картинки" или JPEG-JPG.
Интересует способ их оцифровки.
Например этот:

m.ix
20/10/2011 00:55
думаю что такого ПО не придамали
картинка будет картинкой а текст текстом

представим лишь строку
текст - часть картинки - текст 12pin I IRQ

часть картинки будет распознана как некий знак в данном случае как буква И

Или с картинки весь текст будет как собранная в строку мешура.

Sergej
20/10/2011 10:42
Strike, очень не уверен, что такое есть. Сам для подобных вырезок использую PDF Creator, легкий и неплохой вирт. принтер.
И то не уверен, что он сохраняет с возможностью поиска.

m.ix
20/10/2011 10:52
картинка-это картинка
после распознования - это набор абракадабры
текст в таблице на картинке - распознаётся как экселевская нормальная таблица

а поиск слов на картинке в PDF - занятие явно не для ПО а на сообразительность пользователя.
Да к стати
Встречаются довольно таки странные PDF
Вроде нормально родной док
Даже выделить можно
И поиск работает
Но в доке есть места где оно вроде и выделяется но не ищется и при этом не картинка.

Mikkey
20/10/2011 12:03
Так файнридером распозновай, а потом делай pdf, хоть тем же виртуальным принтером.

Strike
20/10/2011 12:16
Sergej, Mikkey, Попробую, спасибо.

Strike
20/10/2011 22:19
Файнридер действительно может сканировать различные документы и рисунки, распознавать и снова преобразовывать в различные форматы и PDF в.т.ч.
Однако качество оставляет желать лучшего..
В рисунках как в "Примере" значительные ошибки из-за линий касающихся букв., в итоге чать текста не распознается,( выделено )
Обучать редактировать - уйма времени, с неизвестным пока результатом, нужен более качественный источник.

.

m.ix
21/10/2011 01:28
нужен более качественный источник
===============
А это в любом OCR так дело обстоит.
Чем качественней исходник тем соответствующий станет результат.

liveinternet.ru RadioTOP Rambler's Top100 –ейтинг@Mail.ru