Автор | Сообщение |
zeppelin
Завсегдатай
Сообщения: 451
|
Существуют ли проги выделения текста из графических файлов
Почему такой вопрос?
Да вот есть охота из PDF , JPG , DJVU и пр графических файлов выделять только текст
Например есть у меня вход в сервиса - сосканенные , а хочу их в компактные - маленькие по объему - текстовые преобразовать - чтоб места мало занимали .
А то громадно - много всего есть у меня - пару Гиг занимает. Неудобно.
Потом на сайте разместил бы все компактно. |
|
!mpulse
|
Fine Reader под это дело заточен и многим известен… другого софта, способного решать эту проблему, не знаю... |
|
zeppelin
Завсегдатай
Сообщения: 451
|
Спасибо Дмитрий !
Бум искать! |
|
Alex Rozovsky
|
|
zeppelin
Завсегдатай
Сообщения: 451
|
Alex Rozovsky,
спасибо - порылся у себя в сусеках - нашел - сам не зная что такая прога есть.
Установил - разобрался чуть , но там еще освоить нужно - МОЩНАЯ вещь!
Там стоко примочек и режимов со словарями и тд - в общем потренироватся нужно.
Вот пока первый результат .
Был оригинал на 140 Кб в PDF - преобразовал Акробатом в читаемый Fine Reader - ом граф файл (он не видит PDF - возможно плагин нужен какой) - а потом "просеяв " фильтрами - получил Вордовский и Акробатный - в пять раз меньший . Но пока неудачно "просеял" - пропало много символов - что то там пропустил в настройках.
В общем - ПАШЕТ!
Вот пример - неудачный думаю - освоить надо лутше прогу. |
|
Alex Rozovsky
|
В моей ссылке есть pdf2bmp - преобразование pdf-файлов в формат bmp. То же умеет делать полный Акробат. |
|
zeppelin
Завсегдатай
Сообщения: 451
|
Alex Rozovsky,
Все правильно надо пользоватсяполным Adobe Aсrobat (не Reader ом) . Только в нем можно полностью оперировать файлы PDF . У меня лично Adobe Aсrobat - на втором месте после браузера - по использованию.
Можно резать страницы, объединять, выделить, преобразовать в различные форматы и тд.
А Fine Reader как оказалось наиболее его дополняет - чудеса прога делает. Оказалось "понимает" около 30 языковых
алфавитов ! и правит работая с личным словарем (надо еще потренироватся там куча опций всяких и настроек).
И оказалось распознает фото и тоже их лепит с правленным текстовым составом!.
Вот попробовал еще варианты его работы . |
|
Georg
Завсегдатай
Сообщения: 524
|
|
zeppelin
Завсегдатай
Сообщения: 451
|
georg,
Ту что у себя нарыл - 4.02 версия - древняя. Но с полным набором - около 60 М упакованная.
А новая - побольше будет.
Чем качать в Инете - поспрошу на рынке у продавцов прогобеспечения(пират) - найдут думаю. |
|
Georg
Завсегдатай
Сообщения: 524
|
zeppelin, Цитата: |
А новая - побольше будет.
| - да не особо-пакованная-85 чтоли,не помню,распакованная-170 кажеться,я до конца не поставил,так пробовал,пока хелпа не нарыл,что выше указал.Теперь буду ставить по уму
Если надо,можешь у меня слить,открою канал на максимум потоков. |
|
Alex Rozovsky
|
|
Georg
Завсегдатай
Сообщения: 524
|
Alex Rozovsky, Это откуда такая ссыла?Если с оффсайта-то не стоит качать-там чистый триал,а надо рейтал,хотябы. |
|
Alex Rozovsky
|
|
zeppelin
Завсегдатай
Сообщения: 451
|
Хочу попросить в сравнении (у кого есть FINE READER) - кому не лень и интересно
. С ссылки скачал новую - но неудачно - видать при скачке подпортился файл
и не распаковывается - ЕRROR. Надо заново попробовать скачать.
Пока старый вариант проги не удовлетворяет - слишком много "разрушений" от оригинала
получается. Интересно как получится на новой версии проги преобразования - распознавание .
тут PDF формат - оригинал вырезки. Язык - словенский (полный файл - весит 90М - вот есть интерес "переварить" его. Но то не суть важно - у меня сильно разрушаются нестандарные изображения - а с буквами все в порядке.
И еще вопрос - новая версия "видит " сразу непосредственно PDF файлы?
Или тоже надо сначала переваривать их?. |
|
ArGam
|
zeppelin, В Adobe Acrobat Reader 4.0 0318 есть встроенный распознаватель текста. И языков там то - же хватает ( у меня 8 стоит). Распознаёт хоть и дольше чем Fine Reader, но гораздо качественнее ( особенно схемы). Плохо только, что русского там нет. И со сканером работает напрямую. |
|
zeppelin
Завсегдатай
Сообщения: 451
|
ArGam,
ну это плагин какой-то - и он должен быть к другим версиям Акробатов .
У меня есть диск Адобика с плагинами - надо посмотреть в него - есть ли такое.
Спасибо за подсказку - а то зациклися на одном. |
|
zeppelin
Завсегдатай
Сообщения: 451
|
Ну вот - удалось нормально установить новую версию Fine Reader 7.0
следуя СТРОЖАЙШЕЙ последовательности по ссылкам от georg,
все проблемы с Adobe - отпали - в новой версии есть все что надо.
Очень умная и полезная прога. Рекомендую всем кто работает с сканнерами - снимая схемы или мануалы или инструкции. А также сами файлы переварить можно по всякому.
Спасибо georg, Alex Rozovsky, ArGam,
impulse, за участие в теме .
Кто еще захочет , помогу - подскажу как устанавливать - кто столкнется с проблемами.
Главное почитать строгие последовательности установки. |
|
Alex Rozovsky
|
zeppelin, по какой ссылке скачивал прогу, по моей? А то я скачал с того адреса, но не уверен, пойдёт ли,, а поставить недосуг. Да и сканера нет пока - друзья взяли на время. |
|
zeppelin
Завсегдатай
Сообщения: 451
|
Alex Rozovsky,
сначала по Рубордовской - а оказалось - это та-же что твоя - скачивай и смело по ссыле от georg,
строго следуй указкам Dimius. |
|
Alex Rozovsky
|
|