СУЩЕСТВУЮТ ! проги выделения текста из графических файлов | |||||||
---|---|---|---|---|---|---|---|
zeppelin 03/01/2004 00:08 |
Существуют ли проги выделения текста из графических файлов
Почему такой вопрос? Да вот есть охота из PDF , JPG , DJVU и пр графических файлов выделять только текст Например есть у меня вход в сервиса - сосканенные , а хочу их в компактные - маленькие по объему - текстовые преобразовать - чтоб места мало занимали . А то громадно - много всего есть у меня - пару Гиг занимает. Неудобно. Потом на сайте разместил бы все компактно. |
||||||
!mpulse 03/01/2004 00:16 |
Fine Reader под это дело заточен и многим известен… другого софта, способного решать эту проблему, не знаю... |
||||||
zeppelin 03/01/2004 00:22 |
Спасибо Дмитрий !
Бум искать! |
||||||
Alex Rozovsky 03/01/2004 02:18 |
zeppelin, практически любой сканер комплектуется диском с программой распознавания текста - OCR. Правда, далеко не все они "понимают" по-русски. Fine Reader - хорошая прога.
Посмотри, например, тут: ftp://ftp.comintour.ru/pub/windows/fr/FR6Pro/program%20files/ABBYY%20FineReader%206.0/ |
||||||
zeppelin 03/01/2004 03:36 |
Alex Rozovsky,
спасибо - порылся у себя в сусеках - нашел - сам не зная что такая прога есть. Установил - разобрался чуть , но там еще освоить нужно - МОЩНАЯ вещь! Там стоко примочек и режимов со словарями и тд - в общем потренироватся нужно. Вот пока первый результат . Был оригинал на 140 Кб в PDF - преобразовал Акробатом в читаемый Fine Reader - ом граф файл (он не видит PDF - возможно плагин нужен какой) - а потом "просеяв " фильтрами - получил Вордовский и Акробатный - в пять раз меньший . Но пока неудачно "просеял" - пропало много символов - что то там пропустил в настройках. В общем - ПАШЕТ! Вот пример - неудачный думаю - освоить надо лутше прогу. |
||||||
Alex Rozovsky 03/01/2004 10:14 |
В моей ссылке есть pdf2bmp - преобразование pdf-файлов в формат bmp. То же умеет делать полный Акробат. |
||||||
zeppelin 03/01/2004 13:13 |
Alex Rozovsky,
Все правильно надо пользоватсяполным Adobe Aсrobat (не Reader ом) . Только в нем можно полностью оперировать файлы PDF . У меня лично Adobe Aсrobat - на втором месте после браузера - по использованию. Можно резать страницы, объединять, выделить, преобразовать в различные форматы и тд. А Fine Reader как оказалось наиболее его дополняет - чудеса прога делает. Оказалось "понимает" около 30 языковых алфавитов ! и правит работая с личным словарем (надо еще потренироватся там куча опций всяких и настроек). И оказалось распознает фото и тоже их лепит с правленным текстовым составом!. Вот попробовал еще варианты его работы . |
||||||
Georg 03/01/2004 18:56 |
zeppelin, Есть уже 7 версия,но о том как её ставить-читай внимательно тут-
http://forum.ru-board.com/topic.cgi?forum=35&topic=15097&start=0 (надо будет зарегиться-там в гости не ходят как у нас во флейме ) Особое внимание этому- ПОШАГОВАЯ ИНСТРУКЦИЯ ПО УСТАНОВКЕ FINEREADER 7.0.0.522 P#3623 ROFESSIONAL от Dimius |
||||||
zeppelin 03/01/2004 23:08 |
georg,
Ту что у себя нарыл - 4.02 версия - древняя. Но с полным набором - около 60 М упакованная. А новая - побольше будет. Чем качать в Инете - поспрошу на рынке у продавцов прогобеспечения(пират) - найдут думаю. |
||||||
Georg 03/01/2004 23:19 |
zeppelin,
Если надо,можешь у меня слить,открою канал на максимум потоков. |
||||||
Alex Rozovsky 03/01/2004 23:20 |
а взять её - тут: http://fr7.abbyy.com/fr70pro/FR703965.exe (весит 40 м) |
||||||
Georg 04/01/2004 04:57 |
Alex Rozovsky, Это откуда такая ссыла?Если с оффсайта-то не стоит качать-там чистый триал,а надо рейтал,хотябы. |
||||||
Alex Rozovsky 04/01/2004 08:50 |
georg, ссылка с http://forum.ru-board.com/topic.cgi?forum=35&topic=15097&start=1020 |
||||||
zeppelin 05/01/2004 13:15 |
Хочу попросить в сравнении (у кого есть FINE READER) - кому не лень и интересно
. С ссылки скачал новую - но неудачно - видать при скачке подпортился файл и не распаковывается - ЕRROR. Надо заново попробовать скачать. Пока старый вариант проги не удовлетворяет - слишком много "разрушений" от оригинала получается. Интересно как получится на новой версии проги преобразования - распознавание . тут PDF формат - оригинал вырезки. Язык - словенский (полный файл - весит 90М - вот есть интерес "переварить" его. Но то не суть важно - у меня сильно разрушаются нестандарные изображения - а с буквами все в порядке. И еще вопрос - новая версия "видит " сразу непосредственно PDF файлы? Или тоже надо сначала переваривать их?. |
||||||
Anonymous 06/01/2004 05:25 |
zeppelin, В Adobe Acrobat Reader 4.0 0318 есть встроенный распознаватель текста. И языков там то - же хватает ( у меня 8 стоит). Распознаёт хоть и дольше чем Fine Reader, но гораздо качественнее ( особенно схемы). Плохо только, что русского там нет. И со сканером работает напрямую. |
||||||
zeppelin 06/01/2004 13:30 |
ArGam,
ну это плагин какой-то - и он должен быть к другим версиям Акробатов . У меня есть диск Адобика с плагинами - надо посмотреть в него - есть ли такое. Спасибо за подсказку - а то зациклися на одном. |
||||||
zeppelin 07/01/2004 14:54 |
Ну вот - удалось нормально установить новую версию Fine Reader 7.0
следуя СТРОЖАЙШЕЙ последовательности по ссылкам от georg, все проблемы с Adobe - отпали - в новой версии есть все что надо. Очень умная и полезная прога. Рекомендую всем кто работает с сканнерами - снимая схемы или мануалы или инструкции. А также сами файлы переварить можно по всякому. Спасибо georg, Alex Rozovsky, ArGam, impulse, за участие в теме . Кто еще захочет , помогу - подскажу как устанавливать - кто столкнется с проблемами. Главное почитать строгие последовательности установки. |
||||||
Alex Rozovsky 08/01/2004 16:00 |
zeppelin, по какой ссылке скачивал прогу, по моей? А то я скачал с того адреса, но не уверен, пойдёт ли,, а поставить недосуг. Да и сканера нет пока - друзья взяли на время. |
||||||
zeppelin 09/01/2004 10:15 |
Alex Rozovsky,
сначала по Рубордовской - а оказалось - это та-же что твоя - скачивай и смело по ссыле от georg, строго следуй указкам Dimius. |
||||||
Alex Rozovsky 09/01/2004 11:17 |
zeppelin, спасибо. |
||||||
Светослав 09/01/2004 11:58 |
Вот что сегодня лежит на wzor.net tmp/tmp для свободного скачивания:
ScanSoft OmniPage Pro 14 Office - система оптического распознавания документов. ScanSoft OmniPage Professional 14 Office - мгновенно преобразует документы на бумажных носителях и в формате PDF к виду, удобному для редактирования, обеспечивает в большей степе-ни, чем когда-либо прежде, экономию времени и повышение производительности труда пользова-теля. Объединяя три мощных модуля оптического распознавания текста (OCR - Optical Character Recognition), программа OmniPage осуществляет чрезвычайно точное преобразование докумен-тов в форматы самых популярных текстовых процессоров и электронных таблиц (MS Word, Excel, WordPerfect). С помощью передовых средств работы с PDF - файлами после распознавания текста делается следующий шаг: PDF-документы без труда превращаются в файлы привычных для вас программ или бумажные документы преобразуются в поддерживающие поиск PDF-архивы. Основные преимущества OmniPage Pro 14 Office: - Непрерывная и автоматическая обработка документов и целых папок. - Возможность сетевой установки. - Взаимодействие с корпоративными системами управления документами (ODMA-совместимыми). - Вывод в формате XML, PDF обеспечивающий интеграцию данных с другими приложениями. - Вывод в формате e-Book's, позволяющий читать распознанный текст на устройствах, использующих этот формат. - Открытый OLE-интерфейс, обеспечивающий интеграцию программного обеспечения с другими приложениями. P.S Данный программный продукт является прямым конкурентом ABBYY FineReader 7.0 Corporate Edition, сранивайте, выбирайте! |
||||||
Dragoff 25/08/2004 11:04 |
текст бридж,обычно идет с дровами к сканеру |
||||||
Frosia 29/09/2004 09:16 |
Прошу помощи А то я установила, активизировала FR7.0.0.620(P#3961), попыталась сохранить в Word русский текст, а он сохранил и вместо текста кубики рисует |
||||||
coeng 29/09/2004 11:02 |
!mpulse, интересная картинка. ты как-нибудь связан с Elcoteq ? |
||||||
Frosia 29/09/2004 11:54 |
ты к кому обращаешься? Добавлено 29-09-2004 13:01
Что то не то написала... Кто нибудь может помочь?????
|
||||||
coeng 29/09/2004 14:57 |
у Impulse на картинке : "Your iSP is elcoteq.fi" . вот я и интересовался, так как имею отношение к elcoteq.ee |
||||||
scooters 29/09/2004 18:58 |
ABBYY FineReader прога во всем просто класс, но вопрос заключается в том, что я читал справку по нему, объясняется так, что программа сканирует со сканера или из файла и конвертирует в текстовые форматы (сохраняя вид документа) которые, как известно, занимают мало места, но почему то у меня этого не получилось. Так, чтоб я видел отсканированный документ, а после (ABBYY FineReader) видел документ с выделенными картинками, и отдельно текстом, для редактирования нект. То есть получается так, после того как через программу ABBYY FineReader прошло разпознование все ломается (текст отдельно, картинки тоже и о сохранение вида, речи нет.) У меня по этой программе плюс в том, что я отсканировал 2 справочника Up-To-Date,World`s,Transistors-Diodes-Thyristors & IC`s,Comparison Tables 1...60000 и A…Z по радиоэлектронным компонентам который в картинках занимал 420Мб, а после конвертации в EXCEL стал занимать 12Мб |
||||||
max2002 07/10/2004 13:15 |
"....А то я установила, активизировала FR7.0.0.620(P#3961), попыталась сохранить в Word русский текст, а он сохранил и вместо текста кубики рисует "
Frosia, у тебя с кодировками бяка какая-то. Зайди в сервис/Опции/Форматирование, может у тебя там шрифт какой-то без кириллицы выбран. scooters, сохранится ли вид документа, зависит от того в каком формате ты его сохраняешь. Например, при сохранении в текстовом файле о картинках и таблицах речи не идёт. Опять же если ты при распознавании всё отдаёшь на откуп проге, то хороший результат можно получить лишь при идеальном качестве исходного документа. Именно для того чтоб помочь проге разобраться где буквы, а где рисунки, предусмотрены 4 вида блоков для зон распознавания. Если предстоит обработать большой документ, то есть смысл поэкспериментировать на 1-2 характерных страницах и выработать оптимальный компромисс. Для начала попробуй явно указать ему текстовые и графические блоки, а результат сохрани в PDF. Что-то похожее на исходник должно получиться. |
||||||
Zykin 08/10/2004 01:17 |
"....А то я установила, активизировала FR7.0.0.620(P#3961), попыталась сохранить в Word русский текст, а он сохранил и вместо текста кубики рисует "
Frosia, у тебя с кодировками бяка какая-то. Зайди в сервис/Опции/Форматирование, может у тебя там шрифт какой-то без кириллицы выбран. Это проблема не кодировки,а некорректной активации.Используй корректный кейген...Или возьми здесь Retail-версию- ftp://camelot-inc.org.ru/format/FORMAT_FineReader%207.0.rar |
||||||
Anonymous 04/12/2004 11:25 |
Zykin, подскажи пожалуйста рабочую ссылочку на корректный кейген! У меня такая же история, что и у Frosi, версия FR7.0.0.620(P#3965), скачанная по ссылке Alex Rozovsky . Напиши если не трудно на C уважением Diros. |
||||||
Anonymous 04/12/2004 19:45 |
помогите пожалуйста....
чё млин делать...... установил F.R. 7.0... сканирую текст с фотграфий.... распознаёт отлично.... но одна проблема.. не могу сохранить!!!! если копирую в буфер , а потом вставляю - пишет "The current version does not support copying Cyrillic text to the Clipboard." ........ если сохраняю в формате doc или txt, то когда открываю, остаются только цифры..... без текста... по моему у меня такая же проблема что и выше !!!!!! только у меня вместо квадратиков ваще ничего нет ! |
||||||
Anonymous 20/02/2005 17:27 |
Nujno aktiwirowat F.R., w protiwnom sluchae poluchatsia to, chto u tebia seychas. T.E tekst ne kopieruentsia i ne raspechatiwaetsia |
||||||
SEERR72 12/09/2009 10:51 |
Где можно скачать такую прогу |
||||||
C1-65A 12/09/2009 12:34 |
|
||||||
m.ix 12/09/2009 12:43 |
SEERR72, Да поможет тебе поиск от Гугля. |