Автор | Сообщение |
elektronik 41
Завсегдатай
Сообщения: 504
|
помогите создать документ Microsoft Word из сканированного изображения проблема в том что неправильно распознает текст и выдает с ошибками надо сканированный текстовый документ надо изменить |
|
m.ix
Master Mixa
Сообщения: 1972+
|
elektronik 41 писал: | из сканированного изображения проблема в том что неправильно распознает текст |
Тебе нужен
1 Acrobat prof
2 Scansoft OmniPages |
|
-20 dB
Фанат форума
Сообщения: 7674
|
1) Сканировать (разрешение 300 dpi, серый 8 бит, оптимизацию резкости и удаление растра отключить, при наличии пятен, неровностей фона, "пролезания" текста с другой стороны листа - забелить фон коррекцией гистограммы, сохранение в JPG), утилитой сканера (НЕ Ворда и НЕ Фани Ридер - туфта эти встраиваемые модули)
2) В Fine Reader - Файл --> Открыть изображение --> в выпавшем окошке выбрать необходимые сканы (все) --> Распознать всё.
3) Проверить распознание блоков на каждом скане. При неправильном распознании - Удалить блок, перезадать вручную, Распознать (Страницу, не Всё, иначе вся предыдущая работа насмарку).
4) Проверить АшиПки (неуверенное распознание текста Фаня выделяет синим) - если определила верно - Принять, если нет - исправить и Принять.
5) Передать документ в МС Ворд.
6) Окончательно отредактировать.
7) Enjoy! |
|
m.ix
Master Mixa
Сообщения: 1972+
|
DeBill писал: | Сканировать (разрешение 300 dpi, |
Чем больше разрешение, тем вероятность правильного распознавания текста выше. |
|
elektronik 41
Завсегдатай
Сообщения: 504
|
ввот тип документа отсканированого попробуйте сами |
|
m.ix
Master Mixa
Сообщения: 1972+
|
elektronik 41,
Можно
1 самому написать док в word
2 самому сделать это в excel
3 редактировать в самом PDF |
|
-20 dB
Фанат форума
Сообщения: 7674
|
m.ix, не совсем так. При слишком большом разрешении Фаня начинает искать буквы во фрагментах букв, в рисунках... И вообще ругается - типа, давай я тебе в нормальное 300 dpi преобразую. В некоторых случаях (мелкой текст) возможно придётся подобрать разрешение (300 - 600 dpi) по наилучшему качеству распознания. |
|
-20 dB
Фанат форума
Сообщения: 7674
|
elektronik 41, и, как оказалось после просмотра твоего образца, m.ix абсолютно прав -
1) Надо ли подобные документы переводить в Ворд, если всё равно заполнять их будут от руки?
2) Все ридеры текстов "косые" - имея несколько стандартных стилей форматирования, они пытаются их чередованием максимально "подогнать" вид итогового документа под вид оригинала. Как правило результат получается косой и кривой.
ИМХО, бланки лучше набивать вручную, а ещё лучше (если их будут вручную заполнять) - просто распечатывать из картинки (например, через ACD See). Как пример - в архиве отридеренный и наковырянный вручную бланки. Если заполнять форму будут не в ручную, а в Ворде, включи Непечатаемые Символы и удали нах табуляторы.
и 3) от себя лично - jpg и tiff несколько разные форматы. Писал же - сохраняй в джипеге, а в тифф Фаня сама перекодирует, как ей надо. Блин, тройное преобразование произвести пришлось, прежде, чем в ридер загнал...
DukUment.rar 6.24 КБ Скачано: 523 раз(а)
|
|
-20 dB
Фанат форума
Сообщения: 7674
|
Кстати, при наличии сканера есть куда более простой способ изменения документа - на отдельном листе бумаги тем же шрифтом, которым напечатан исходный бланк, печатается изменённая фраза/слово, а затем тупо вырезается ножницами и наклеивается на изменяемую часть документа. Полученный макет сканируется (фон высветлить добела настройкой гистограммы - стык аппликации не будет заметен) и столь же тупо печатается через ACD See... То же касается копиров и ксероксов. Но это, видимо, уже не в "Компьютеры"
Offtop: а вот почему последующие посты не добавляются к предыдущим - это уже интереснее. |
|
m.ix
Master Mixa
Сообщения: 1972+
|
DeBill писал: | а вот почему последующие посты не добавляются к предыдущим - это уже интереснее |
Смотри время создания.
Можно просто самому добавлять-изменив предыдущий. |
|
elektronik 41
Завсегдатай
Сообщения: 504
|
создал Рисунок JPEG загнал в ворд а как редоктировать картинку
или в ворде перевести в текстовый документ картинку |
|
m.ix
Master Mixa
Сообщения: 1972+
|
elektronik 41 писал: | Рисунок JPEG загнал в ворд а как редоктировать картинку |
elektronik 41, Для чего???
Хотя если так хочешь.
Сделай рисунок задним планом
Растяни его
Во Вьюере можно так же дописывать.
elektronik 41,
Сделай бланк в excel, или попроси кого то что б подобный блак сделали тебе.
Зато избавишься от картинок. |
|
elektronik 41
Завсегдатай
Сообщения: 504
|
да бланк то есть но его надо просто немножко отредактировать всего
несеколько слов не заполнять же весь бланк заново |
|
m.ix
Master Mixa
Сообщения: 1972+
|
elektronik 41 писал: | да бланк то есть |
В каком формате? |
|
elektronik 41
Завсегдатай
Сообщения: 504
|
на бумаге я его сканирую и получаю картинку со сканера а дальше чудеса получаются в абу пытаюсь распознать документ он его искажает то есть пропускает буквы или пишит крокозяблики а если эту картинку загоняю в ворд то она не редактируется |
|
m.ix
Master Mixa
Сообщения: 1972+
|
elektronik 41 писал: | я его сканирую и получаю картинку со сканера |
m.ix писал: | Scansoft OmniPages |
Недавно сканил док этой прогой, там точно руками замучаешься всё набирать.
Я предполагаю что данный док не будет заполнятся а просто тупо печататся на бумаге как есть, и лишь после от руки заполнятся.
Тогда elektronik 41, бери готовый док от DeBill, и печатай сколько угодно. |
|
-20 dB
Фанат форума
Сообщения: 7674
|
elektronik 41,
1) Ты в Ворд таки картинку загоняешь или распознанный Фаней документ?
2) Я отправил уже набранный в Ворде документ - Акт_самонабор.doc в архиве DucUment.rar - смотри выше, качай и редактируй как надо. Для кого я в конце конца старался битых 15 минут? Лень ответы прочитать?
3) Картинки (jpeg, bmp, gif, tiff) в Ворде НЕ РЕДАКТИРУЮТСЯ - максимум можно яркость, контраст поправить или размеры изменить. Если так уж не терпится редактировать именно РИСУНОК, ставь Adobe Photoshop или Corel Drow. Оно тебе надо?
4) Если всё равно них не понятно - читай мой предыдущий пост - вариант для блондинок. |
|
elektronik 41
Завсегдатай
Сообщения: 504
|
а если другой блан будет на бумаге что каждый раз набирать текс |
|
-20 dB
Фанат форума
Сообщения: 7674
|
Нет, изучать Фаню. Настраивать, тренироваться. Или найди эрогенные зоны у какой-нибудь секретарши и дай ей ножницы - аппликации клеить и сканить. |
|
m.ix
Master Mixa
Сообщения: 1972+
|
DeBill писал: | Картинки (jpeg, bmp, gif, tiff) в Ворде НЕ РЕДАКТИРУЮТСЯ |
Вообще ни какие.
Вот во вьюере надписал
ДОБАВЛЕНО 23/12/2007 13:56
elektronik 41 писал: | а если другой блан будет на бумаге что каждый раз набирать текс |
Ставить новую правильную OCR прогу, которая грамотно ещё распознаёт текст и кириллицу. |
|