Автор | Сообщение |
Maksimov
Передовик
Сообщения: 2154
|
Нужна программа чтобы считала бы и сохранила бы в тексте весь какой нибудь сайт оптом перейдя по его ссылкам. Чтобы получилась база в текстовом файле. Картинки сохранять не надо. Может кто знает где такую программу найти? Подскажите пожалуйста. |
|
fishmf
|
|
Mikkey
Старший модератор
Сообщения: 3655
|
|
FANTASTRON
Передовик
Сообщения: 1405
|
Teleport Ultra 1.65
Мощный оффлайн-браузер, который используется для загрузки на локальный компьютер веб-сайтов. В дальнейшем, загруженный программой Teleport Ultra веб-сайт можно просматривать в режиме оффлайн. Если это необходимо, то можно загрузить только нужные пользователю веб-страницы с того или иного веб-сайта. Настройки этого оффлайн-браузера позволяют загружать только нужную пользователю информацию, отфильтровывая при необходимости всю графику, флэш-анимацию, рекламу, архивы и т.д. При закачивании информации этот оффлайн-браузер ведёт подробную статистику по каждому закаченному с веб-страницы файлу и обеспечивает быстрый поиск по всей скаченной информации. Программа Teleport Ultra основана на оффлайн-браузере Teleport Pro и отличается от него тем, что может одновременно работать сразу с 260.000 интернет адресов в одном проекте.
Для загрузки программы необходимо заполнить небольшую форму на сайте разработчика.
http://www.izone.ru/internet/browsers/teleport.htm |
|
БАРК
Старший модератор
Сообщения: 13337
|
|
m.ix
Master Mixa
Сообщения: 1972+
|
disco pump
И ещё полно похожих сайтокачалок
1 сайты после можешь смотреть на своём компе
2 указать что скачивать и до какой глубины - после скачивания можешь просматривать и файлы |
|
Maksimov
Передовик
Сообщения: 2154
|
Спасибо что откликнулись. Я пользуюсь всего двумя суперными MPOfflineBrowser и VisualWget с кодом $ wget -c -p -r -np -nc -l3 http:/URL
Но они качают по несколько тысяч файлов. А мне надо всего один но большой и только текст. Как настроить VisualWget может кто знает? |
|
fishmf
|
А это не оно?
из man wget :
-O file
--output-document=file
The documents will not be written to the appropriate files, but all will be concatenated together and written
to file. If - is used as file, documents will be printed to standard output, disabling link conversion.
(Use ./- to print to a file literally named -.)
кстати, вот он тот же самый ман, но на русском :man wget
В крайнем случае ничего не мешает написать какой-нибудь скрипт, который удалял бы картинки и все лишнее. |
|