Projects and Works
Projects » Umax Search Engines Parser » Version 1.2 » How To Use
Ставим галочку Use Proxy, вводим хост, порт, логин и пароль для подключения к прокси-серверу и жмем Use Settings. Если прокси анонимный, то логин и пароль можно не указывать.
Настройки прокси применяются ко всем без исключения дочерним окнам, как уже открытым, так и к тем которые будут вами открыты.
Выбираем сервис, который нужно парсить, в новом окне вбиваем кейворд, от которого нужно отталкиваться, включаем Прогрессивный поиск, и указываем какое кол-во страниц с данного сервиса парсить, по указанному киворду.
Примечание: Парсинг кеев с Рамблера ведется только напрямую и рамблер очень быстро банит, где-то с 5 или 6 запросов.
Выбираем нужный поисковик, и жмем по его названию. В новом окне вбиваем сайт, беки которого хотим увидеть и кол-во страниц, которые будут отпарсены (если их столько имеется) или оставляем Maх, при котором будут отпарсены все имеющиеся страницы.
Выбираем нужный поисковик, и жмем по его названию. В новом окне вбиваем кейворд. Парсится будет вся выдача поисковиков, за исключением Рамблера, у которого будет парситься только тысяча результатов.
Выбираем нужный поисковик, и жмем по его названию. В новом окне вбиваем кейворд. Парсится будет вся выдача поисковиков, за исключением Рамблера, у которого будет парситься только тысяча результатов. На выходе получаем ссылки на ресурсы, найденные по этому кейворду. Раздел так называется, т.к. создан для сбора спам базы, по кейвордам вроде форум, гостевая и т.д.
Для того чтобы уберегти IP от бана, между загрузками каждой страницы установлена задержка в 15 секунд.
Примечание: При парсинге кейвордов желательно не устанавливать количество страниц в Максимум, т.к. не известно сколько страниц выдачи имеется, под данный кей, и сколько соответственно времени понадобиться для парсинга.