Сбор ссылок

Parent Previous Next


Вкладка Сбор ссылок позволяет задать нюансы настройки сбора ссылок со страниц, удовлетворяющих условиям, заданным в Базовых настройках навигации.


Datacol может собирать Внутренние ссылки (ссылки на страницы того же сайта, на котором производится сбор), Внешние ссылки (ссылки на страницы других сайтов) или Все ссылки со страницы.


Блок Вырезание ссылок позволяет задать список XPATH и список Regex, которые определят участки страницы, с которых производится сбор ссылок. Это позволяет собирать ссылки выборочно, таким образом оптимизируя серфинг Datacol по сайту источнику. Если данные списки пусты, то сбор ссылок производится со всей страницы.


Чтобы собирались ссылки на другие страницы сайта, URL должен удовлетворять Фильтры ссылок:

а) Содержать строки, заданные в настройке Должны присутствовать.

б) Не содержать строки, заданные в настройке Должны отсутствовать.


Плагин для сбора ссылок. Механизм плагинов Datacol позволяет переопределить стандартный механизм сбора ссылок Datacol. Подробнее о механизме работы плагинов можно почитать в данном разделе.


Блок Тестирование сбора ссылок позволяет протестировать сбор ссылок с определенной страницы сайта. При нажатии на кнопку Тестировать происходит автоматическое сохранение всех настроек кампании.



Копирование результатов при тесте. При тестировании загрузки данных полученные результаты теперь можно сохранить в буфер обмена. А из буфера скопировать в любой файл — это дело пары секунд. Лайфхак: тестирование загрузки ссылок — это самый простой способ спарсить только ссылки сайта по заданным параметрам.

Created with the Personal Edition of HelpNDoc: Produce electronic books easily