Алгоритм подбора Xpath

Selector ››
Parent Previous Next

Алгоритм подбора Xpath (может быть использован для сбора данных либо для получения диапазона)

Selector значительно упрощает подбор Xpath для использования в Datacol. Обычно алгоритм подбора регулярного выражения выглядит следующим образом:


1. Загружаем страницу (с которой будем собирать данные посредством Xpath) с помощью Datacol. При этом опция Загрузчик Datacol должна быть отключена, поскольку в режиме браузера поиск xpath производится эффективнее. К примеру, с нижеприведенной страницы мы хотим получить заголовок поста: "Datacol: все парсера в одном!".



2. Кликаем по интересующему нас блоку правой кнопкой мыши, после чего Selector генеритует Xpath выражение для вырезания данного блока.



3. Загружаем страницу с помощью Загрузчика Datacol ( поскольку он загружает код страницы аналогично тому, как это делает Datacol, то есть без обработки Javascript) и проверяем найдется ли в ней подобранное Xpath выражение.



4. Если Xpath найден, то можно использовать данное Xpath выражение в Datacol.



Обратите внимание! Если вам не удалось найти Xpath выражение для сбора нужных данных, вы можете задействовать альтернативный механизм вырезания данных с помощью регулярных выражений.


Created with the Personal Edition of HelpNDoc: Easily create Help documents