Сбор данных может происходить как со всей страницы, так и с определенных ее участков, которые мы будем далее называть Диапазонами. Представим ситуацию, когда нам нужно собрать названия и анонсы всех постов, расположенных на такой странице - http://kolchaka.net/category/parsery/ :
Обратите внимание, что Datacol будет искать по одной группе данных во всех найденных диапазонах. Множество диапазонов формируется строками из настроек Regex участков для сбора и Xpath участков для сбора. При этом, каждое отдельное Xpath или Regex выражение находится в отдельной строке.
При выборе диапазонов, можно отобрать только определенные участки: первый, последний, четные, нечетные или заданные, определенным диапазоном числовых значений.
Стандартная логика вырезания диапазонов может переопределяться Плагином получения диапазона. Подробнее о механизме работы плагинов можно почитать в данном разделе.
Created with the Personal Edition of HelpNDoc: Free EPub and documentation generator