Урок №14. Статические поля для сбора набора значений

В этом видео я продемонстрирую как использовать статические поля для сохранения списка значений поля данных. Мы настроим кампанию для сбора информации о товарах интернет магазина одежды. Помимо основных данных, нам необходимо сохранить все доступные размеры товара. При этом, они должны сохраняться в одну ячейку результирующей таблицы. Для лучшего восприятия информации, рекомендую предварительно посмотреть видео о настройке парсинга интернет магазина.

После просмотра видеоинструкции вы научитесь использовать статические поля. Это вам обязательно пригодится при сборе размера или цвета одежды с интернет магазинов. Выполнить данную задачу могут даже пользователи с начальным уровнем.


Напомним, что в Datacol Вы так-же найдете уже готовые парсера:

Текст видео (если Вам проще воспринимать информацию после прочтения) »

Настроим сбор ссылок на товары. Picker выдал предупреждение о том, что подобранный Xpath не будет корректно обработан Datacol. Нам стоит преобразовать Xpath выражение, чтобы Datacol мог с ним работать. В случае подбора Xpath для сбора ссылок для этого достаточно расширить или обрезать Xpath выражение. Готово. Теперь настроим пагинацию. Сохраним результат настройки сбора ссылок.

Теперь настроим сбор данных. Подберем xpath выражения для сбора полей данных. В случае с размером, нам нужно подобрать Xpath выражение для сбора ВСЕХ доступных значений. Поэтому мы действуем следующим образом.

Одним из свойств статического поля является то, что в качестве результата по умолчанию сохраняются все найденные значения, а не только первое, как в случае с обычным полем. Подбор xpath выражений завершен. Нажимаем кнопку сохранить.

Поскольку размер является статически полем, устанавливаем соответсвующую опцию.

Перейдем к тестированию. Появляются первые результаты, и мы видим, что для каждой позиции сохраняются все размеры. По умолчанию, символом-разделителем значений в статическом поле является запятая. В текущем примере это неприемлемо, поскольку сами значения (то есть размеры) могут содержать запятые. Поэтому мы заменим символ разделитель на точку с запятой.

Кстати, если нам понадобится собирать не все размеры, а например только первые три, то мы можем воспользоваться настройкой диапазона значений статического поля. Аналогично, можно задавать другие диапазоны значений. Повторим тестирование. Видим, что размеры отделяются друг от друга точкой с запятой. При этом, сохраняются только первые 3 размера для каждой позиции.