Урок №32. Пример парсинга большого фото с Hotline

Сейчас мы продемонстрируем, как собирать полноразмерные фото товара на примере настройки парсинга Хотлайн. Для лучшего понимания вопроса, рекомендую предварительно посмотреть видео про диагностику неполадок загрузки изображений.

Напомним, что в Datacol Вы так-же найдете уже готовые парсера:

Текст видео (если Вам проще воспринимать информацию после прочтения) »

Сейчас мы продемонстрируем, как собирать полноразмерные фото товара на примере настройки парсинга хотлайн. Для лучшего понимания вопроса, рекомендую предварительно посмотреть видео про диагностику неполадок загрузки изображений.

Заметим, что ссылка на большое фото есть в коде страницы. Это можно проверить с помощью обычного браузера Chrome.

Напомним, что если бы ссылки на фото не было, то реализовать загрузку большого изображения можно с помощью сценария. Это описано на видео о сценарии получения большого изображения.

Итак мы открываем настройку парсера Hotline.

Добавляем поле данных для сохранения фото.

Включаем сохранение тегов.

Включаем загрузку.

Для удобства выбираем Виртуальный путь в качестве возвращаемого значения.

Сейчас ничего не настраивая протестируем сбор данных.

Видим пустое поле фото

Откроем код, который загрузил Datacol в селекторе.

Найдем в коде ссылку на большое изображение.

Обратите внимание, в идеале нужно найти ссылку, которая находится в теге a или img. Другими словами, если ссылка нашлась в нескольких местах, то предпочтение отдаем тому вхождению, которое, находится в теге a или img.

Выделяем окружающий тег

Генерируем регулярное выражение для его сохранения

Переносим в настройку кампании.

Сохраняем и запускаем парсинг.

Видим, что большое фото сохраняется в отчете.

Также выгруженные большие изображения можно найти в папке Изображения, куда они по умолчанию сохраняются.

Теперь несколько моментов.

Первое. Если хотите спарсить сразу все большие фото — используйте статическое поле. В помощь видео про парсинг набора значений с помощью статического поля. Отдельный пример для такого случая мы рассмотрим в дальнейших видео.

Второе. Если ссылку на фото не получилось найти в теге a или img, настройка несколько усложняется. Этот вариант мы также рассмотрим в дальнейших видео.

Третье. Если у вас не получается подобрать регулярное выражение, посмотрите видео про использование регулярных выражений. Если и после этого не получится, обратитесь за поддержкой на наш форум и вам подскажут, в каком направлении двигаться.