Урок №35. Сценарий загрузки файлов в Datacol

Пользователи программы Datacol давно просили реализовать функционал, который позволяет с помощью сценария браузера загружать файлы по клику на ссылке, аналогично тому, как это делается в обычном браузере. Сказано — сделано. Сейчас я продемонстрирую пример того, как в обычную кампанию добавить сценарий загрузки файлов. Для лучшего восприятия информации, советую перед просмотром ознакомиться с видео о механизме работы сценариев.

Напомним, что в Datacol Вы так-же найдете уже готовые парсера:

Текст видео (если Вам проще воспринимать информацию после прочтения) »

У нас имеется кампания, которая по списку ссылок собирает наименования инструкций к товарам интернет магазина.

Перейдем навскидку на любую страницу. Видим, что на странице имеется ссылка на скачивание файла инструкции. Доработаем настройку, чтобы Datacol сохранял нам на компьютер файлы с инструкциями.

Для начала поменяем загрузчик на браузер. Включим выполнение сценариев. Откроем окно редактирования сценария. Добавим стандартный блок действий для загрузки файла. Выберем действие клика. Подберем для него xpath ссылки для скачивания. Можно тут же проверить, насколько корректно мы это сделали.

Все верно, мы получили сообщение о том, что Datacol в процессе обработки сценария сохранит прямую ссылку на файл в код страницы. Сохраним сценарий.

Теперь остается настроить поля данных, которые обеспечат загрузку файла по сохраненной в сценарии ссылке. Обратите внимание, что для загрузки файла создается два поля. В поле name for file будет сохранено наименование файла, а с помощью второго поля будет осуществлена сама загрузка.

Обратите внимание, что именно в настройке поля file-download можно поменять настройки процесса загрузки. Здесь сразу видно, что собранное значение поля name for file как раз и будет использовано для того, чтобы сгенерировать название загруженного файла. Итак, сохраним внесенные изменения протестируем что же у нас получилось.

Запустим парсинг заново. Видим, что теперь при парсинге появляются браузеры. Также видим что теперь у нас в результатах добавилось 2 колонки соответственно. Кампания завершена. Теперь откроем папку Изображения на нашем компьютере. В нее по умолчанию сохраняются файлы. Видим загруженные файлы. При необходимости, папку можно поменять в настройках загрузки.

Итак, Datacol теперь умеет загружать файлы кликая на ссылки для загрузки в браузере. С этим всех и поздравляем!

Спасибо за внимание и подписывайтесь на наш канал, чтобы своевременно узнавать о выходе новых полезных видео!