Урок №9. Парсинг с экспортом в CSV

На этом видео я покажу, как можно переопределить формат сохранения данных. Для лучшего восприятия информации, советую ознакомиться с видео пошаговой настройке интернет магазина, а также с видео о редактировании существующей настройки Datacol.

После изучения этой видеоинструкции вы научитесь экспортировать собранную информацию в CSV файл. Данное видео особенно пригодиться владельцам интернет магазинов, так как большинство CMS поддерживают импорт информации о товарах в формате CSV.


Напомним, что в Datacol Вы так-же найдете уже готовые парсера:

Текст видео (если Вам проще воспринимать информацию после прочтения) »

Напомним, что при настройке с помощью мастера собранные данные по умолчанию сохраняются в Excel файл. Однако в ряде случаев возникает необходимость выгрузить информацию в CSV файл определенной структуры. Например, для дальнейшего импорта на свой сайт.

В новой версии Datacol значительно упрощен механизм генерации структуры CSV файла. Давайте настроим парсинг интернет магазина таким образом, чтобы помимо файла в формате Excel, на выходе получить файл для импорта в Opencart.

Важный момент — для того, чтобы легко и быстро реализовать поставленную задачу, нам обязательно понадобится пример файла импорта. То есть файл, на основе структуры которого, Datacol должен создавать свой. Пример файла импорта можно получить на форуме поддержки соответствующей CMS.

Приступим к настройке

Напомню, все нюансы текущей настройки подробно изложены на вышеупомянутых видео.

Для генерации полей данных воспользуемся опцией Из CSV Файла.

Datacol сгенерировал 3 поля данных. Чтобы понять почему так произошло еще раз откроем CSV файл.

В нем более 3-х колонок, однако Datacol автоматически определил, колонки, значение в которых является фиксированным, а также пустые колонки. Для них поля данных, естественно, не создавались.

Однако это еще не все. Помимо генерации полей данных, был автоматически создан произвольный формат экспорта для сохранения аналогичного по структуре CSV файла.

Давайте донастроим сбор данных, после чего вернемся к формату экспорта.

Открываем дерево быстрой настройки. Видим, что наряду с Excel был автоматически настроен произвольный формат экспорта. Рассмотрим его настройки более детально.

Видим, что Datacol не только сгенерировал формат сохранения, но также автоматически определили кодировку файла. Если же по каким то причинам вас не устраивает автоматически сгенерированный формат, то вы можете изменить настройки вручную. Принципы настройки произвольнго формата экспорта подробно описаны в нашей справке.

Давайте проверим как Datacol сгенерирует результирующие файлы. Нажимаем кнопку “Запуск”.

Через некоторое время мы видим как начинают появляться результаты.

После завершении работы кампании все выгруженные данные будут сохранены в 2 файла, один из которых Excel, другой CSV. По умолчанию они сохраняются в папку Мои документы.

Название файлов соответствует названию новой кампании.