Парсер файлов

Парсер файлов — это возможность программы Datacol собирать и обрабатывать информацию из файлов, которые находятся на вашем компьютере или в сети Интернет. Готовой настройки для парсинга файлов нет, так как структура сайта индивидуальна и ее нужно будет создавать самостоятельно.

Datacol поддерживает парсинг файлов формата XLS, XLSX, TXT, CSV.

  • При настройке парсера файлов вы сможете самостоятельно задать данные, которые нужно собирать;
  • Собранные данные можно дополнительно обрабатывать с помощью плагинов: изменять цену товара по определенному алгоритму, уникализировать или переводить описание и т. д.
  • Результат парсинга можно загрузить на свой сайт, импортировать в базу данных My SQL или сохранить в файл нужного формата.

Проверить работу парсера файлов можно бесплатно в демо-версии программы.

Скачать Демо-версию Datacol

Основные преимущества парсера файлов на базе Datacol это:

  • Доработка плагинов программы или написание новых под ваши нужды. Мы сможем автоматизировать практически любые задачи по автоматическому изменению или обработке результатов парсинга;
  • Возможность цикличного запуска кампаний. Когда результаты выполнения первой задачи парсинга будут входными данными для второй задачи по сбору данных. Подробнее смотрите здесь.

Обработка результатов парсинга

Часто бывает так, что данные, собранные парсером, перед отправкой на свой сайт нужно определенным образом обработать: перевести текст, поменять цену, отрерайтить описание, добавить свои характеристики, обработать контакты и т. д.

Программа Datacol не предоставляет удобного инструмента для обработки данных, их удобнее сначала сохранить в файл, внести нужные изменения, а затем отправить на сайт. В этом случае и пригодится возможность загрузки данных из файла. Результаты парсинга сохраним в Excel, обработаем их и снова загрузим в программу для последующего импорта в базу данных или на сайт.

Добавление наценки

Прайс листы с товарами интернет-магазина можно спарсить из сайта поставщика. Но гораздо чаще их присылают по электронной почте в формате EXCEL. И прежде чем информация о товарах попадет в интернет-магазин предстоит немало поработать над прайсом.

Для каких-то товаров нужно новое описание и фото, другие, наоборот, нужно убрать из каталога так как они закончились на складе поставщика. И практически для всех товаров нужно поменять цену, добавив к цене поставщика собственную товарную наценку.

Можно выполнить задачу обновления цен вручную, а можно автоматизировать с помощью плагина Datacol. Можно заложить свой алгоритм изменения цены, подключить плагин к кампании парсинга из файла и после обработки информация о товарах уже с новыми ценами будет загружена в интернет-магазин.

Перевод больших объемов текста

При переводе больших объемов текста можно пользоваться онлайн инструментам перевода, например: google translate или яндекс переводчиком. А можно подключить плагин автоперевода EAWS. Плагин в своей работе использует Яндекс Переводчик, но не ограничен по объему переводимого текста.

Вы можете брать информацию из текстового файла и, подключив плагин автопереводчика, сразу переводить ее на нужный язык, сохраняя себе на сайт, в базу данных или удобный формат.

Массовый экспорт контента из текстовых файлов в WordPress

Парсер Datacol позволяет производить экспорт собранного контента на WordPress сайт. Содержимое каждого отдельного файла будет публиковаться в блог на wordpress.com (или обычный блог на WordPress) в качестве отдельного поста. Вы сэкономите уйму времени, автоматизировав процесс наполнения.

Также существует возможность сохранения содержимого текстовых файлов из папки в 1 файл.

Тестирование сайтов вакансий

Тестирование парсинга файлов

1. Создаем новую кампанию Datacol.

Создаем новую кампанию Datacol

2. Вводим название настройки.

Вводим название настройки

3. На этапе задания входных данных вместо ссылки на вебстраницу задаем полный локальный путь к нашему файлу. Кстати, если файл лежит в папке Мои документы на вашем компьютере, путь можно не задавать, а ограничиться названием файла.

Задаем путь к файлу

4. Сбор ссылок отключаем, ведь весь нужный контент будет взят сразу из файла.

Сбор ссылок отключаем

5. Сбор данных также не нужно настраивать. Распознавание полей данных в структуре Excel файла будет настроено автоматически с помощью специального пункта контекстного меню.

Настройка полей данных

Настройка полей данных

Настройка завершена. Можно закрыть мастер.

6. Протестируем созданную настройку. Для этого запустим созданную кампанию. Видим, что Datacol мгновенно воспроизвел таблицу, которая находилась в исходном Excel файле.

Протестируем настройку

7. Datacol по умолчанию сохраняет данные в Excel файл, с названием, аналогичным названию новой кампании.

Excel файл

Обработка и экспорт данных

Способы обработки данных, собранных парсером файлов:

Форматы экспорта данных, собранных парсером файлов:

Загрузка в CMS/магазин/сайт»

Если у вас не получается самостоятельно загрузить собранные данные в свою CMS/интернет магазин/сайт, оставьте заявку и мы постараемся Вам помочь.


    Сколько стоит парсер файлов

    Парсер файлов – это настройка (пресет/конфигурация) программы Datacol. Настройка доступна в демо-версии программы. Демо-версия имеет все возможности платной версии, но сохраняет только первые 25 результатов парсинга. Узнать актуальную стоимость лицензии Datacol и купить программу можно здесь.

    FAQ

    Как разобраться в Datacol?

    Ознакомьтесь, пожалуйста, с видеоуроками по Datacol (хотя бы первые 3-5 уроков). Если при дальнейшей настройке программы у вас возникнут вопросы, задайте их нам. Поддержка Datacol отвечает с понедельника по пятницу.

    Какие условия покупки Datacol?

    Все условия приобретения программы приведены здесь.

    Как я получу программу после ее оплаты?

    После поступления оплаты за лицензию вы получите код активации программы и информацию о сроках действия вашей лицензии на адрес электронной почты, указанный при покупке. Инструкцию по активации можно посмотреть здесь.

    Не нашли ответа?