Актуальная версия программы Datacol — 7.14

Datacol 7

Новое в последней версии:

  • Добавлены браузерные публикаторы, которые упрощают публикацию собранных данных;
  • Добавлена возможность загружать файлы в кампаниях парсинга;
  • Интегрирован внутренний планировщик запуска;
  • Ускорена и оптимизирована работа программы;
  • Исправлены ошибки в работе кампаний.

Скачать последнюю версию

Если до установки последней версии программа уже была ранее установлена и активирована у вас на компьютере, то при установке последней версии она останется активированной. Напомним, что неактивированная программа работает в демонстрационном режиме и сохраняет только первые 25 результатов парсинга.

История предыдущих версий:

Datacol 7.08

  • Доработали возможность парсить данные (товары, объявления) со страниц, у которых нет собственной страницы. Их описание обычно открывается во всплывающем окне. Таким образом, еще больше интернет магазинов, сайтов объявлений и других вебресурсов можно спарсить с помощью Datacol;
  • В действиях клика (CLICK) и ввода текста (SET_VALUE) появилась опция Реальное событие. Теперь мы по максимуму исключим случаи, когда с помощью сценария не получается кликнуть по вебэлементу или ввести текст в поле;
  • Действие SEND_KEY. Теперь можно будет отправлять в браузер нажатия клавиш DELETE, BACKSPACE, CTLR+A и т.п.;
  • Действие GO_BACK — переход на предыдущую загруженную страницу;
  • Добавили параметр командной строки , который позволяет задать путь к файлу, в котором находится набор стартовых URL;
  • Добавили опцию обрезания поля данных по количеству символов;
  • Доработали загрузку изображений со страницы через ту же прокси, что была загружена сама страница.
  • В механизм подбора Xpath добавили автоопределение атрибутов микроразметки, в частности itemprop.
  • По просьбам трудящихся, сделали обновление настроек не автоматическим, а по кнопке;
  • Исправили несколько багов в настройке диапазонов.

Datacol 7.07

  • Внедрена технология динамических плагинов. Ее суть в том, что плагин компилируется прямо во время запуска кампании.

Datacol 7.06

  • Парсинг сайтов с пагинацией, реализованной посредством Javascript!!!
  • Выполнение блока сценария ПОСЛЕ обработки данных и ссылок;
  • Зацикливание обработки определенного элемента очереди посредством использования в сценарии действия REPEAT_ITEM_PROCESSING;
  • Ожидание статуса загрузки документа INTERACTIVE или COMPLETE с помощью действия WAIT_DOCUMENT_STATE;
  • Задание условия REGEX_MATCHING_WEB_ELEMENT (наличие на странице вебэлемента, исходный код которого соответствует регулярному выражению);
  • В контекстном меню области отображения исходного кода: выделение окружающего курсор блока (div,p), а также перенос выделенного исходного кода в браузер;
  • Исправлены баги отсутствие лог сообщения про экспорт в Excel;
  • Avito: обеспечена гибкость парсинга — возможность начинать парсинг на разных уровнях мобильной версии;
  • Taobao: добавлен проход по Javascript пагинации, чтобы собрать всю выдачу каталога;
  • Wordstat: добавлен проход по пагинации, чтобы собрать ВСЕ производные ключевики;
  • Яндекс Маркет: произведена корректировка полей данных.