Актуальная версия программы Datacol — 7.14
Новое в последней версии:
- Добавлены браузерные публикаторы, которые упрощают публикацию собранных данных;
- Добавлена возможность загружать файлы в кампаниях парсинга;
- Интегрирован внутренний планировщик запуска;
- Ускорена и оптимизирована работа программы;
- Исправлены ошибки в работе кампаний.
Если до установки последней версии программа уже была ранее установлена и активирована у вас на компьютере, то при установке последней версии она останется активированной. Напомним, что неактивированная программа работает в демонстрационном режиме и сохраняет только первые 25 результатов парсинга.
История предыдущих версий:
Datacol 7.08
- Доработали возможность парсить данные (товары, объявления) со страниц, у которых нет собственной страницы. Их описание обычно открывается во всплывающем окне. Таким образом, еще больше интернет магазинов, сайтов объявлений и других вебресурсов можно спарсить с помощью Datacol;
- В действиях клика (CLICK) и ввода текста (SET_VALUE) появилась опция Реальное событие. Теперь мы по максимуму исключим случаи, когда с помощью сценария не получается кликнуть по вебэлементу или ввести текст в поле;
- Действие SEND_KEY. Теперь можно будет отправлять в браузер нажатия клавиш DELETE, BACKSPACE, CTLR+A и т.п.;
- Действие GO_BACK — переход на предыдущую загруженную страницу;
- Добавили параметр командной строки , который позволяет задать путь к файлу, в котором находится набор стартовых URL;
- Добавили опцию обрезания поля данных по количеству символов;
- Доработали загрузку изображений со страницы через ту же прокси, что была загружена сама страница.
- В механизм подбора Xpath добавили автоопределение атрибутов микроразметки, в частности itemprop.
- По просьбам трудящихся, сделали обновление настроек не автоматическим, а по кнопке;
- Исправили несколько багов в настройке диапазонов.
Datacol 7.07
- Внедрена технология динамических плагинов. Ее суть в том, что плагин компилируется прямо во время запуска кампании.
Datacol 7.06
- Парсинг сайтов с пагинацией, реализованной посредством Javascript!!!
- Выполнение блока сценария ПОСЛЕ обработки данных и ссылок;
- Зацикливание обработки определенного элемента очереди посредством использования в сценарии действия REPEAT_ITEM_PROCESSING;
- Ожидание статуса загрузки документа INTERACTIVE или COMPLETE с помощью действия WAIT_DOCUMENT_STATE;
- Задание условия REGEX_MATCHING_WEB_ELEMENT (наличие на странице вебэлемента, исходный код которого соответствует регулярному выражению);
- В контекстном меню области отображения исходного кода: выделение окружающего курсор блока (div,p), а также перенос выделенного исходного кода в браузер;
- Исправлены баги отсутствие лог сообщения про экспорт в Excel;
- Avito: обеспечена гибкость парсинга — возможность начинать парсинг на разных уровнях мобильной версии;
- Taobao: добавлен проход по Javascript пагинации, чтобы собрать всю выдачу каталога;
- Wordstat: добавлен проход по пагинации, чтобы собрать ВСЕ производные ключевики;
- Яндекс Маркет: произведена корректировка полей данных.