Парсер html

Парсер HTML

Datacol является отличным HTML парсером. Программа настраивается для сбора данных с любых интернет сайтов. Datacol поддерживает возможность визуальной настройки. Таким образом, чтобы определить формулу для вырезания данных с веб страницы, вам нужно всего лишь кликнуть на соответствующем элементе во встроенном браузере. Если же верстка сайта не позволяет настроить сбор данных с помощью визуальной настройки, то можно прибегнуть к использованию регулярных выражений (строковых формул).

Благодаря технологии динамических плагинов, Datacol может получать данные подгружаемые по Ajax, то есть по сути он может использоваться как Ajax парсер. Конечно же, скорость работы в таком случае значительно уменьшается (по сравнению с обычным граббером html), поскольку для серфинга по источникам данных используется объект встроенного браузера.

Кроме того что в рамках Datacol можно настроить парсер сайтов на любых движках, пользователи также могут производить экспорт собранных данных в различные CMS, файловые форматы или просто базу данных. Некоторые CMS поддерживаются стандартным функционалом Datacol (такие как WordPress и DLE), в другие экспорт происходит посредством специально созданных плагином (например Ucoz, InstaCMS, Blogspot и другие).

Парсер Html в рамках Datacol может работать через прокси, обеспечивая пользователю анонимность при сборе данных. Это очень важно, особенно когда парсер работает в многопоточном режиме.

Если вас не устраивает функционал Datacol и вы хотите заказать разработку веб парсера, то вы можете связаться с нами прямо сейчас.