Парсер товаров

Парсер товаров

Парсер товаров чаще всего необходим для наполнения интернет магазинов. Обычно он реализовывается на базе Datacol. При этом используется простая схема. Есть 2 интернет магазина: первый — наш и второй — назовем его донор (то есть источник информации о товарах). В рамках Datacol настраивается парсер интернет магазина донора. При парсинге собранные данные экспортируются в CSV файл, который в результате импортируется в наш магазин. Вот и все — по такой простой схеме мы можем наиболее эффективно автоматизировать наполнение нашего онлайн магазина.

По вышеописанному принципу Datacol также позволяет наполнять наш интернет магазин сразу с нескольких ресурсов — доноров. Кроме того, он может регулярно докачивать новые появившиеся товары.

Парсер описаний товаров по списку

Парсер товаров по списку

Распространенный случай, когда магазин необходимо наполнять не всеми товарами с другого ресурса, а собирать описания и характеристики товаров по определенному списку. Здесь аналогично удобно задействовать Datacol, поскольку он может поочередно в форме поиска сайта донора «вбивать» названия (или артикулы) нужных вам товаров и затем сохранять найденные результаты. Таким образом, на выходе удастся получить в CSV (или XLS) файл с описаниями товаров по предоставленному вами списку.

Однако данный подход имеет и свои минусы. По некоторым названиям товары могут быть просто не найдены (по той причине, что их название на сайте доноре отличается от названия в вашем списке). Другая проблема заключается в том, что на ваш запрос может быть выдано сразу несколько товаров и не всегда просто распознать, какой из них является полным аналогом товара из списка.

Парсер товаров Yandex Market

Парсер товаров Yandex Market

Одной из самых популярных задач является скачивание базы товаров Яндекс Маркета. Она содержит в себе много исчерпывающих описаний для самых различных товаров. Парсинг Яндекс Маркета ничем не отличается от сбора информации с обычного интернет магазина. Нужно только помнить, что Яндекс активно борется с ботами, и если вы хотите собрать, допустим, информацию по 5000 товаров и сделать это максимально быстро, то приготовьте как минимум 50-100 хороших (незабаненных маркетом) проксей. Интересный момент, с которым мы столкнулись на практике. Прокси, забаненные маркетом, могут нормально использоваться при парсинге самого Яндекса. И наоборот.

По принципу описанному выше, парсить характеристики товаров с Яндекс Маркета можно по списку товаров. Однако тут же мы сталкиваемся с проблемой неопределенности при выдаче сразу нескольких товаров по заданному запросу.

Товары из Yandex Market чаще всего сохраняются в XLS или в CSV для дальнейшего импорта в интернет магазины на всевозможных движках, таких как: Webasyst, Opencart и т.п.


Если вы хотите скачать парсер товаров, то вы можете найти его на нашем сайте. Если же вам не хватит функционала Datacol для парсинга товаров, то мы можем создать для вас отдельное решение.