Урок №11. Использование замен

Модуль замен в Datacol предназначен для изменения собранных данных. Его можно использовать, когда нужно удалить строки или заменить их другими. Один из наиболее популярных примеров — удаление валюты и лишних пробелов из найденной цены товара.

После просмотра видео вы сможете с легкостью производить замены при сборе данных. Особенно эта задача актуальна для владельцев интернет магазинов, когда цены на товар должны быть представлены в одном формате.


Напомним, что в Datacol Вы так-же найдете уже готовые парсера:

Текст видео (если Вам проще воспринимать информацию после прочтения) »

Продемонстрируем как это работает. Запустим ранее созданную кампанию по сбору товаров с интернет магазина. Видим, что в поле с ценой сохраняется не только число, но и валюта.

Скопируем цену одного из товаров в буфер обмена. Открываем настройки поля данных для сбора цены. Переходим на вкладку Замены. Добавляем замену для удаления валюты из цены.

Протестируем работу замен. Для этого вставляем скопированное ранее значение цены в поле исходный текст. Нажимаем кнопку Тестировать. Видим, что текст после применения замен уже не содержит обозначения валюты. Однако в нем еще остался лишний пробел. Для его удаления добавим еще одну замену.

Кроме встроенных вариантов замен, вы можете добавлять свои.

Обратите внимание, что когда флаг Regex не установлен, замена просто меняет в тексте старое значение на новое. Если же флаг Regex установлен, то старое значение обрабатывается как регулярное выражение. Регулярное выражение можно рассматривать как трафаретку, шаблон или маску, которая накладывается на участки текста, чтобы найти совпадающие с ней последовательности. Регулярные выражения значительно расширяют возможности поиска участков в тексте. Например, благодаря им мы можем найти и заменить участок, начинающийся с одной подстроки и оканчивающийся другой. При этом, между началом и концом может располагаться любой текст. О нюансах работы с регулярными выражениями мы расскажем в последующих видео.

Если мы хотим создать замены, которые будут применяться ко всем полям данных, то нужно задать их на вкладке Глобальные замены. Кроме того, можно добавить замены, которые будут применяться к исходному коду вебстраницы сразу после ее загрузки еще до поиска в нем ссылок или данных. Это можно сделать на соответствующей вкладке. Принцип задания, тестирования и обработки замен здесь аналогичен.

Чтобы сохранить созданный набор замен для использования в будущих кампаниях, экспортируем их в XML файл. Когда потребуется их можно будет импортировать, чтобы не вводить заново. Чтобы сохранить созданные замены, нужно нажать кнопку Применить или Сохранить и выйти. Запустим кампанию, чтобы проверить результат добавления замен в поле с ценой. Видим, что валюта и лишние пробелы исчезли.