Результат поиска
скачать демо версию

Уникализация контента через synonyma.ru

Datacol может уникализировать собранные данные через Synonyma.ru. Для этого используется плагин для обработки значения поля D5Plugin_SynonymaRu. Таким образом, вы можете парсить любые ресурсы с помощью Datacol, уникализировать собранные данные с помощью Synonyma.ru и публиковать их в любые форматы.

кликните на изображении для увеличения

Оценить качество уникализации »

Оценить качество уникализации можно в бесплатной версии сервиса. Чтобы использовать Synonyma.ru с Datacol необходимо купить на сервисе абонемент Авто. При это вы получите ключ доступа, который нужно указать в файле конфигурации плагина.

Важно: ограничение на количество запросов »

Обратите внимание, что сервис устанавливает ограничение на запросы к автоматическому уникализатору — 1 запрос в 15 секунд. Таким образом, если ваша кампания использует синонимизацию — задействуйте только один поток, чтобы соблюдать интервал времени между запросами к сервису. Что касается самого интервала, в Datacol его можно не настраивать, поскольку он при необходимости реализуется самим плагином (смотрите параметры конфигурации usewait и interval).

кликните на изображении для увеличения

Стоимость плагина составляет 15$. Вы можете купить плагин прямо сейчас.

Для тестирования уникализации через Synonyma.ru с помощью Datacol вы можете задействовать демо настройку, которая парсит посты блога kolchaka.net и переводит их с помощью демо версии плагина D5Plugin_SynonymaRuDemo. Для этого выполните следующие действия:

1. Установите демо-версию программы Datacol;

2. В дереве кампаний присутствует кампания processors/blog-parser-synonyma-processor-copy.par. Откройте ее настройки и задайте конфигурацию плагина.

кликните на изображении для увеличения

3. Выберите кампанию в дереве и нажмите кнопку Запуск.

Ограничения демо версии плагина »

Обратите внимание, что демо версия плагина добавляет к обработанному значению поля ссылку на официальный сайт Datacol. Кроме того, она обрезает значение поля. Это можно заметить при тестировании сбора данных.

кликните на изображении для увеличения

кликните на изображении для увеличения

Чтобы убрать ссылку и отключить обрезание значения поля, вы можете приобрести полную версию плагина. Чтобы использовать полную версию плагина, ее (после покупки) необходимо импортировать и подключить к настройке.

Купить плагин

Обратите внимание — данная информация более актуальна для полной версии плагина(которую вы можете приобрести). Что касается демо версии плагина — она уже импортирована и подключена к кампании processors/blog-parser-synonyma-processor-copy.par в демо версии Datacol (начиная с Datacol 5.50).

Импорт плагина в Datacol »

Импорт плагинов в программу подробно описан в справке (доступной из интерфейса программы):

кликните на изображении для увеличения

Подключение плагина к настройке »

Плагин D5Plugin_SynonymaRu подключается в качестве плагина для обработки значения поля (чтобы уникализировать найденное значение поля данных через Synonyma.ru). Плагин можно подключать одновременно к нескольким полям данных:

кликните на изображении для увеличения

Конфигурация плагина уникализации контента через Synonyma.ru задается в соответствующей настройке. Обратите внимание — конфигурация задается для каждого поля данных, к которому подключен плагин.

кликните на изображении для увеличения

В конфигурации задаются следующие параметры:

  • login — Ваш логин в Synonyma.ru.
  • key — Ваш ключ доступа в Synonyma.ru (можно найти в админ панели сервиса).
  • dictionary — Словарь, используемый для синонимизации (доступные названия словарей можно найти в админ панели сервиса).
  • usewait — Флаг, показывающий необходимость осуществления задержки (непосредственно в плагине) после запроса к сервису. Флаг принимает значения 1 или 0 (соответственно ДА или НЕТ).
  • interval — Количество миллисекунд задержки (непосредственно в плагине) после запроса к сервису.

Пример строки конфигурации:

<dc5par type="string" name="login"></dc5par>
<dc5par type="string" name="key"></dc5par>
<dc5par type="string" name="dictionary">defaults*default_ru</dc5par>
<dc5par type="int" name="usewait">1</dc5par>
<dc5par type="int" name="interval">15000</dc5par>

ООО "Интернет-Автоматизация"

71700, Украина, Запорожская область,
г.Токмак, ул.Гоголя, 103/2

Datacol VKontakte Datacol Twitter Datacol Google Plus Datacol Facebook Datacol Telegram
карта сайта
X
У вас есть вопрос?

Менеджер проектов свяжется с вами в течении 1 рабочего дня.