Армия сателлитов на фрихостах с помощью Datacol

На примере настройки парсера блогов с экспортом в WordPress вы увидели, как с помощью Datacol можно автоматически наполнять свой блог контентом. При этом контент может даже синонимизироваться или автоматически переводиться через Google Translate.

Но что если мы хотим заполнять ни один блог, а сразу несколько, или даже целую АРМИЮ блогов на различных фрихостах? Специально для этого создан плагин экспорта DatacolFreeBlogPosterPlugin.

Задача »

Модифицировать парсер блогов с экспортом в WordPress, чтобы публикация происходила в список блогов на wordpress.com, blogspot.com и livejournal.com.

Демонстрация »

Попробовать генератор армии блогов в работе можно после приобретения Datacol, поскольку он использует плагин DatacolFreeBlogPosterPlugin.dll, который автор предоставляет только после покупки Datacol. Стоимость плагина составляет 20$.

Реализация »

Модификация будет касаться только настроек экспорта. В основных настройках экспорта необходимо выбрать опцию Плагин. Также необходимо установить галочку Преобработка.

Армия сателлитов на фрихостах с помощью Datacol

Преобработка необходима в данном случае для того, чтобы исключить из контента спец символы html, символы ; (поскольку они будут использованы в качестве разделителей в правилах для плагина), а также символы переноса строки и табуляции. Чтобы установить правила преобработки, просто нажмите кнопку Заполнить стандартный шаблон.

Армия сателлитов на фрихостах с помощью Datacol - Преобработка

На вкладке Плагин необходимо указать путь к Плагину экспорта. Здесь же нужно указать правила для работы плагина экспорта.

В данном примере мы задаем следующий набор правил:

<DC_FBP_RULE>
<DC_FBP_URL>http://diremike.livejournal.com</DC_FBP_URL>
<DC_FBP_LOGIN>diremike</DC_FBP_LOGIN>
<DC_FBP_PASS>mikedire1</DC_FBP_PASS>
<DC_FBP_HEADER>%title%</DC_FBP_HEADER>
<DC_FBP_CONTENT>%content%</DC_FBP_CONTENT>
<DC_FBP_BLOGID></DC_FBP_BLOGID>
<DC_FBP_CATWP></DC_FBP_CATWP>
<DC_FBP_TAGSWP></DC_FBP_TAGSWP>
<DC_FBP_PROXY></DC_FBP_PROXY>
</DC_FBP_RULE>

<DC_FBP_RULE>
<DC_FBP_URL>http://datacolblogger.blogspot.com</DC_FBP_URL>
<DC_FBP_LOGIN>[email protected]</DC_FBP_LOGIN>
<DC_FBP_PASS>guri51jkd</DC_FBP_PASS>
<DC_FBP_HEADER>%title%</DC_FBP_HEADER>
<DC_FBP_CONTENT>%content%</DC_FBP_CONTENT>
<DC_FBP_BLOGID>8487402734368925057</DC_FBP_BLOGID>
<DC_FBP_CATWP></DC_FBP_CATWP>
<DC_FBP_TAGSWP></DC_FBP_TAGSWP>
<DC_FBP_PROXY></DC_FBP_PROXY>
</DC_FBP_RULE>

<DC_FBP_RULE>
<DC_FBP_URL>http://diremike.wordpress.com</DC_FBP_URL>
<DC_FBP_LOGIN>diremike</DC_FBP_LOGIN>
<DC_FBP_PASS>diremikeblog</DC_FBP_PASS>
<DC_FBP_HEADER>%title%</DC_FBP_HEADER>
<DC_FBP_CONTENT>%content%</DC_FBP_CONTENT>
<DC_FBP_BLOGID></DC_FBP_BLOGID>
<DC_FBP_CATWP>%cat%</DC_FBP_CATWP>
<DC_FBP_TAGSWP>mortgage,finance</DC_FBP_TAGSWP>
<DC_FBP_PROXY></DC_FBP_PROXY>
</DC_FBP_RULE>

В результате при экспорте в качестве заголовка поста будет подставляться значение поля данных title (настраивается на вкладке Сбор данных), в качестве контента значение поля данных content (настраивается на вкладке Сбор данных), в качестве категории значение поля данных cat (настраивается на вкладке Сбор данных). Параметр ID блога используется только при экспорте в blogspot. В остальных случаях он игнорируется. ID блога можно найти в коде любой страницы вашего blogspot блога:

Армия сателлитов на фрихостах с помощью Datacol: blogID

Категорию поста и теги можно указывать только в случае экспорта в WordPress (сюда относятся как бесплатные блоги на wordpress.com, так и обычные блоги на движке WordPress).

Что касается количества правил — их можно вводить сколько угодно. При парсинге Datacol будет поочередно экспортировать данные, собранные с каждой страницы сайта источника в блог, заданный одним из правил.

После модификации экспорта можно сразу запускать профиль парсинга Blog.

Армия сателлитов на фрихостах с помощью Datacol

Уже через несколько минут вы сможете, увидеть, как ваши фриблоги будут заполнены контентом с http://kolchaka.net.

Фриблог на wordpress.com

Фриблог на blogspot

Фриблог на livejournal

Отмечу, что вы также можете настроить Datacol для регулярного парсинга обновлений с источника. Таким образом ваши фриблоги будут регулярно обновляться.