Армия сателлитов на фрихостах с помощью Datacol
На примере настройки парсера блогов с экспортом в WordPress вы увидели, как с помощью Datacol можно автоматически наполнять свой блог контентом. При этом контент может даже синонимизироваться или автоматически переводиться через Google Translate.
Но что если мы хотим заполнять ни один блог, а сразу несколько, или даже целую АРМИЮ блогов на различных фрихостах? Специально для этого создан плагин экспорта DatacolFreeBlogPosterPlugin.
Модифицировать парсер блогов с экспортом в WordPress, чтобы публикация происходила в список блогов на wordpress.com, blogspot.com и livejournal.com.
Попробовать генератор армии блогов в работе можно после приобретения Datacol, поскольку он использует плагин DatacolFreeBlogPosterPlugin.dll, который автор предоставляет только после покупки Datacol. Стоимость плагина составляет 20$.
Модификация будет касаться только настроек экспорта. В основных настройках экспорта необходимо выбрать опцию Плагин. Также необходимо установить галочку Преобработка.
Преобработка необходима в данном случае для того, чтобы исключить из контента спец символы html, символы ; (поскольку они будут использованы в качестве разделителей в правилах для плагина), а также символы переноса строки и табуляции. Чтобы установить правила преобработки, просто нажмите кнопку Заполнить стандартный шаблон.
На вкладке Плагин необходимо указать путь к Плагину экспорта. Здесь же нужно указать правила для работы плагина экспорта.
В данном примере мы задаем следующий набор правил:
<DC_FBP_URL>http://diremike.livejournal.com</DC_FBP_URL>
<DC_FBP_LOGIN>diremike</DC_FBP_LOGIN>
<DC_FBP_PASS>mikedire1</DC_FBP_PASS>
<DC_FBP_HEADER>%title%</DC_FBP_HEADER>
<DC_FBP_CONTENT>%content%</DC_FBP_CONTENT>
<DC_FBP_BLOGID></DC_FBP_BLOGID>
<DC_FBP_CATWP></DC_FBP_CATWP>
<DC_FBP_TAGSWP></DC_FBP_TAGSWP>
<DC_FBP_PROXY></DC_FBP_PROXY>
</DC_FBP_RULE>
<DC_FBP_URL>http://datacolblogger.blogspot.com</DC_FBP_URL>
<DC_FBP_LOGIN>[email protected]</DC_FBP_LOGIN>
<DC_FBP_PASS>guri51jkd</DC_FBP_PASS>
<DC_FBP_HEADER>%title%</DC_FBP_HEADER>
<DC_FBP_CONTENT>%content%</DC_FBP_CONTENT>
<DC_FBP_BLOGID>8487402734368925057</DC_FBP_BLOGID>
<DC_FBP_CATWP></DC_FBP_CATWP>
<DC_FBP_TAGSWP></DC_FBP_TAGSWP>
<DC_FBP_PROXY></DC_FBP_PROXY>
</DC_FBP_RULE>
<DC_FBP_URL>http://diremike.wordpress.com</DC_FBP_URL>
<DC_FBP_LOGIN>diremike</DC_FBP_LOGIN>
<DC_FBP_PASS>diremikeblog</DC_FBP_PASS>
<DC_FBP_HEADER>%title%</DC_FBP_HEADER>
<DC_FBP_CONTENT>%content%</DC_FBP_CONTENT>
<DC_FBP_BLOGID></DC_FBP_BLOGID>
<DC_FBP_CATWP>%cat%</DC_FBP_CATWP>
<DC_FBP_TAGSWP>mortgage,finance</DC_FBP_TAGSWP>
<DC_FBP_PROXY></DC_FBP_PROXY>
</DC_FBP_RULE>
В результате при экспорте в качестве заголовка поста будет подставляться значение поля данных title (настраивается на вкладке Сбор данных), в качестве контента значение поля данных content (настраивается на вкладке Сбор данных), в качестве категории значение поля данных cat (настраивается на вкладке Сбор данных). Параметр ID блога используется только при экспорте в blogspot. В остальных случаях он игнорируется. ID блога можно найти в коде любой страницы вашего blogspot блога:
Категорию поста и теги можно указывать только в случае экспорта в WordPress (сюда относятся как бесплатные блоги на wordpress.com, так и обычные блоги на движке WordPress).
Что касается количества правил — их можно вводить сколько угодно. При парсинге Datacol будет поочередно экспортировать данные, собранные с каждой страницы сайта источника в блог, заданный одним из правил.
После модификации экспорта можно сразу запускать профиль парсинга Blog.
Уже через несколько минут вы сможете, увидеть, как ваши фриблоги будут заполнены контентом с http://kolchaka.net.
Отмечу, что вы также можете настроить Datacol для регулярного парсинга обновлений с источника. Таким образом ваши фриблоги будут регулярно обновляться.