Урок №34. Наполнение Worpdress блога контентом

Базовый функционал Datacol позволяет публиковать собранный контент напрямую в сайт на WordPress. Будь то новости, статьи, описания фильмов, товары, посты из социальных сетей и тому подобное — это все можно собрать и опубликовать на WordPress с помощью Datacol. Также нужно понимать, что Datacol все равно с какой CMS вы парсите контент — с Ucoz, Joomla, DLE и так далее. Выгрузку контента можно настроить практически с любого источника.

На данном видео мы рассмотрим задачу переноса постов с нашего блога на тестовый WordPress сайт, который изначально пуст.

Более подробную информацию о парсере с экспортом в вордпресс смотрите здесь. Напомним, что в Datacol Вы так-же найдете уже готовые парсера:

Текст видео (если Вам проще воспринимать информацию после прочтения) »

Возьмем базовую кампанию, которая настроена для сбора контента с блога и сохранения его в файлы на локальный компьютер.

Донастроим экпорт в WordPress.

Зададим настройки доступа для публикации контента на наш WordPress сайт. Обратите внимание мы задаем ссылку не на корень нашего сайта, а ссылку на скрипт XMLRPC, который как раз отвечает за публикацию данных на сайт по удаленному протоколу. Для старых версий WordPress перед работой стоит проверить включена ли возможность публикации по XMLRCP. Логин и пароль задаем для того аккаунта, от имени которого будем публиковать материалы

При публикации в сайт на WordPress из Datacol мы можем задать ряд параметров, среди которых заголовок поста, контент, категория, теги, дополнительные поля и так далее. С полным списком параметров можно ознакомиться в онлайн справке к программе.

Для генерации параметров при публикации мы будем использовать собранные с сайта источника данные. Для этого в формулу генерации вставляются названия выгружаемых полей данных, заключенные в знаки процента.

Таким образом, например, можно контент сгенерировать из нескольких полей, например из текста материала на исходном сайте, а также ссылки на него.

Напомним, чтобы научиться создавать поля данных и в целом настраивать Datacol для сбора информации, пожалуйста, ознакомьтесь с видеоинструкциями к программе. Для простых случаев будет достаточно изучить первые 3-5 видеоинструкций.

Протестируем публикацию. Если в логе нет ошибок, скорее всего все отработало корректно. Для проверки зайдем на наш сайт, чтобы это удостовериться в наличии опубликованного поста.

Действительно на нашем сайте появился новый материал. Настройка завершена. Осталось несколько мелочей. Отключим сохранение локальных файлов, сейчас это для нас неактуально. Чтобы публикация осуществлялась мгновенно при сборе данных, а не в конце процесса парсинга, проверим, чтобы был включен потоковый режим. Закроем окно настройки.

Запустим кампанию для парсинга исходного сайта. После окончания парсинга перейдем на наш сайт. Обновим его. Видим, что он наполнен контентом с исходного сайта. Кстати, при публикации автоматически сгенерировались рубрики как на сайте-источнике. Если же данные не появились, проверьте логи. В них, в случае неудачной публикации, будут отображены ошибки, которые произошли.

Если у вас не получается настроить сбор данных или публикацию, вы можете обратиться к нам.

Итак мы продемонстрировали реализацию наполнения сайта на WordPress с помощью базового функционала Datacol. Есть еще несколько важных моментов, которые стоит знать, если перед вам стоит задача наполнения WordPress сайтов.

Первое. При необходимости можно настроить, чтобы изображения с сайта источника сохранялись на ваш локальный компьютер, а затем по FTP грузились на ваш сайт на WordPress. В справке описан наглядный пример.

Второе. Обратите внимание, что если речь идет о магазине на WordPress, то он обычно реализуется с помощью плагинов к этой CMS. Наполнение магазинов на WordPress товарами мы рассмотрим на отдельном видео.

Третье. Напомним, что контент перед публикацией можно обработать, например автоматически перевести. Подробнее об этом в соответствующем разделе нашего сайта.

Четвертое. Довольно популярной является задача парсинга контента из выдачи с дальнейшей публикацией на WordPress. Ее можно реализовать подкорректировав соответствующую настройку Datacol по аналогии с тем, как мы показали на текущем видео.

Пятое. Чтобы реализовать регулярное получение обновлений с сайта источника, необходимо задействовать механизм очереди истории, встроенный в Datacol. Наглядный пример описан в справке к программе.
Там же описана работа с планировщиком, который даст возможность запускать Datacol для наполнения WordPress по расписанию.