воскресенье, 17 августа 2014 г.

Автонаполнение контентом.



Есть не один способ автоматического наполнения блогов контентом. Это различные блогофермы, позволяющие быстро создать и оптимизировать тематический блог. Но такие программы стоят денег. И иногда не маленьких. Мы же ставим своей целью начать зарабатывать на блогах с минимальными вложениями. Потому будем рассматривать бесплатные способы автонаполнения блогов.
Практическая методика и советы по настройке и использованию инструментов автонаполнения блога в следующей статье. А здесь перечислим некоторые из инструментов автонаполнения блога и их особенности.
Рассмотрим способ наполнение блога контентом с помощью RSS граберов. (Этичность такого способа рассматривать не будем, каждый решает для себя сам.)
Два наиболее популярных RSS-грабера: FeedWordpress и Wp-0-matic. Дальше понемногу о каждом.

Что может FeedWordpress:
  • Без проблем грабит различные новостные ленты формата — RSS/Atom.
  • Распределяет сграбленные заметки по категориям блога.
  • Автонаполнение блога настраивается по расписанию, Вам не понадобится настраивать крон.
  • Позволяет публиковать как анонсы сграбленных статей, со ссылкой на источник. так и новость полностью.
Особенности плагина Wp-0-matic:
  • Поддерживает все известные форматы RSS.
  • Позволяет объединять несколько лент в одну категорию.
  • Запускается либо в ручном режиме, либо автоматически, но требует настройки Cron.
Найти ленты с которых можно грабить новости, не составит труда. Можно пройти по блогам. Либо взять известные ленты, такие как liverss.ru или rssportal.ru
Но полученный таким образом контент надо обязательно уникализировать. Раз уж мы пошли по пути плагинов, возьмем плагин Unikalizator. Это плагин бесплатен, хорошо управляется. Но нужно будет самому вставить в него базу синонимов.

Настройка FeedWordPress

егодня поговорим о настройке плагина для авто-блога или сплога, кому как нравиться, FeedWordpress.
Из всех плагинов для грабинга RSS больше всего мне понравились FeedWordpress, WP-o-Matic и wp-import. Другие или слишком примитивны или не поддались настройке. Следует сказать, что плагин wp-import не работает на поздних версиях WordPress. Мне удалось его запустить на версии 2.2.
Итак:
  • Создаем на сервере в папке wp-content/content/plugins/ папку feedwordpress. В нее заливаем файлы из одноименной папки архива, кроме папки MagpieRSS-upgrade. Файлы из этой папки копируем в папку wp-includes, соглашаясь на замену файлов. Предварительно сделайте бекап этих файлов и базы данных.
  • Переходим в админку и активируем плагин в панели управления.
  • После активации плагина в админке появится новый раздел Syndication. Заходим во вкладку Syndication и добавляем ссылку на фид. Жмем кнопку Syndicate. Следует отметить, что плагин синдицирует только то, что отдает RSS фид. Поэтому, если вы хотите, чтобы плагин тянул полностью статью, ищите соответствующие фиды.
  • Далее надо изменить параметры данного фида.
  • В первом блоке настройки отвечают за ручное или автоматическое обновление. Можно оставить автоматическое обновление.
  • В следующем блоке определяем рубрику, в которую будут добавляться новости этого фида.
  • Следующие блоки: можно добавить метки синдицируемым новостям, а также выставить авторство.
  • Следующие блоки – настройка комментирования, пингов и макросов шаблонов.
  • Далее нажимаем кнопку Сохранить изменения. После чего отправляемся на вкладку Syndication и нажимаем Update. Если у вас выставленно автоматическое добавление, то плагин начнет постить сграбленные новости. У меня по умолчанию стоит модерирование новостей.
В дополнение я бы посоветовал выставить таймаут больше 5 секунд:
Файл /wp-includes/rss.php
строка define(’MAGPIE_FETCH_TIME_OUT’, 5); // 5 second timeout меняется на
define(’MAGPIE_FETCH_TIME_OUT’, 30); // 30 second timeout
Настойка FeedWordPress.
Создание автонаполняемого сплога по шагам.
1. Регистрируем бесплатный домен в зоне org.ua, регистрируемся на бесплатном хостинге или на платном (к примеру  Эскхостинг), устанавливаем и настраиваем WordPress. Все это было описано ранее.
Сразу следует сказать, что автонаполнение RSS-граберами (или RSS-агрегаторами) реализованными в виде плагинов под wordpress, на некоторых хостингах не будут работать. Потому на Freehostia у нас скорее всего ни чего не получится, а потому регистрируем хостинг к примеру на 000webhost.
2. Устанавливаем и активируем на WordPress плагин RSS-агрегатор FeedWordPress. Здесь каких то особенностей нет.
3. Настраиваем FeedWordPress.
Поле установки FeedWordPress в админ панели блога появляется раздел «Syndication». В нем выбираем подраздел «Настройки». В нем:
- Устанавливаем интервал проверки фидов «Check for feeds ready to be polled for updates:» на 60 минут(или как Вам нравится).
- Устанавливаем «Publication:» в «Hold syndicated posts for review; mark as Pending». Т.е. новые посты будут публиковаться не сразу а помечаться как отложенные для публикации. Зачем это надо. Дело в том что синонимайзер не всегда отрабатывает. Зачастую он отказывается работать с постами в которых есть картинки. Или посты бывают ну совсем не в тему. Да и заголовки не мешает иногда подправлять. Но если Вы хотите полную автоматизацию не взирая на недостатки устанавливайте «Publication:» в режим «Publish syndicated posts immediately».
feedwordpress

- «Permalinks point to:» в режим «this website».
- «Unfamiliar categories:» выбираем «create a new category». В таком режиме для каждого нового поста будет создаваться категория, если такой категории еще нет в блоге. Большое количество категорий не улучшает читабельность блога (но нам этого и не надо), зато увеличивается количество страниц второго уровня, с которых в дальнейшем мы сможем продавать ссылки.
feedwordpress
Остальные параметры не важны.
Идем в подраздел «Syndication», в поле «Add new source:» вставляем адрес rss-ленты. Ленты можно находить к примеру на liverss.ru либа на других каталогах RSS-лент. Нажимаем расположенную рядом кнопку «Syndicate».
feedwordpress-2
Через некоторое время видим фрагмент синдицированной ленты (или лент, если их несколько), выбираем нужную нам ленту и нажимаем кнопку рядом с этой лентой «Use this feed».
feedwordpress-3
Добавляем таким образом несколько лент, стараясь выбирать ленты отдающие не анонсы, а новости полностью.
4. Теперь нам надо иногда заходить в админ-панель блога в раздел «редактировать записи» подправлять и публиковать отложенные записи и удалять записи, которые не подходят нашему блогу (это если Вы выбрали не публиковать новые ленты, а помечать их как отложенные). Кроме этого Вы в любое время можете синдицировать новые записи в блог нажав кнопку «Update».

Блог не достаточно наполнить контентом. Контент должен быть уникальным. Уникализацию контента можно выполнять двумя способами — ручной и автоматический. Ручная уникализацию контента — это наиболее качественный, но в то же время наиболее времязатратный способ. Если же наша цель получить как можно больше страниц с уникальным контентом (а именно это нам и надо для продажи ссылок), то вполне уместно будет использовать автоматическую уникализацию контента.
Существует масса уникализаторов — автоматических и полуавтоматических, бесплатных и стоящих не малых денег. Так как изначально мы закладывались на минимальные затраты, то будем пользоваться бесплатным уникализатором. А так как наш блог строится на wordpress, то возьмем уникализатор в виде плагина под wordpress.
Установка и настройка уникализатора.
Качаем плагин — unikalizator wordpress plugin.
Установка плагина стандартная и не вызывает трудностей. После установки в настройках админ панели wordpress появляется вкладка «Уникализатор».
синонимайзер
Даже если вы не будете добавлять синонимы, уникализатором вполне можно пользоваться. Уникализация при этом будет не высока, но зато тексты останутся вполне читаемы.
Что умеет плагин unikalizatоr:
- Перемешивать абзацы — функция хороша тем, что абсолютно не портит читаемость текста.
- Перемешивать предложения в абзацах — функция, которая уже значительно портит читаемость текта, при этом дает не значительную иникализацию.
- Делать маленькую статью из большой (выжимку) — функция значительно меняет общюю картину статьи, оставляя при этом текст вполне читаемым. Тут нужно не переусердствовать с уровнем «ужимания».
- Заменять русские буквы на эквиваленты — эту фишку поисковики раскусили давно (очень давно), но и хуже от нее не будет.
- Ну и собственно — синонимизация, то ради чего плагин мы и ставили. И здесь важно не переусердствовать с уровнем синонимизации. Хотя считается что качество синонимизации в основном зависит от базы синонимов.

Важно! Функция «синонимизация» будет работать только тогда, когда вы самостоятельно заполните словарь синонимайзера. Сам плагин базы синонимов не содержит.
Базу синонимов можно скачать здесь — база синонимов. Из файла базы синонимов берем строки и вставляем в окно «Словарь Синонимайзера». Но делать это следует частями. Большую базу целиком плагин не проглотит.
синонимайзер база синонимов
Особенности работы уникализатора.
В предыдущей статье из серии мы настроили синдикатор (грабер статей) FeedWordPress таки образом, что синдицированные статьи не публиковались, а помечались как отложенные для публикации. Для уникализатора это также имеет значение. Уникализатор часто отказывается обрабатывать статьи с изображениями, потому перед публикацией (а именно в этот момент происходит уникализация) необходимо удалить из текста картинки.
К тому же не лишним будет оценить объем статьи. Статья из трех слов навряд ли будет качественно уникализарована.

Задача: нужно с пары сайтов брать свежие новости из лент. Никак не могу разобраться с этим - уже всю голову сломал. Т.е. на одном сайте новости создаются, появляются в ленте и должны транслироваться на другой сайт. Вроде бы все просто, но не тут-то было.
Разбираюсь с плагином FeedWordpress и столкнулся с проблемой — скачивается полная лента, т.е. вообще все записи, которые в ней есть. Как указать ему, чтобы скачивал только свежие записи начиная с какой-то даты, а не высасывал вообще все?

И еще. Попутный вопрос. Почему иногда пропадают добавленные ленты?

С AutoBlogged та же история - нет ограничения по дате. Т.е. ставлю в настройках брать 2 последние записи - берет нормально, проходит обновление - берет еще две записи, но более ранние. Таким образом, если нет свежих новостей, он тоже постепенно вытащит всю ленту.
Как выставить ограничения по дате?

Может кто-то знает другие плагины, может кто-то знает, где можно почитать о настройках. Любая ценная информация будет полезна. Заранее благодарен.
MAzZYBiG вне форума   Ответить с цитированием

2 комментария: