Google Reader покажет новости сайтов без RSS

В Google Reader можно подписаться на новости сайтов, на которых нет RSS. Технология, которую для этого использует Google, достаточно примитивна - во многих случаях имеет смысл пользоваться другими решениями.

В Google Reader появилась возможность подписываться на новости даже с тех сайтов, на которых нет RSS. Для этого необходимо переключиться на английский язык интерфейса и попытаться подписаться на любой сайт. Google Reader сообщит, что RSS-фида на странице не содержится, и предложит его самостоятельно создать. После чего Google периодически будет проверять обновления страницы и сообщать о них пользователю Reader.

Для импорта RSS Google пользуется простейшей технологией - смотрит, меняется ли страница, и если она изменилась - сообщает об этих изменениях. Так же работают такие веб-проекты, как Page2rss или Femtoo. Эта технология имеет очевидные недостатки - если на странице есть новостные и неновостные блоки, будут ретранслироваться в том числе и изменения последних, что создаст ненужный шум.

Кроме того, новости передаются достаточно неаккуратно - может быть ошибочно заполнено поле даты или заголовка.

По другой технологии работает «Скиур». Главное отличие «Скиура», рассказал его создатель Иван Бегтин, в том, что он анализирует страницу и выявляет там новостные ленты, а далее новостная лента «восстанавливается» из новостей сайта. Это менее универсально, чем мониторинг каждой отдельной страницы, но более точно, поскольку воспроизводит дату, заголовок, текст и ссылку, ассоциированные с данной новостью на сайте. Отслеживание изменений на странице (как в Google Reader), сообщил г-н Бегтин, работает практически с любой веб-cтраницей, за исключением страниц слишком большого размера или тех где при изменении меняется структура страницы. Восстановление новостей, как это сделано в «Скиуре», будет работать во всех случаях, когда на сайте есть последовательность новостных записей как минимум с заголовком и датой публикации.

Источник: http://ruformator.ru/news/article060E2/default.asp

0
652
0