Наши проекты

Скиур: Автоматическое создание RSS лент

Скиур: Умный извлекатель новостей

portfoliosmall
Скиур / Извлечение RSS лент

Скиур - это экспериментальный сервис восстановления лент новостей из новостных веб страниц. Скиур анализирует веб страницу, находит новостные блоки и восстанавливает их извлекая даты, заголовки, ссылки и текст новости, позволяя подписаться на них в форматах RSS и ATOM.

История

Проект Скиур начался в августе 2008 как исследование возможности автоматического преобразования любой веб-страницы содержащей перечень новостей в такие форматы как RSS и ATOM. Результатом этих исследований оказалось что автоматическое преобразование возможно и был разработан специальный алгоритм и сервис позволяющий любому пользователю сети извлекать RSS ленту из любого сайта где по какой-либо причине такой ленты нет.

Технологии

  • Платформа разработки: Python + Django
  • СУБД: MySQL + CouchDb
  • Специализированная библиотека анализа веб сайтов: Persimmon