Услуги

Очистка и обогащение данных

Услуги очистки и обогащения данных

Удаление дубликатов

Наши алгоритмы позволяют идентифицировать и удалять дублирующуюся информацию применительно к изображениям, файлам и записям в базах данных. Мы готовы работать с четкими критериями определения дубликатов, а также, если они ещё не формализованы, мы подготовим описание критериев для Вас и проведём работу по удалению или же отметке дублирующихся записей в Ваших данных.

Идентификация и разметка схожей и нерелевантной информации (email, адреса, ФИО, телефоны, ИНН, КПП, ОГРН)

Во ряде случаев информация накопленная в Ваших базах данных может потребовать очистки и проверки на её корректность. Мы производим проверку данных на их корректность и отмечаем каждую запись соответствующей меткой характеризующей её релевантность.

Мы можем осуществлять проверку следующих данных:

  • коды ИНН, КПП, ОГРН, БИК
  • почтовые индексы
  • адреса электронной почты
  • номера телефонов и факсов
  • ФИО

Проверка существования и релевантности веб ссылок

При проверке информации содержащейся в каталогах сайтов, профилях пользователей и организаций часто возникает необходимость в проверке веб-ссылок.

Мы производим следующие проверки:

  • существует ли домен на который ведёт ссылка
  • существует ли веб-страница ссылки
  • определяем код ответа веб-сервера при запросе веб-страницы
  • разворачиваем редиректы между веб-страницами
  • проверяем находится ли домен на сервисе парковки доменов

Также, во Вашему запросу, мы можем производить и дополнительные проверки релевантности ссылок.

Обогащение веб-каталогов (добавление скриншотов сайтов, дополнительной мета-информации)

Если у Вас уже есть каталог веб-сайтов или же Вы хотите улучшить качество уже имеющегося каталога, мы можем помочь Вам в анализе сайтов и предоставлении Вам информации о сайтах в Вашем каталоге в структурированной форме.

Мы можем предоставить следующую информацию:

  • скриншоты веб страниц
  • заголовки сайтов
  • описания сайтов
  • метрики Alexa и Compete
  • RSS и ATOM каналы сайта (если есть)
  • кодировка веб страниц
  • CMS сайта
  • веб-сервер сайта
  • иная информация

Также, по Вашему запросу, мы можем предоставить другие информационные срезы по интересующим Вас веб-сайтам.

Обогащение информации об организациях за счёт расшифровки кодов ИНН, КПП, ОГРН, БИК, почтовых кодов и иной информации

Коды ИНН, КПП, ОГРН, БИК и многие другие содержат информацию об организации которая может быть использована для обогащения данных.

В частности, информацию об организации можно дополнить:

  • регионом местонахождения (по ИНН, КПП или ОГРН)
  • типом филиала если есть (по КПП)
  • информацией о налоговой инспекции (по ИНН, КПП, ОГРН)
  • годом регистрации (по ОГРН)
  • дополнительной информацией: адрес, контакты, реквизиты. При наличии кодов организации в нашей базе данных

Также мы можем расшифровывать и раскрывать информацию по другим государственным и коммерческим кодам классификации преобразуя их в человекочитаемые строки.