Услуги очистки и обогащения данных
Удаление дубликатов
Наши алгоритмы позволяют идентифицировать и удалять дублирующуюся информацию применительно к изображениям, файлам и записям в базах данных. Мы готовы работать с четкими критериями определения дубликатов, а также, если они ещё не формализованы, мы подготовим описание критериев для Вас и проведём работу по удалению или же отметке дублирующихся записей в Ваших данных.
Идентификация и разметка схожей и нерелевантной информации (email, адреса, ФИО, телефоны, ИНН, КПП, ОГРН)
Во ряде случаев информация накопленная в Ваших базах данных может потребовать очистки и проверки на её корректность. Мы производим проверку данных на их корректность и отмечаем каждую запись соответствующей меткой характеризующей её релевантность.
Мы можем осуществлять проверку следующих данных:
- коды ИНН, КПП, ОГРН, БИК
- почтовые индексы
- адреса электронной почты
- номера телефонов и факсов
- ФИО
Проверка существования и релевантности веб ссылок
При проверке информации содержащейся в каталогах сайтов, профилях пользователей и организаций часто возникает необходимость в проверке веб-ссылок.
Мы производим следующие проверки:
- существует ли домен на который ведёт ссылка
- существует ли веб-страница ссылки
- определяем код ответа веб-сервера при запросе веб-страницы
- разворачиваем редиректы между веб-страницами
- проверяем находится ли домен на сервисе парковки доменов
Также, во Вашему запросу, мы можем производить и дополнительные проверки релевантности ссылок.
Обогащение веб-каталогов (добавление скриншотов сайтов, дополнительной мета-информации)
Если у Вас уже есть каталог веб-сайтов или же Вы хотите улучшить качество уже имеющегося каталога, мы можем помочь Вам в анализе сайтов и предоставлении Вам информации о сайтах в Вашем каталоге в структурированной форме.
Мы можем предоставить следующую информацию:
- скриншоты веб страниц
- заголовки сайтов
- описания сайтов
- метрики Alexa и Compete
- RSS и ATOM каналы сайта (если есть)
- кодировка веб страниц
- CMS сайта
- веб-сервер сайта
- иная информация
Также, по Вашему запросу, мы можем предоставить другие информационные срезы по интересующим Вас веб-сайтам.
Обогащение информации об организациях за счёт расшифровки кодов ИНН, КПП, ОГРН, БИК, почтовых кодов и иной информации
Коды ИНН, КПП, ОГРН, БИК и многие другие содержат информацию об организации которая может быть использована для обогащения данных.
В частности, информацию об организации можно дополнить:
- регионом местонахождения (по ИНН, КПП или ОГРН)
- типом филиала если есть (по КПП)
- информацией о налоговой инспекции (по ИНН, КПП, ОГРН)
- годом регистрации (по ОГРН)
- дополнительной информацией: адрес, контакты, реквизиты. При наличии кодов организации в нашей базе данных
Также мы можем расшифровывать и раскрывать информацию по другим государственным и коммерческим кодам классификации преобразуя их в человекочитаемые строки.





