Услуги

Извлечение данных

Услуги извлечения данных

Извлечение данных из веб страниц

У нас имеется длительный опыт обработки веб-страниц и веб-сайтов и извлечения из них различного рода полуструктурированных данных и предоставления их в различных формах и в сохранении в базы данных.

Мы можем предоставить следующие услуги:

  • извлечение мета информации: кодировки страниц, ключевые слова, заголовки страниц и иная информация
  • извлечение табличных и полуструктурированных данных
  • поиск и подготовку данных о веб-сайтах для тематических каталогов
  • отслеживание изменений и обновлений веб-страниц и сайтов

Если у Вас есть потребность в дополнительной информации извлекаемой из веб-страниц и веб-сайтов извлечение которой поддаётся автоматизации напишите нам, мы сможем организовать извлечение по Вашему запросу.

Извлечение данных из документов

Мы умеем обрабатывать различные документы в форматах Microsoft Office и текстовых файлах и извлекать из них различную информацию.

Например, мы извлекаем следующие данные:

  • свойства документа: название, автор, организация и другие если они были заполнены
  • упоминаемые торговые марки
  • упоминаемые лица
  • телефоны, email, реквизиты организаций
  • иная информация

Извлечение данных из изображений

Часть информации об изображениях доступна всегда, доступность другой информации определяется форматом изображения. Мы можем извлечь следующие основные свойства:

  • мета-данные JPEG/JFIF
  • размеры изображений
  • глубина цветов
  • число фреймов (для анимированных изображений)
  • алгоритм и степень сжатия
  • цветовая палитра
  • гистограмма

Мы поддерживаем все основные форматы графических файлов: PNG, JPEG, GIF, ICO, WMF, а также готовы провести извлечени информации из иных, нестандартных форматов по Вашему запросу.

По Вашему запросу мы можем извлечь и иную информацию - как то преимущественные цвета изображения и иные данные. Напишите нам с описанием Вашей задачи и мы наверняка найдём подходящее для неё решение.

Извлечение данных из архивов

Существует множество различных способов архивации файлов и иногда возникают задачи по систематизации материалов хранящихся в архивах. Мы предоставляем услуги по извлечению следующей информации из архивных файлов:

  • тип и формат архива
  • алгоритм и степень сжатия архива
  • списки файлов
  • все или отдельные файлы

Мы поддерживаем все основные форматы архивов: ZIP, RAR, 7Z, ARJ, TAR.GZ, TAR.BZ2 и другие. Если же Вы столнулись с необходимостью извлечения информации из нестандартных архивных форматов или же помимо извлечения информации требуется и её обработка или конвертация, напишите нам и мы найдём оптимальный способ решения Вашей задачи.

Извлечение информации из нестандартных форматов файлов, документов, источников данных

Часто при работе с унаследованными системами возникает ситуация когда необходимо извлечь из них информацию или же перенести их в новой, более удобной форме. Бывают ситуация когда у Вас есть файлы и документы в которых содержится необходимая Вам информация и Вы хотели бы получить её в структурированом виде или же в других форматах. Мы готовы взяться за подобные задачи - всё что Вам нужно это прислать нам письмо с описанием того что Вам нужно и примерами файлов и документов из которых информацию необходимо извлечь. Мы проанализируем возможно ли это и как это может быть решено.