Услуги извлечения данных
Извлечение данных из веб страниц
У нас имеется длительный опыт обработки веб-страниц и веб-сайтов и извлечения из них различного рода полуструктурированных данных и предоставления их в различных формах и в сохранении в базы данных.
Мы можем предоставить следующие услуги:
- извлечение мета информации: кодировки страниц, ключевые слова, заголовки страниц и иная информация
- извлечение табличных и полуструктурированных данных
- поиск и подготовку данных о веб-сайтах для тематических каталогов
- отслеживание изменений и обновлений веб-страниц и сайтов
Если у Вас есть потребность в дополнительной информации извлекаемой из веб-страниц и веб-сайтов извлечение которой поддаётся автоматизации напишите нам, мы сможем организовать извлечение по Вашему запросу.
Извлечение данных из документов
Мы умеем обрабатывать различные документы в форматах Microsoft Office и текстовых файлах и извлекать из них различную информацию.
Например, мы извлекаем следующие данные:
- свойства документа: название, автор, организация и другие если они были заполнены
- упоминаемые торговые марки
- упоминаемые лица
- телефоны, email, реквизиты организаций
- иная информация
Извлечение данных из изображений
Часть информации об изображениях доступна всегда, доступность другой информации определяется форматом изображения. Мы можем извлечь следующие основные свойства:
- мета-данные JPEG/JFIF
- размеры изображений
- глубина цветов
- число фреймов (для анимированных изображений)
- алгоритм и степень сжатия
- цветовая палитра
- гистограмма
Мы поддерживаем все основные форматы графических файлов: PNG, JPEG, GIF, ICO, WMF, а также готовы провести извлечени информации из иных, нестандартных форматов по Вашему запросу.
По Вашему запросу мы можем извлечь и иную информацию - как то преимущественные цвета изображения и иные данные. Напишите нам с описанием Вашей задачи и мы наверняка найдём подходящее для неё решение.
Извлечение данных из архивов
Существует множество различных способов архивации файлов и иногда возникают задачи по систематизации материалов хранящихся в архивах. Мы предоставляем услуги по извлечению следующей информации из архивных файлов:
- тип и формат архива
- алгоритм и степень сжатия архива
- списки файлов
- все или отдельные файлы
Мы поддерживаем все основные форматы архивов: ZIP, RAR, 7Z, ARJ, TAR.GZ, TAR.BZ2 и другие. Если же Вы столнулись с необходимостью извлечения информации из нестандартных архивных форматов или же помимо извлечения информации требуется и её обработка или конвертация, напишите нам и мы найдём оптимальный способ решения Вашей задачи.
Извлечение информации из нестандартных форматов файлов, документов, источников данных
Часто при работе с унаследованными системами возникает ситуация когда необходимо извлечь из них информацию или же перенести их в новой, более удобной форме. Бывают ситуация когда у Вас есть файлы и документы в которых содержится необходимая Вам информация и Вы хотели бы получить её в структурированом виде или же в других форматах. Мы готовы взяться за подобные задачи - всё что Вам нужно это прислать нам письмо с описанием того что Вам нужно и примерами файлов и документов из которых информацию необходимо извлечь. Мы проанализируем возможно ли это и как это может быть решено.





