Другие журналы

электронный научно-технический журнал

ИНЖЕНЕРНЫЙ ВЕСТНИК

Издатель: Общероссийская общественная организация "Академия инженерных наук им. А.М. Прохорова".

Повышение качества данных с использованием методики поиска аномалий на примере Портала открытых данных правительства Москвы

Инженерный вестник # 08, август 2014
УДК: 004.052.42
Файл статьи: Orlov_A.pdf (591.21Кб)
авторы: Кузовлев В. И., Орлов А. О.

В статье рассматриваются наборы данных Портала открытых данных правительства Москвы. Выбранные наборы данных анализируются с точки зрения оценки информативности атрибутов. Излишняя информативность одних атрибутов приводит к обесцениванию других, что снижает общее качество набора данных и его пользу для конечного пользователя Портала открытых данных. Описаны механизмы оценки информативности атрибутов данных и методики поиска аномалий. Показаны результаты применения методики поиска аномалий, продемонстрирован эффект от применения методики, выражающийся в выравнивании информативности отдельных атрибутов данных. Дана общая оценка исследованным наборам данных.

Список литературы
1.    Кузовлев В. И., Орлов А. О. Метод выявления аномалий в исходных данных при построении прогнозной модели решающего дерева в системах поддержки принятия решений // Наука и образование. МГТУ им. Н. Э. Баумана. Электрон. журн. 2012. № 09. DOI: http://dx.doi.org/10.7463/0912.0483269
2.    Кузовлев В. И., Орлов А. О. Методика  выбора параметров и интерпретации результатов анализа выбросов в данных систем поддержки принятия решений // Вестник МГТУ им. Баумана. Сер. «Приборостроение». М. 2013. 10 с.
3.    Breunig M., Kriegel H.-P., T. Ng R., Sander J. LOF: Identifying Density-Based Local Outliers // Proceedings of the ACM SIGMOD International Conference on Management of Data. ACM Press. P. 93-104.
4.    Орлов А. О. Проблема поиска расстояний между значениями категориальных атрибутов при обнаружении выбросов в данных // В мире научных открытий. Красноярск, 2012. № 8.1. С. 142-155.
5.    Кузовлев В. И., Орлов А. О. Прогнозный анализ данных методом ID3O // Наука и образование. МГТУ им. Н. Э. Баумана. Электрон. журн. 2012. № 10. DOI: http://dx.doi.org/10.7463/1012.0483286
6.    Utgoff P. E. Incremental induction on Decision Trees // Machine Learning. 1989. V. 4. P. 161-186.
7.    Boriah S., Chandola V., Kumar V. Similarity measures for categorical data: A comparative evaluation // Proceedings of the 8th SIAM International Conference on Data Mining. Atlanta, 2008. P. 253-254.
8.    Вагин В. Н. и др. Достоверный и правдоподобный вывод в интеллектуальных системах / под ред. В. Н. Вагина, Д. А. Поспелова. 2-е изд., испр. и доп. М.: ФИЗМАТЛИТ, 2008. 712 с.


Тематические рубрики:
Поделиться:
 
ПОИСК
 
elibrary crossref neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (499) 263-69-71
  RSS
© 2003-2018 «Инженерный вестник» Тел.: +7 (499) 263-69-71