• Ешқандай Нәтиже Табылған Жоқ

МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ОБРАЗОВ

In document Х А Б А Р Ш Ы С Ы (бет 110-115)

BULLETIN OF NATIONAL ACADEMY OF SCIENCES OF THE REPUBLIC OF KAZAKHSTAN

ISSN 1991-3494

Volume 2, Number 366 (2017), 110 – 114

I. B. Karymsakova, N. F. Denissova

D. Serikbayev East Kazakhstan state technical university, Ust-Kamenogorsk, Kazakhstan.

E-mail: [email protected], [email protected]

METHODS OF DATA MINING

живания тенденции изменения гранулометрического состава шарообразных тел в условиях конвейера, но и для достаточно точного определения гранулометрического состава.

Ключевые слова: распознавание образов, data mining, методы интеллектуального анализа данных, ней- ронные сети.

Распознавание образов в настоящее время охватывает широкий круг задач, связанных с рас- познаванием букв, распознаванием речи, автоматическим управлением, с технической и медицин- ской диагностикой, с обучением автоматов и разработкой адаптивных систем.

Распознавание образов является одной из важнейших задач искусственного интеллекта.

Распознавание образов – отнесение объекта или события к одному или нескольким предопреде- ленным категориям [1].

При построении системы компьютерного зрения разработчику приходится применять основы обработки изображений, выбирать методику детектирования и распознавания объектов, про- граммно реализовывать получение сырых данных и метод распознавания образов. Далее идет этап тестирования, на котором проводится статистический анализ и дорабатываются методы, для того чтобы получить достоверные результаты [2].

Интеллектуальный анализ данных (data mining) – это процесс получения и применения знаний или ранее неизвестной информации из уже имеющихся доступных данных. Под этим понятием скрывается разнообразие информационных технологий и процессов, при помощи которых входные

"сырые" данные обрабатываются, очищаются и анализируются.

Data Mining – это мультидисциплинарная область, возникшая и развивающаяся на базе таких наук, как прикладная статистика, распознавание образов, искусственный интеллект, теория баз данных и других смежных наук [3].

Методы распознавания образов принято разделять на: детерминистские и статистические методы. Некоторые методы имеют и детерминистскую, и статистическую трактовку. Это касается следующих методов: метода потенциальных функций, методов ближайшего соседа и K ближайших соседей.

Детерминистские методы решения задач распознавания: Построение решающих правил, Метод построения эталонов, Метод дробящихся эталонов, Линейные решающие правила, Метод ближайших соседей, Метод потенциальных функций, Структурные (лингвистические) методы.

Статистические методы решения задач распознавания: Метод ближайших соседей, Парамет- рическое оценивание распределений, Метод максимума правдоподобия, Распознавание при неиз- вестных априорных вероятностях образов, Минимаксный критерий, Критерий Неймана-Пирсона, Последовательные процедуры распознавания, Аппроксимационный метод оценки распределений по выборке, Иерархические системы распознавания [4].

Основные методы интеллектуального анализа данных, используемые в задачах распознавания образов: искусственная нейронная сеть (NN), метод k ближайших соседей (k-NN), деревья решений (DT), индуктивный вывод правил (RI), метод опорных векторов (SVM), многослойный персептрон (MLP), байесовский классификатор (NB), метод линейной регрессии (LR), линейный дискрими- нантный анализ (LDA [5].

С использованием методов распознавания образов построены компьютерные системы, кото- рые используются для решения задач из области интеллектуального анализа данных.

1. Обработка данных дистанционного зондирования земной поверхности. Рассматривалась задача классификации подстилающих поверхностей Земли по данным космического спектро- метрирования и распознавание нефтеносности месторождений определенных участков по резуль- татам изучения близлежащих водоносных пластов. Решались задачи выделения объектов на фотоснимках и обновление снимков земной поверхности по цифровым картам. Предложенные подходы позволили автоматизировать режим обновления фотоснимков на основе совмещения снимков с цифровыми картами.

2. Обработка медицинских данных. На основе технологических и структурных решений, в результате практического взаимодействия со специалистами-медиками, была разработана серия компьютерных систем «Орто-Эксперт». Назначение этих компьютерных систем: поддержка процессов диагностики и лечения больных с нарушениями опорно-двигательного аппарата.

Практическое использование этой компьютерной системы обеспечило эффективное обследование, обоснованную диагностику и выбор соответствующего метода лечения пациентов. Это позволило повысить качество диагностики ортопедических заболеваний и травм и существенно сократить сроки реабилитации пациентов [6].

3. Определение гранулометрического состава рудных концентратов. Для технологических линий сверхтонкого измельчения в горно-обогатительном производстве необходимость снижения себестоимости и повышения технико-экономических показателей обогащения руды ставит задачи совершенствования технологии обогащения и, в частности, технологий рудо - подготовки. Глав- ный технологический и экономический производственный резерв заключается в уменьшении затрат на транспортирование горной руды и энергетических затрат на переработку доменной руды, которая может быть выделена и выведена из общей массы сырья, поступающего на техноло- гические линии обогащения.

Именно по экономическим и технологическим соображениям предварительное обогащение руды является неотъемлемой частью общей технологии добычи и переработки полезных иско- паемых, различных видов техногенного сырья в горно-обогатительном производстве [7].

В настоящее время обоснована схема искусственной нейронной сети, способной обучаться распознаванию образов. Основные характеристики искусственных нейронов, из которых построена сеть, соответствуют известным физиологическим данным. При этом учтены также и некоторые результаты самых последних исследований в этой области. Предлагаемая искусственная нейронная сеть способна хорошо различать образы даже при сильных искажениях.

Созданы такие устройства, как генератор искусственных образов для распознавания, которые предлагается использовать вместо естественно получаемых выборок натуральных образов. При условии, что угадана природа искажений, порождающих нужный класс, такой метод оказывается существенно более удобным и дешевым по сравнению с традиционными методами.

Предлагаемый генератор в качестве эталонного образа может использовать любое изобра- жение, например, осциллограмму, письменный знак или фотографию. Набор допустимых преобра- зований включает в себя при этом как деформации плоскости изображений типа растяжений по осям x и y, поворота и сдвига, так и разного рода контролируемое «зашумление» [8].

В задачах распознавания гранулометрического состава рудных концентратов в техноло- гических линиях сверхтонкого измельчения в основном используется нейросетевой алгоритм распознавания, а также метод формирования презентативных обучающей и тестовых выборок, требуемых для эффективного обучения и верификации нейросетевой системы.

Отслеживание и поддержание гранулометрического состава в определенных пределах явля- ется важной задачей при контроле и управлении качеством сырья в технологических линиях сверхтонкого измельчения в горно-обогатительном производстве.

Трехмерная модель набора шарообразных тел генерируется в соответствии с алгоритмом по размеру диаметров тел. По информации, взятой с поверхности набора, нужно определить весовое содержание шарообразных тел в каждой из шести категорий – гранулометрический состав.

Рисунок 1 – Структура нейросети

Нейросетевая постановка задачи. По признакам, выбранным с огибающей поверхности набора, с помощью нейросети нужно получить шестимерный выходной вектор, отвечающий весовому содержанию тел в каждой категории.

Эксперименты проводились с двухслойными нейросетями с прямыми последовательными связями. Функция активации первого слоя – сигмоидная, второго слоя – положительно-линейная функция. Нейронные сети обучались по правилу обратного распространения ошибки.

Обучающая выборка состояла из 1300 примеров, тестовая – из 200. Для значений входного вектора вычислялось максимальное значение M для всех огибающих в обучающей и тестовой выборках (оно получилось равным 170). Создавался нулевой вектор размерностью M. Для каждой точки огибающей поверхности вычислялось значение p по координате z(вертикальная ось), после чего значение p-й компоненты инкрементировалось на единицу. После обработки всей огибающей получался вектор, каждая p-я компонента которого содержала количество точек с координатой p.

Рисунок 2 – Огибающая набора

Результаты оценки гранулометрического состава нейросетью имеют большую точность, чем результаты оценки с помощью гипотетического алгоритма (таблица).

Ошибки распознавания сетями, обученными на расширенную выборку

Ошибка Категория

+18 мм 18+16 мм 16+14 мм 14+10 мм 10+5 мм 5 мм

H1 = 100 11.92 5.58 6.5 5.48 3.74 4.79

H1 = 300 3.65 4.0 3.85 3.1 2.66 2.34

H1 = 500 2.74 3.5 3.55 2.68 2.1 1.9

H1 = 800 2.36 3.22 3.01 2.5 2.16 1.6

H1 = 1000 2.36 3.16 3.19 2.55 1.98 1.28

Нейросетевое распознавание может быть с успехом применено не только для отслеживания тенденции изменения гранулометрического состава шарообразных тел в условиях конвейера, но и для достаточно точного определения гранулометрического состава [9-12].

ЛИТЕРАТУРА

[1] Форсайт Д., Понс Д. Компьютерное зрение. Современный подход. – М.: Вильямс, 2004. – 928 с.

[2] Гонсалес Р., Вудс Р. Цифровая обработка изображений. – М.: Техносфера, 2005. – 1072 с.

[3] Чубукова И.А. Курс лекций «Интеллектуальный анализ данных». – Украина, Киев, 2007. – 328 с.

[4] Волошин Г.Я. Методы распознавания образов. – М.: Техносфера, 2003. – 320 с.

[5] Чубукова И.А. Курс лекций «Интеллектуальный анализ данных». – Украина, Киев, 2007. – 328 с.

[6] Chen C.H., Rau L.F., Wang P.S.P. Handbook of pattern recognition and computer vision. – Singapore–New Jersey–

London–Hong Kong: World Scientific Publishing Co. Pte. Ltd., 1995. – 984 p.

[7] Цвиркун С.Л. Предварительная магнитная сортировка кусковой железной руды – метод повышения энерго- эффективности и ресурсосбережения горного производства // Вісник Криворізького національного университету. – 2012.

– Вип. 30.

[8] Лепский А.Е., Броневич А.Г. Математические методы распознавания образов: Курс лекций. – Таганрог: изд-во ТТИ ЮФУ, 2009. – 155 с.

[9] Казанцев П.А., Лодягин А.М., Коробкова С.В. Нейросетевое распознавание гранулометрического состава набора шарообразных тел по огибающей поверхности // Нейроинформатика. – 2006. – Ч. 2.

[10] Козин В.З. Исследование руд на обогатимость. – Урал. гос. горный ун-т. – Екатеринбург: Изд.-во УГГУ, 2008. – 312 с.

[11] Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. – М.: Техносфера, 2006. – 616 с.

[12] Форсайт Д., Понс. Д. Компьютерное зрение. Современный подход. – М.: Вильямс, 2004. – 928 с.

REFERENCES

[1] Chen C.H., Rau L.F., Wang P.S.P. Handbook of pattern recognition and computer vision. Singapore–New Jersey–

London–Hong Kong: World Scientific Publishing Co. Pte. Ltd., 1995. 984 p.

[2] Youguo Pi. Theory of Cognitive Pattern Recognition // http://cdn.intechopen.com/pdfs/5795/InTech- theory_of_cognitive_pattern _recognition.pdf

[3] Arbib M. The handbook of brain theory and neural networks. London: MIT Press, 2003. 1309 p.

[4] Free encyclopedia Wikipedia, access mode: http://ru .wikipedia.org/wiki/%

D0%90%D0%B3%D0%B5%D0%BD%D1%82

[5] Educational drafts of the Chronicle, access mode: http://letopisi .org/index.php/%

D0%90%D0%B3%D0%B5%D0%BD%D1%82

[6] Lin H. Architectural Design of Multi-Agent Systems: Technologies and Techniques, University of Houston – Downtown, USA, New York, 2007. 417 p.

[7] National Open University "INTUIT" http://www.intuit.ru/studies/courses/10618/1102/lecture/17397?page=2 [8] National Open University "INTUIT" http://www.intuit.ru/studies/courses/13833/1230/lecture/24081

[10] Zhao W., Chellappa R., Rosenfeld A., Phillips P.J. Face Recognition: A Literature Survey, ACM Computing Surveys, 2003. P. 399-458.

[11] Lu X. Image Analysis for Face Recognition, personal notes, May 2003, 36 p.

[12] Moon H., Phillips P.J. Computational and Performance aspects of PCA-based Face Recognition Algorithms, Perception, Vol. 30, 2001, P. 303-321.

[13] Turk M.A., Pentland A.P. Face Recognition Using Eigenfaces, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 3-6 June 1991, Maui, Hawaii, USA. P. 586-591.

[14] Liu C., Wechsler H. Comparative Assessment of Independent Component Analysis (ICA) for Face Recognition, Proc.

of the Second International Conference on Audio- and Video-based Biometric Person Authentication, AVBPA'99, 22-24 March 1999, Washington D.C., USA. P. 211-216.

[15] Pentland A., Moghaddam B., Starner T. View-Based and Modular Eigenspaces for Face Recognition, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 21-23 June 1994, Seattle, Washington, USA. P. 84-91.

И. Б. Карымсакова, Н. Ф. Денисова

Д. Серікбаев атындағы Шығыс-Қазақстан мемлекеттік техникалық университеті, Өскемен, Қазақстан БЕЙНЕЛЕРДІ ТАНУ ЕСЕПТЕРІНДЕГІ МƏЛІМЕТТЕРДІ ИНТЕЛЛЕКТУАЛДЫ ТАЛДАУ ƏДІСТЕРІ

Аннотация. Бейнелерді тану жасанды интеллекттің негізгі салалырының бірі. Бұл мақалада бейнелерді танудың детерминисттік жəне статистикалық əдістері қарастырылады. Бейнелерді тану есептерінде қолда- нылатын мəліметтерді интеллектуалды талдаудың негізгі əдістері келтірілген. Бейнелерді тану əдістерін қолдануымен құрылған мəліметтерді интеллектуалды талдау саласындағы ессептерді шешуге қолданылатын компьютерлік жүйелер мысалдары қарастырылған: жер бетін дистанциялық зондылау мəліметтерін өңдеу, медициналық мəліметтерді өңдеу, рудалық концентраттардың гранулометрикалық құрамын анықтау. Бұл мақалада бейнелерді танудың нейрожелілік алгоритмін қолдану мысалы, оқыту жəне тестілік іріктемелерді құру, нейрожелілік бейнелерді тану жəне оны қолдану мүмкіндіктері қарастырылған.

Түйін сөздер: бейнелерді тану, data mining, мəліметтерді талдаудың интеллектуалды əдістері, нейрон- дық желілер.

Сведения об авторах:

Карымсакова Индира Бекеновна – магистр информационных систем, Восточно-Казахстанский госу- дарственный технический университет им. Д. Серикбаева, старший преподаватель кафедры «Информа- ционные системы и компьютерное моделирование», [email protected]

Денисова Наталья Федоровна – к.ф.-м.н., доцент, Восточно-Казахстанский государственный техничес- кий университет им. Д. Серикбаева, декан факультета Информационных технологий и бизнеса, [email protected]

BULLETIN OF NATIONAL ACADEMY OF SCIENCES OF THE REPUBLIC OF KAZAKHSTAN

ISSN 1991-3494

Volume 2, Number 366 (2017), 115 – 121

А. М. Nyssanbayeva

International Kazakh-Turkish university named by Kh. A. Yesevi, Turkestan, Kazakhstan.

E-mail: [email protected]

ASPECTS OF DEVELOPMENT OF THE GENDER EDUCATION

In document Х А Б А Р Ш Ы С Ы (бет 110-115)

Outline

СӘЙКЕС КЕЛЕТІН ҚҰЖАТТАР