ИНФОРМАТИЗАЦИЯ ОБРАЗОВАНИЯ
3. Редирект
Есть некоторый балансировщик, который при обращении к сервису (например, http://site.com) дает клиенту редирект на конкретный сервер (например, http://server2.site.com). В случае HTTP это будет выглядеть как «HTTP redirect 302». Таким образом, код редиректа будет выглядеть как «временно перемещено» (moved temporary, рис. 3).
Рисунок 3. Балансировка нагрузки методом редиректа Достоинства метода:
Если запросы достаточно «тяжелые», то иногда имеет смысл использовать редирект даже для глобальной балансировки. У нас есть балансировщик, который с помощью редиректов отправляет запросы на обработку в разные дата-центры;
Метод также позволяет распределять разные типы запросов по разным серверам. Запросы вполне могут быть проанализированы.
Недостатки метода:
Он, как уже было сказано, применим к очень малому числу протоколов высокого уровня;
Для клиента на каждый запрос, получается, делается два запроса. Один – к нашему редиректору, второй – к серверу, который обрабатывает соединение. Это увеличивает время, через которое клиент получит окончательный ответ на свой запрос.
Аналитическое представление алгоритмов было реализовано в виде моделей модельно- ориентированного проектирования с целью дальнейшей верификацией алгоритмов. Для этой цели был
использован инструмент модельно-ориентированного проектирования Mathworks Simulink [4].
Фреймворк SimEvents [5] в составе Simulink разработан для визуального моделирования процессов с дискретно-событийной семантикой, в том числе, позволяет моделировать поведение мультипроцессорной / мультиядерной системы с неустойчивыми ресурсами. Данный фреймворк позволяет моделировать эффекты планирования (задержки и т.п.) и исследовать область проектирования запущенной задачи с помощью анализа влияния решений, принятых при планировании на производительность дизайна управления. Фреймворк предоставляет алгоритмы управления и делает возможным плавный переход к реализации алгоритма от модели через технологию автоматической генерации кода.
Рисунок 4. Модель планировщика для мультипроцессорной / мультиядерной системы управления На рис.4 показана модель Simulink с использованием фреймворка SimEvents, содержащая блок архитектурных компонент и блок функциональных компонент. Планировщик неявно подразумевает наличие определения задания (Task), которое является задачей, выполняющейся в реальном времени со следующими атрибутами: идентификатор, период, приоритет, сегменты (подзадачи). Планировщик моделирует гомогенную мультипроцессорную систему и определяется следующими свойствами:
количество процессов, политика планирования, взаимоисключающие ресурсы. Реализация архитектур- ного блока планировщика построена на высокоуровневом дискретно-событийном языке, поддерживае- мом Simulink. В свою очередь, данный язык полагается на интерпретатор MATLAB, который позволяет реализовать собственные политики планирования времени процессоров, что и было сделано, т.е.
реализация стандартной политики планирования была заменена. В нашем случае это были реализации первого из 3-х алгоритмов, описанных выше, на языке MATLAB.
На рис. 5 показан результат моделирования алгоритма DNS Round Robin с помощью инструмента Mathworks Simulink, в частности фреймворка SimEventsв его составе. Предполагается что оба процессора получили задания одновременно и оперируют, полагаясь на приоритеты поступающих задач. Так как у второго задания (Task 2 – красный (верхний) на рисунке) больший приоритет он размещен на первом процессоре (Core 1). При этом сегменты второго задания всегда размещаются перед размещением сегментов первого задания (Task 1).
Рисунок 5. Результат моделирования и оценка производительности модели (для 2-х процессов) для метода DNSRoundRobin
Таким образом, были рассмотрены распространенные программные алгоритмы балансировки, которые часто применяются для решения задачи распределения нагрузки в серверах, сайтах и т.д. В традиционных веб серверных архитектурах DNS балансировщик распределяет запросы к серверу основываясь на их статусе загруженности. Так как веб-серверы обязаны информировать DNS серверы об их статусе загрузки время от времени, так называемый буфер загрузки часто занят для уменьшения частоты обновлений. Без должного внимания, чрезмерное использование буфера загрузки может привести к избыточной осциляции внутри кластера. Все три рассмотренных метода помогают уменьше- нию эффекта осциляции на веб-серверах, что было проверено через реализацию их моделей с помощью модельно-ориентированного проектирования.
Список использованной литературы
1. Schroeder T., Goddard S., Ramamurthy B. Scalable Web server clustering technologies // IEEE Network. Volume: 14, Issue 3, May/Jun 2000. – pp. 38-45.
2. Paterno F. Model-Based Design and Evaluation of Interactive Applications. – Springer-Verlag London, UK, 1999. – 193 p.
3. Borkar G.M., Pund M.A., Jawade P. Implementation of Round Robin Policy in DNS for Thresholding of Distributed Web Server System // International Conference and Workshop on Emerging Trends in Technology (ICWET 2011). TCET, Mumbai, India. February 25 - 26, 2011. – pp. 198-201.
4. MathWorks, Simulink User’s Guide. The MathWorks Inc., Natick, MA, USA, 2016. – 3290p.
5. MathWorks, SimEvents User’s Guide. The MathWorks Inc., Natick, MA, USA, 2016. – 208p.
УДК 004.932 ГРНТИ 28.23.15
Ж.Р. Абдукаримов1, К.А. Айдаров2
1 студент 4 курса специальности «Информатика» Казахского Национального университета им. аль-Фараби, г. Алматы, Казахстан
2 старший преподаватель кафедры информатики Казахского Национального университета им. аль-Фараби, г. Алматы, Казахстан
МОДЕЛЬНО-ОРИЕНТИРОВАННОЕ ПРОЕКТИРОВАНИЕ АЛГОРИТМОВ ВЫДЕЛЕНИЯ КОНТУРОВ С РЕАЛИЗАЦИЕЙ ДЛЯ ПЛВМ
Аннотация
В данной работе рассматриваются методы обработки сигналов с целью написания алгоритма выделения контуров изображения и его дальнейшей реализации для устройств программируемых логических вентильных массивов (ПЛВМ). Объектом изучения являются способы обработки и анализа цифрового изображения или видео, а предметом возможно считать цифровое изображение или потоковое видео, содержащее высочайшие пространст- венные частоты. Были рассмотрены методы Робертса, Собеля, Превитта, Кирша, Marr-Hildreth. Указанные методы основываются на ключевом свойстве цифрового сигнала – разрывности. Была спроектирована модель, реализующая алгоритм Собеля с помощью инструмента модельно-ориентированного проектирования на основе пакета Mathworks Simulink. Построенная модель может быть адаптирована под другие аналогичные алгоритмы выделения контуров, а также преобразована в исполняемый на ПЛВМ код с помощью встроенного инструмента Mathworks HDL Coder.
Ключевые слова: выделение границ, метод Робертса, метод Собеля, метод Превитта, метод Кирша, метод Marr- Hildreth, модельно-ориентированное проектирование, обработка сигналов.
Аңдатпа
Ж.Р. Абдукаримов1, К.А. Айдаров2
1 Әл-Фараби атындағы Қазақ Ұлттық университеті, «Информатика» мамандығының 4 курс студенті, Алматы қ., Қазақстан
2 Әл-Фараби атындағы Қазақ Ұлттық университеті, Информатика кафедрасының аға оқытушысы, Алматы қ., Қазақстан
БЛВМ-ДЕ ОРЫНДАЛАТЫН КОНТУРЛАРДЫ ЕРЕКШЕЛЕУ АЛГОРИТМДЕРІН МОДЕЛЬГЕ БАҒЫТТАЛҒАН ЖОБАЛАУ
Ұсынылып отырған жұмыста кескіннің контурларын ерекшелеру алгоритмін жазу үшін сигналдарды өңдеу әдістері қарастырылады. Ары қарай олардың программалық логикалық вентильді массивтер (БЛВМ) негізіндегі құрылғылардағы орындалуы қарастырылған. Сандық бейнені өңдеу және талдау әдістері зерттеу объектісі болып табылады. Кеңістіктегі жоғары жиілікті сандық бейне немесе ағындық видео зерттеу пәні болып табылады. Робертс, Собель, Превитт, Кирш, Marr-Hildreth әдістері қарастырылған. Бұл әдістер сандық бейненің ең маңызды қасиеті – үзілулікке негізделген. Mathworks Simulink пакеті негізіндегі модельге бағытталған жобалау құралының көмегімен Собель алгоритмін жүзеге асыратын модель жобаланған. Құрылған модель контурларды ерекшелеудіңбасқа ұқсас алгоритмдеріне де бейімделуі мүмкін. Сонымен қатар, БЛВМ-де орнатылған Mathworks HDL Coder құралының көмегімен орындалатын кодқа түрлендірілді.
Түйінді сөздер: шекараларды ерекшелеу, Робертс әдісі, Собель әдісі, Превитт әдісі, Кирш әдісі, Marr-Hildreth әдісі, модельге бағытталған жобалау, сигналдарды өңдеу.
Abstract
Abdukarimov Zh.R.1, Aidarov K.A.2
1BCS student at al-Farabi Kazakh National University, Almaty, Kazakhstan
2Senior Lecturer at the Department of Computer Science, al-Farabi Kazakh National University, Almaty, Kazakhstan MODEL BASED DESIGN OF EDGE DETECTION ALGORITHMS WITH IMPLEMENTATION FOR FPGA
Given paper consider signal processing methods in order to write image edge detection algorithm and further implement it on field programmable gate array (FPGA) devices. Objects of study are methods of processing and analysis of digital image or video and as a subject of study can be considered digital image and streaming video containing highest spatial frequencies.
Methods studied for edge detection are Roberts, Sobel, Prewitt, Kirsch, Marr-Hildreth. Mentioned methods based on foundational property of digital signal called gradient.A model was designed which implements Sobel algorithm using model based design based on Mathworks Simulink package. Given model can be adapted for other similar algorithms of edge detection as well as transformed into executable on FPGA code with help of Mathworks HDL Coder embedded tool.
Keywords:edge detection, Roberts edge detector, Sobel edge detector, Prewitt edge detector, Kirsch edge detector, Marr- Hildreth edge detector, model based design, probabilistic modeling.
Определение краев изображения является начальным шагом во многих приложениях компьютерного зрения. Это свойство значительно уменьшает количество данных и отфильтровывает ненужную или незначительную информацию, а также дает значительную информацию об изображении. Данная инфор- мация используется в обработке изображения для определения объектов, в которых есть проблемы, такие как, ложные границы, отсутствующие или и низкоконтрастные пределы, проблемы с шумами и т.д.
Одной из методик определения краев изображения считается разведка точек, в частности определение контуров изображения. Объектом предоставленного изучения являются способы обработки и анализа цифрового изображения, а предметом возможно считать цифровое изображение, содержащее высочай- шие пространственные частоты. В данной работе были исследованы наиболее распространенные на данный момент алгоритмы выделения контуров изображения [1].
Оператор Робертса
Данный способ делает обычные и резвые вычисления двумерного пространственного измерения на изображении. Данный способ акцентирует внимание области высочайшей пространственной частоты, которые нередко отвечают краям. На вход оператора сервируется полутоновое изображение. Смысл пикселей выходного изображения во всякой точке подразумевает некоторое значение пространственного градиента входного изображения в данной же точке.
Рисунок 1. Маски оператора Робертса
Оператор Собеля
Этот способ обнаружения пределов пользуется приближением к производной [2-4]. Это разрешает показывать край в тех пространствах, где градиент самый возвышенный. Этот метод обнаруживает численность градиентов на изображении, что, наиболее подчеркивает области с высочайшей простран- ственной частотой, которые отвечают границам. В целом это привело к нахождениюдопускаемой безоговорочной величине градиента во всякой точке входного изображения. Этот оператор произведено из 2-х матриц, размером 3×3. Вторая матрица отличается от первой лишь только тем, собственно, что повернута на 90 градусов. Это аналогично и для оператора Робертса.
Рисунок 2. Маски оператора Собеля
Обнаружение пределов предыдущим способом вычислительно значительно легче, чем способом Собеля, но приводит к большей зашумленности результирующего изображения [5].
Оператор Превитта
Верным направлением в предоставленном методе была оценка величины и ориентация грани. В том числе и при том, собственно, что выделение пределов считается очень весьма ресурсоемкой задачей, подобный расклад выделяет очень удовлетворительные итоги. Этот метод основывается на применении масок объемом 3 на 3, которые предусматривают 8 вероятных направлений, но прямые направленности выделяют лучшие итоги. Все маски свертки рассчитаны.
Рисунок 3. Маски оператора Превитта Оператор Кирша
Метод реализован на применении использования всего одной маски, которую крутят по 8 ключевым направленностям: север, северо-запад, запад, юго-запад, юг, юго-восток, восток и северо-восток.
Размер грани определен как имеющий наибольший смысл, найденный с поддержкой маски.
Конкретное значение маски выдает наибольшее значение. К примеру, k0 соответствует вертикальной границе, величина k5 – диагональной. Заметим, собственно, что последние 4 маски практически эти же, как и 1-ые, они считаются зеркальным отблеском относительно центральной оси матрицы.
Рисунок 4. Маски оператора Кирша
Выделение контура методом Marr-Hildreth
Метод Marr-Hildreth применяетспособ обнаружения пределов в цифровых изображениях, который обнаруживает непрерывные кривые всюду, где приметны сильные градиенты и резко изменяющиеся конфигурации яркости группы пикселей. Это достаточно незатейливый способ работает с поддержкой свертки изображения с LoG-функцией или же как стремительная аппроксимация с DoG. Нули в обработанном итоге отвечают контурам. Метод граничного сенсора произведен из следующих шагов:
размытие изображения способом Гаусса;
использование оператора Лапласа к размытому изображению (часто 1-ые 2 шага соединены в один);
выполняем цикл вычислений и в полученном итоге обратим внимание на замену символа. В случае если сигнал поменялся с негативного на положительный и в полученной конфигурация смысла больше, чем пороговой точке, то квалифицировать данную точку, как границу;
Для получения наилучших итогов шаг с внедрением оператора Лапласа возможно исполнить сквозь гистерезис так, как это показано в методе Кэнни.
В данной работе был реализован один из вышеописанных методов, а именно оператор Собеля.
Несмотря на то что все вышеперечисленные алгоритмы подобраны таким образом, что могут быть реализованы на любой ПЛИС устройстве, возможности параллельной обработки для ПЛВМ дают значи- тельное преимущество использования оператора Собеля для обработки изображений. Основной идеей здесь является применение фиксированной маски значений к изображению оператора Собеля. Это умень- шит сложность алгоритма. Так как современные ПЛВМ являются реконфигурируемыми на уровне аппаратных инструкции, использование таких устройств дает значительный прирост эффективности вычислении для нестандартного набора задач.
В свою очередь, применение модельно-ориентированного проектирования делает верификацию и отладку оператора Собеля значительно проще и продуктивней. Модельно-ориентированное проектирова- ние является проверенным подходом, адресованным к трудностям и сложностям свойственным проектированию систем управления. Он является методом для создания сложных систем, использующий математические модели системных компонентов и их взаимодействий с окружающей средой [6].
Модельно-ориентированное проектирование, реализуемое в его максимально расширенном виде, дает гарантии использования единой среды проектирования, которая дает разработчикам привилегии использования целостной модели расширенной системы для оперирования информацией, ее качествен- ного визуального представления, верификации и обеспечения корректности, что в конце концов, делает возможным автоматическую генерацию кода с дальнейшим его портированием в ПЛВМ.
Модель реализованного алгоритма построена с помощью инструмента модельно-ориентированного проектирования Mathworks Simulink и его фреймворка Mathworks Computer Vision System Toolbox [7]. В модели реализовано выделение границ объекта белым цветом и наложение выделенных границ на исходное изображение. Функциональность построенной модели реализована внутри трех блоков (рис. 5):
блока преобразования кадра в пиксели, блока обработки потока пикселей в HDL (HardwareDefinitionLanguage – язык описания аппаратуры) модели, блока преобразования пикселей в кадр.
Рисунок 5. Модель системы, построенной для проверки алгоритма
Задачей блока преобразования кадра в пиксели является конвертация полного кадра изображения в поток пикселей. Для моделирования эффекта горизонтальных и вертикальных периодов мерцания
присутствующих в настоящих аппаратных видео системах, активное изображение дополняется данными отличными от оригинального изображения. Конфигурация блока преобразования кадра в пиксели показана на рисунке 6.
Внутри блока обработки потока пикселей в HDL модели находится подсистема, показанная на рисунке 7. Из данной подсистемы может быть автоматически сгенерирован код HDL для ПЛВМ при правильном подборе требуемых параметров.
Рисунок 6. Конфигурация блока преобразования кадра в пиксели
Рисунок 7. Подсистема обработки потока пикселей в HDL модели
Из-за природы обработки пиксельных потоков, блок выделения контуров в подсистеме обработки потока пикселей в HDL модели имеет задержки при работе. Данная задержка делает невозможным прямое взвешивание и соединение двух изображений для получения наложенной картинки. Для устранения данного недостатка HDL модели используется подсистема выравнивания видео, представлен- ная блоком посередине на рисунке 7. Данная подсистема выравнивания видео используется для синхро- низации двух пикселей перед их наложением друг на друга. Структурная реализация блока выравнивания видео, спроектированная на Simulink представлена на рисунке 8.
Рисунок 8. Подсистема выравнивания видео, спроектированная на Simulink
Основной идеей выравнивания пикселей является постановка в очередь пикселей, пришедших раньше, и соответственно извлекать отдельные пиксели из очереди, отслеживая синхронность сигналов в потоке пикселей с задержкой.
Блок преобразования пикселей в кадр имеет аналогичную конфигурацию с блоком преобразования кадра в пиксели, только работает наоборот, т.е. конвертирует поток пикселей обратно в полный кадр используя сигналы синхронизации.
На рисунке 9 показан тестовый запуск модели построенной с помощью инструмента модельно- ориентированного проектирования Mathworks Simulink, при использовании Computer Vision System Toolbox. В дальнейшем, планируется портирование модели на устройство ПЛВМ через генерацию кода с помощью инструмента HDL Coder, а также корректировании параметров модели для успешного испытания на внешнем устройстве.
Рисунок 9. Пример запуска модели, реализующей алгоритм выделения контуров через инструменты Mathworks Simulink
Обработка изображений – довольно быстро прогрессирующая дисциплина в компьютерном мире. Ее подъем базируется на больших достижениях в цифровой обработке изображений, развитие компьютер- ных микропроцессоров и приборов их обработки.
В предоставленной работе была предпринята попытка выучить на практике способы выделения контуров объектов, основанных на разрывах яркости из полутонового изображения. Изучение условной производительности всякого из приведенных в предоставленной работе способов, осуществлялся с поддержкой платформы модельно-ориентированного проектирования MATLAB.
Учитывая тот момент, что вопрос определения пределов на изображении в достаточной степени проанализирован в прогрессивной технической литературе, он все же до этого времени оставался довольно ресурсоемкой задачей, к примеру, как высококачественное выделение пределов всякий раз находится в зависимости от большого количества, влияющих на итог, моментов.
Список использованной литературы:
1. Стругайло В.В. Обзор методов фильтрации и сегментации цифровых изображений // Наука и образование:
научное издание МГТУ им. Н.Э. Баумана, № 05, 2012. – сс. 270-281.
2. Khairnar T., Harikiran, Chandgude A., Sivanantham S. Sivansankaran K. Image Edge Detection in FPGA //
Internernational Conference on Green Engineering and Technologies (IC-GET 2015). – Online Conference.
3. Chaple G., Daruwala R.D. Design of Sobel Operator based Image Edge Detection Algorithm on FPGA //
International Conference on Communication and Signal Processing, India, 2014. – pp. 788-792.
4. Pawar P.H. Patil R.P. FPGA Implementation of Canny Edge Detection Algorithm // International Journal of Engineering And Computer Science, Volume 3, Issue 10, 2014. – pp. 8704-8709.
5. Shimpi H., Gaikwad N., Dhage M., Pawar A.S. Implementation of Edge Detection Algorithm Using FPGA //
International Journal of Advanced Research in Electrical, Electronics and Instrumentation Engineering, Vol. 4, Issue 4, 2015.
– pp. 2193-2197.
6. Жуков К. Модельное проектирование встраиваемых систем в LabVIEW. – ДМК Пресс, 2011. – 688 с.
7. MathWorks, Simulink User’s Guide. – The MathWorks Inc., Natick, MA, USA, 2016. – 3290 p.
УДК 004.855 : 004.891.3 ГРНТИ28.23.25: 28.23.35
Amirgaliyev Y.N.1,3, Shamiluulu Sh.2, Aldabergen A.2
1Institute of Information Technologies,
2Department of Computer Science, Suleyman Demirel University, Kaskelen, Kazakhstan
3Institute of Information and Computing Technologies (IICT), Almaty, Kazakhstan
CLASSIFICATION OF HEART DISEASES BY USING MACHINE LEARNING ALGORITHMS Abstract
In the current research study, a performance analysis on four supervised machine learning algorithms has been performed i.e., k nearest neighbors, decision trees, naïve-base and logistic regression over scikit-learn ml framework on medical data for patients with heart disorders. The purpose of the research study is show the effect of feature correlation on classification model with over seven different performance metrics. Research study revealed that logistic regression and naïve-base methods are top in classifying patients with disorders with over 80% accuracy.
Keywords: Heart diseases, Machine Learning, Data Classification, Computer Diagnosis Аннотация
Е.Н. Амиргалиев 1,3, Ш.Шамильуулу 2, А.Алдаберген 2
1Институт Информационных Технологий,г. Алматы, Казахстан
2Кафедра Компьютерных Наук Университета Сулеймана Демиреля, г. Каскелен, Казахстан
3Институт Информационных и Вычислительных Технологий (ИИВТ), г. Алматы, Казахстан КЛАССИФИКАЦИЯ СЕРДЕЧНЫХ ЗАБОЛЕВАНИЙ
С ПОМОЩЬЮ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ
Используя данные о пациентах с пороками сердца, в данной исследовательской работе был выполнен анализ производительности на четырех алгоритмах машинного обучения, такие как knearestneighbors, decisiontrees, naïve- base и logisticregression с помощью программной платформы для машинного обучения scikit-learn. Цель данной исследовательской работы состоит в том, чтобы показать эффект корреляции атрибутов на классифицированной модели с более семи различными показателями производительности. Результаты исследовательской работы показали, что в нахождении пациентов с пороками сердца методы logisticregressionи naïve-base имеют самые высокие результаты точности со значениями более 80%.
Ключевые слова: Порок сердца, Машинное обучение, Классификация Данных, Компьютерная Диагностика.
Аңдатпа
Әмірғалиев Е.Н.1,3, Шамильуулу Ш.2, Алдаберген А.2
МАШИНАЛЫҚ ОҚЫТУ АЛГОРИМТДЕРІНІҢ КӨМЕГІМЕН ЖҮРЕК АУРУЛАРЫН АНЫҚТАУ ЖӘНЕ ЖІКТЕУ
1Ақпараттық Технологиялар Институты, Алматы қ., Қазақстан
2Компьютер Ғылымдары Кафедрасы,Сүлеймен Демирел Университеті, Қаскелең қ., Қазақстан
3Ақпараттық және Есептеу Технологиялары Институты (АЕТИ), Алматы қ., Қазақстан
Бұл зерттеу жұмысында scikit-learn машиналық оқытуға арналған программалық платформасының көмегімен жүрек ауруына шалдыққан науқастар жайлы мәліметтерді пайдалана отырып, k nearest neighbors, decision trees, naïve- base және logistic regression сынды машиналық оқыту алгоритмдерінің төрт түрінің өнімділігіне сараптама жасалын- ды.
Зерттеу жұмысының мақсаты – әртүрлі жеті өнімділік көрсеткіштерінқарастыра отырып, атрибуттар корреля- циясының жіктелу үлгісіне әсерін көрсету болып табылады. Зерттеу жұмысының нәтижесі бойынша жүрек ауруына ұшыраған науқастарды анықтауда logistic regression және naïve-base әдістері 80%-дан астам дәлдікпен аса жоғары нәтижеге қол жеткізуге болатынын көрсетті.
Түйінді сөздер: Жүрек аурулары, Машиналық Оқыту, Деректерді Жіктеу, Компьютер Сараптамасы І Introduction
Presently computer-aided diagnostic systems used in various areas of medicine such as prognosis, diagnosis, treatment of illnesses and patient follow-ups. In this area which is very complex and uncertain, the clinical decision support systems employ different state of the art intelligent systems such as fuzzy logic, artificial neural network and genetic algorithm [1].
Heart diseases have emerged as the number one killer in both urban and rural areas in most of the countries according to Centers for Disease Control and Prevention (CDC). The statistical evidences states that heart diseases accounts 1 in every 4 deaths. Of these deaths, 150,000 are under the age of 65, according to the Million Hearts Foundation. As of 2010, it is the leading cause of death in the U.S., England and Canada, accounting for 25.4% of the total deaths in the United States. Similar situation is found rest of the countries all over the world [2]. In case of heart disease time is very crucial to get correct diagnosis in early stage. Patient having chest pain complaint may undergo unnecessary treatment or admitted in the hospital. In most of the developing countries specialists are not widely available for the diagnosis. Hence, such automated system can help to medical community to assist doctor for the accurate diagnosis well in advance [3].
In domain heart disease risk, smoke, cholesterol, blood pressure, diabetes, sex and age are main risk factors that have direct relation with heart diseases [4]. Because of the many and uncertain risk factors, many times heart disease diagnosis becomes hard task for experts. In the other word, there exists no strict boundary between healthy and unhealthy states [5]. Having so many factors to analyze in-order to diagnose the heart disease of a patient, makes the physician’s job difficult. So, experts require an accurate tool that considers these risk factors and show certain result in uncertain term. It is clear that automation of the process of analyzing and identifying the diseases is obvious and accordingly this opens the doors for efficient decision support systems that can help to deal with large amount of information. In this case machine learning is an efficient and important tool in medicine that eases the process of identifying diseases according to symptoms and medical data.
Motivated by the need of such an important tool, in this study, we performed a comparative analysis between several machine learning algorithms for heart diseases medical data. Several algorithms were trained in order to compare and get the best model among them. The dataset was taken from UCI Machine Learning Repository and was used for number of researches in Machine Learning.
II Literature Review
This section reviews several studies related to applications of machine learning algorithms for examining medical data. It can be seen that a great variety of methods were used which reached high classification accuracies using the datasets generally taken from UCI-ML repository. Moriset al. used logistic regression algorithm on heart diseases dataset. By applying various preprocessing techniques, he achieved in obtaining 77.0% of classification accuracy [6]. Further, Kamruzzaman et al. proposed a neural network ensemble based methodology for diagnosing of the heart disease diagnosis and achieved prediction accuracy over 80% [7]. Moreover, Das et al. [8]
in 2008 applied genetic algorithm (GA) based Neuro Fuzzy Techniques for breast cancer identification and adaptive neuro fuzzy classifier has been introduced to classify the tumor mass in breast.On more study where authors implemented fuzzy neural network for survey work on medicine [9]. In their study, the Zhang et al., reviewed the position of the art for the application of fuzzy neural network in diagnosis, recognition, image processing and intelligence robot control of medicine with the overall accuracy of 70%. Tanriverdi et al. proposed