В этой статье мы будем прогнозировать, есть ли у пациента диабет или нет, на основе функций, которые мы предоставим нашей модели машинного обучения, и для этого мы будем использовать знаменитых индейцев пима. База данных диабета.

Диабет является вредным заболеванием в мире. Диабет, вызванный проблемами с весом или чрезмерным уровнем глюкозы в крови, и так далее. Он воздействует на гормон инсулин, участвующий в обычном метаболизме крабов, и повышает уровень сахара в крови. Диабет случается, когда фрейм больше не вырабатывает достаточного количества инсулина.

По данным (ВОЗ) Всемирной организации здравоохранения, около 422 миллионов человек страдают от диабета, особенно в странах с низкой прибылью или в странах с низким доходом. И это может быть увеличено до 490 миллиардов за 12 месяцев 2030 года. Однако заболеваемость диабетом наблюдается в разных странах, таких как Канада, Китай, Индия и т. д. Население Индии в настоящее время превышает сто миллионов, поэтому реальное количество диабетиков в Индии сорок миллионов. Диабет является основной причиной смерти в мире.

Раннее предсказание расстройства, такого как диабет, можно контролировать и спасти человеческую жизнь. Для этого в этой картине исследуется прогнозирование диабета с помощью различных атрибутов, связанных с диабетическим расстройством. По этой причине мы используем набор данных о диабете Pima Indian, мы практикуем различные типы машинного обучения и комплексные методы, чтобы предвидеть диабет. Машинное обучение — это метод, который используется для явного обучения компьютерных систем или машин.

Различные методы машинного обучения предлагают экологически чистый конечный результат для накопления знаний путем создания различных типов и наборов моделей из накопленного набора данных. Такие накопленные записи могут быть полезными для прогнозирования диабета. Различные стратегии машинного обучения могут успешно делать прогнозы, но трудно выбрать хорошую технику.

Здесь представлены шаги нашей модели машинного обучения:

  1. Анализ данных: здесь можно узнать о том, как выполняется часть анализа данных в жизненном цикле науки о данных.
  2. Исследовательский анализ данных: EDA является одним из наиболее важных этапов в жизненном цикле проекта по науке о данных, и здесь необходимо знать, как делать выводы на основе визуализаций и анализа данных.
  3. Построение модели: здесь мы будем использовать одну модель машинного обучения, которая является наиболее эффективной моделью.
  4. Сохранение модели: сохранение модели с помощью рассола, чтобы сделать прогноз на основе реальных данных.

Распределение пациентов с диабетом

Мы сделали версию, чтобы ожидать диабета, но набор данных стал почти несбалансированным, имея около 500 уроков, отнесенных к категории нулевого плохого образа жизни без диабета, и 268 уроков отнесенных к категории первого типа диабетического диабета.

Полученные результаты:

В этой картине были предприняты определенные шаги. Предлагаемый метод использует различные методы классов и ансамблей и применяет использование Python. Эти методы являются предпочтительными методами машинного обучения, используемыми для достижения приятной точности данных. На этих рисунках мы видим, что случайный классификатор лесных массивов достигает более высоких результатов по сравнению с другими. В целом, мы использовали удобные стратегии машинного обучения для прогнозирования и получения высокой общей точности производительности. На рисунке показан конечный результат этих методов машинного обучения.

Вывод:

Критическая цель этой миссии изменена, чтобы отформатировать и ввести в действие прогнозирование диабета с использованием методов машинного обучения и анализа производительности этих методов, и она была успешно выполнена. Предлагаемая методика использует многочисленные элегантные и ансамблевые методы обучения, в которых используются классификаторы SVM, Knn, Random Forest, Decision Tree, Logistic Regression и Gradient Boosting. И точность элегантности 77% была достигнута. Экспериментальные эффекты могут помочь здравоохранению сделать раннее предсказание и сделать раннее желание лечить диабет и сохранить людям жизнь.

Используемые технологии:

  1. Питон 3.7
  2. Панды
  3. NumPy
  4. Колба

Набор данных:

https://www.kaggle.com/uciml/pima-indians-diabetes-database