Давайте рассмотрим простой пример контролируемого алгоритма машинного обучения для классификации с использованием известного набора данных Iris. Мы будем использовать Python и библиотеку Scikit-learn для создания базового классификатора дерева решений.
Шаг 1: Импортируйте необходимые библиотеки
импортировать numpy как np
импортировать панд как pd
из sklearn.model_selection импорта train_test_split
из sklearn.tree импортировать DecisionTreeClassifier
из sklearn.metrics импорта precision_score
Шаг 2. Загрузите и изучите набор данных
# Загрузите набор данных Iris из Scikit-learn
из sklearn.datasets импортировать load_iris
диафрагма = load_iris()
# Создайте Pandas DataFrame с функциями и целью
данные = pd.DataFrame (данные = np.c_[радужная оболочка ['данные'], радужная оболочка ['цель']],
. столбцы = радужная оболочка ['feature_names'] + ['target'])
# Показать первые несколько строк набора данных
печать (данные.голова())
Шаг 3: Подготовьте данные
# Разделите функции (X) и цель (y)
X = data.drop («цель», ось = 1)
у = данные ['цель']
# Разделить данные на наборы для обучения и тестирования
X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0,2, random_state = 42)
Шаг 4: Создайте и обучите классификатор
# Инициализировать классификатор дерева решений
классификатор = DecisionTreeClassifier()
# Обучаем классификатор на обучающих данных
classifier.fit(X_train, y_train)
Шаг 5: Сделайте прогнозы на тестовых данных
# Предсказать целевые значения для тестовых данных
y_pred = классификатор.predict(X_test)
Шаг 6: Оцените модель
# Рассчитать точность модели
точность = показатель_точности (y_test, y_pred)
print("Точность:", точность)
В этом примере мы использовали классификатор дерева решений для классификации цветов ириса на три вида (сетоза, разноцветный и виргинский) на основе их длины чашелистиков, ширины чашелистиков, длины лепестков и ширины лепестков. Точность модели говорит нам, насколько хорошо она может предсказывать виды цветков ириса на невидимых данных.
Помните, что это всего лишь базовый пример. Существует множество других алгоритмов машинного обучения и более сложных наборов данных, которые вы можете изучить по мере продвижения в своем путешествии по машинному обучению.