"Воображение важнее знаний. Поскольку знание определяет все, что мы в настоящее время знаем и понимаем, воображение указывает на все, что мы еще можем открыть и создать». - "Альберт Эйнштейн"

Воображение и визуализация дают представление о данных гораздо больше, чем числовые значения и текстовые выводы. Команде аналитиков данных обычно легче выступать перед аудиторией, у которой мало знаний о данных и процессах, за которыми следует команда. Визуализация в науке о данных осуществляется с помощью таких инструментов, как таблица, которая используется профессиональными командами. Для процесса анализа на основе кода используются как Python, так и R. R специально используется для визуализации, но в Python также есть много библиотек, таких как matplotlib и seaborn, которые просты в использовании и помогают создавать графики.

Визуализация данных в целом помогает отслеживать тенденции, темпы роста, распределение по диапазону, категориальные данные и т. д. Визуализация включает гистограммы, сгруппированные гистограммы, линейные диаграммы, круговые диаграммы, гистограммы, точечные диаграммы и т. д., которые помогают отмечать события и проверять сезонность. легко.

Компании, работающие с большими запутанными наборами данных, часто используют информационные панели, подобные приведенной ниже. Подобные информационные панели упрощают управление большими командами. Существуют определенные инструменты, которые могут помочь вам получить коды для ваших графиков. Графики, подобные представленному ниже, легко форматируются и готовы к вставке в презентации. Библиотеки, такие как D-Tale, предоставляют информационные панели и могут использоваться непосредственно в Jupyter Notebooks.

Для графов на основе кода проще всего использовать seaborn и matplotlib. Их можно импортировать просто с помощью примеров кода, приведенных ниже. Пример набора данных Titanic приведен ниже. Это поможет вам легко усвоить концепции.

import matplotlib.pyplot as plt
import seaborn as sns

Графики также иногда используются для проверки гипотез, как в примере, приведенном ниже. В титанической истории, когда женщины отдают предпочтение спасательным шлюпкам, когда корабль начинает тонуть. Если история включает в себя эту гипотезу, мы должны проверить ее, используя наш набор данных.

sns.countplot(data=train,x='Sex',hue = 'Survived',palette = 'Blues')

Приведенный выше график ясно показывает, что на корабле погибло больше мужчин, а выжило больше женщин, что показывает, что гипотеза может быть верной. Теперь можно провести математическое тестирование для окончательной проверки.

Аналогично используется Matplotlib. Matplotlib по сравнению с Seaborn включает более сложные функции для тех же графиков. Один из примеров тепловой карты приведен ниже.

Из приведенного выше примера вы, должно быть, получили представление о визуализации данных. Чтобы изучить больше библиотек визуализации оформления заказа, таких как Matplotlib и seaborn. Кроме того, ознакомьтесь с другими инструментами и информационными панелями, которые помогут вам легко выполнять задачи бизнес-аналитики.