Цель позади этого

Одним из типов данных, которые легче найти в сети, являются данные о погоде. Многие сайты предоставляют исторические данные по многим метеорологическим параметрам, таким как давление, температура, влажность, скорость ветра, видимость и т. д.

Моя цель на этой стажировке (анализа данных) состоит в том, чтобы преобразовать необработанные данные в информацию, а затем преобразовать их в знания.

Я очень рад поделиться с вами первым проектом моей стажировки. Итак, начнем без промедления!

→ Набор данных о погоде

Нулевая гипотеза H0 такова: «Ежемесячное сравнение кажущейся температуры и влажности за 10 лет с данными указывает на увеличение из-за глобального потепления».

H0 означает, что нам нужно найти, увеличились ли значения за месяц, скажем, апрель, начиная с 2006 по 2016 год, и за тот же период или нет.

Прежде всего, давайте опишем наш набор данных. Проверьте погоду, присутствует ли нулевое значение или нет. И проанализируйте, является ли тип данных столбца идеальным или нет.

Прежде чем перейти к визуализации, мне нужно преобразовать форматированную дату в тип даты. то после визуализации можно в лучшую сторону.

Теперь здесь данные в часовом периоде времени. поэтому для лучшего анализа нам нужно ежемесячно проводить повторную выборку наших данных.

Согласно приведенному ниже графику зависимости влажности от кажущейся температуры, мы можем ясно сказать, что влажность на протяжении последних десяти лет [2006–2016] остается неизменной. Но есть культура синусоидальной волны, наблюдаемая в температуре, которая является нормальной в соответствии с нашими тремя основными сезонами.

Нам нужно найти, увеличились ли значения для месяца месяца, скажем, апреля, начиная с 2006 по 2016 год, и для того же периода или нет. На приведенном ниже графике показана зависимость влажности от температуры в апреле месяце за десять лет.

Таким образом, влажность остается неизменной в течение всего года, но для {года 2009, 2011, 2015} показана большая разница по сравнению со средним соотношением температур.

Ниже графика влажности за все десять лет [2006–2016 гг.]

Ниже приведен график измерения температуры за все десять лет [2006–2016 гг.].

Я также проанализировал график зависимости влажности от температуры за все 12 месяцев.

Который, как показано ниже, номер порока:

(1) Январь: Мы можем ясно видеть, насколько сильно меняется температура при одинаковой влажности в течение года.

(2) Февраль: Мы можем ясно видеть, насколько сильно изменяется температура, а влажность остается неизменной.

(3) март:

(4) апрель:

(5) май:

(6) июнь:

(7) июль:

(8) август:

(9) Сентябрь:

(10) Октябрь:

(11) ноябрь:

(12) декабря:

Вывод:

Согласно визуализации графика за январь-декабрь, изменение температуры месяца с апреля по август очень меньше. Она почти одинакова в течение всего года. Но за последние 10 лет [2006–2016] влажность не изменилась для конкретного месяца. С сентября по март температура очень сильно меняется, но влажность остается неизменной.

GithHub Ссылка с описанием: Анализ метеорологических данных.ipynb

Я благодарен наставникам из Suvenconsultants за то, что они предоставили потрясающие формулировки проблем и дали многим из нас возможность пройти стажировку по программированию. Спасибо Suvenconsultants.