12 июля — 16 июля.

Это была моя первая неделя в Sabudh Foundation, и мы начали с лекции, чтобы изучить основы, которые помогут нам в будущем лучше понять концепции науки о данных.

Мы изучили основы Python, такие как создание функций, арифметические операции, печать операторов, хранение данных в переменных, списки кортежей. Мы также изучили одну из библиотек анализа данных Python Pandas. В нем мы узнали, как открывать CSV-файлы, как их читать, изменять, разбивать в соответствии с нашими потребностями, применять операции к столбцам и строкам соответственно.

import pandas as pd
# read the top n rows of csv file as a dataframe
reviews_df = pd.read_csv("IMDB Dataset.csv", nrows=100)
print(reviews_df.head())

Выход:

   review                                            sentiment
0  One of the other reviewers has mentioned that ...  positive
1  A wonderful little production. <br /><br />The...  positive
2  I thought this was a wonderful way to spend ti...  positive
3  Basically there's a family where a little boy ...  negative
4  Petter Mattei's "Love in the Time of Money" is...  positive

Помимо всего этого мы узнали о математике, статистике. Нас также познакомили с тем, что такое машинное обучение, как оно работает, как оно помогает нам улучшать предыдущий код и автоматизировать его. Мы также узнали о линейной регрессии, ее процессе и работе.