12 июля — 16 июля.
Это была моя первая неделя в Sabudh Foundation, и мы начали с лекции, чтобы изучить основы, которые помогут нам в будущем лучше понять концепции науки о данных.
Мы изучили основы Python, такие как создание функций, арифметические операции, печать операторов, хранение данных в переменных, списки кортежей. Мы также изучили одну из библиотек анализа данных Python Pandas. В нем мы узнали, как открывать CSV-файлы, как их читать, изменять, разбивать в соответствии с нашими потребностями, применять операции к столбцам и строкам соответственно.
import pandas as pd # read the top n rows of csv file as a dataframe reviews_df = pd.read_csv("IMDB Dataset.csv", nrows=100) print(reviews_df.head())
Выход:
review sentiment 0 One of the other reviewers has mentioned that ... positive 1 A wonderful little production. <br /><br />The... positive 2 I thought this was a wonderful way to spend ti... positive 3 Basically there's a family where a little boy ... negative 4 Petter Mattei's "Love in the Time of Money" is... positive
Помимо всего этого мы узнали о математике, статистике. Нас также познакомили с тем, что такое машинное обучение, как оно работает, как оно помогает нам улучшать предыдущий код и автоматизировать его. Мы также узнали о линейной регрессии, ее процессе и работе.