Различные способы ввода и вывода данных с помощью Python pandas.

В Python библиотека Pandas очень хорошая библиотека со многими эффективными функциями, которые упрощают работу с данными. Здесь мы обсудим различные способы ввода и вывода данных с помощью панд.

Для установки панд используйте

pip install pandas
  1. CSV-файлы

Формат файла .csv — один из наиболее часто используемых форматов файлов при работе с проектами по науке о данных. Для ввода/вывода файлов CSV в pandas используйте это.

import pandas as pd
# reading the file.csv and create df dataframe from it
df = pd.read_csv(“file.csv”)
#Perform operations on df Dataframe
#outputs the new_file.csv according to the df
df.to_csv(“new_file.csv”) 

2. Файлы Excel

Иногда приходится работать с файлами Excel в формате .xlsx. Если вы используете файл Excel, используйте это.

import pandas as pd
# reading the file.xlsx  and create df dataframe from it
df = pd.read_excel(“file.xlsx”)
#To select a particular sheet you can you this
df = pd.read_excel(“file.xlsx”,sheet_name = “Sheet 1”)
#Perform operations on df Dataframe
#outputs the new_file.xlsx according to the df
df.to_excel(“new_file.xlsx”) 

3. HTML-таблицы

Получить данные из таблиц на веб-сайте, когда у вас нет кнопки загрузки, — сложная задача. используя python, вы можете легко решить эту проблему.

Здесь я получу все имена президента Индии из Википедии.

import pandas as pd
url = "https://en.wikipedia.org/wiki/List_of_presidents_of_India"
df = pd.read_html(url)
#Print the dataframe
#Here df[1] is being used because in df there is a lot more data than we need and in only df[1] the relevant data remains
print(df[1])
#To save the data into csv file
df[1].to_csv('data.csv')
#To save the data into html file
df[1].to_html('data.html')

Вывод:

4. Из буфера обмена

Вы когда-нибудь задумывались об использовании скопированных данных с мыши? используя этот метод, вы можете ввести фрейм данных, скопированный в буфер обмена.

import pandas as pd
#To read a dataframe from clipboard
df = pd.read_clipboard()
print(df)
#Copy data to clipboard after performing operations on the df 
df.to_clipboard(excel=True, index=False)

Заключение

Здесь я обсуждал только файлы CSV, excel. Точно так же вы можете читать из различных файлов в таких форматах, как XML, JSON, паркет и т. д. Это очень просто, если вы будете следовать документации pandas здесь. Хотя у pandas есть ограничения при работе с очень большими наборами данных, для небольших и средних наборов данных это очень мощная библиотека. Вы можете выполнять с ним различные операции с данными.

Спасибо, что дочитали до конца. Это мой первый средний пост. Я надеюсь, что это поможет, и вам это нравится!

Будьте в безопасности и будьте здоровы!

Ссылки:



Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.