Различные способы ввода и вывода данных с помощью Python pandas.
В Python библиотека Pandas очень хорошая библиотека со многими эффективными функциями, которые упрощают работу с данными. Здесь мы обсудим различные способы ввода и вывода данных с помощью панд.
Для установки панд используйте
pip install pandas
- CSV-файлы
Формат файла .csv — один из наиболее часто используемых форматов файлов при работе с проектами по науке о данных. Для ввода/вывода файлов CSV в pandas используйте это.
import pandas as pd # reading the file.csv and create df dataframe from it df = pd.read_csv(“file.csv”) #Perform operations on df Dataframe #outputs the new_file.csv according to the df df.to_csv(“new_file.csv”)
2. Файлы Excel
Иногда приходится работать с файлами Excel в формате .xlsx. Если вы используете файл Excel, используйте это.
import pandas as pd # reading the file.xlsx and create df dataframe from it df = pd.read_excel(“file.xlsx”) #To select a particular sheet you can you this df = pd.read_excel(“file.xlsx”,sheet_name = “Sheet 1”) #Perform operations on df Dataframe #outputs the new_file.xlsx according to the df df.to_excel(“new_file.xlsx”)
3. HTML-таблицы
Получить данные из таблиц на веб-сайте, когда у вас нет кнопки загрузки, — сложная задача. используя python, вы можете легко решить эту проблему.
Здесь я получу все имена президента Индии из Википедии.
import pandas as pd url = "https://en.wikipedia.org/wiki/List_of_presidents_of_India" df = pd.read_html(url) #Print the dataframe #Here df[1] is being used because in df there is a lot more data than we need and in only df[1] the relevant data remains print(df[1]) #To save the data into csv file df[1].to_csv('data.csv') #To save the data into html file df[1].to_html('data.html')
Вывод:
4. Из буфера обмена
Вы когда-нибудь задумывались об использовании скопированных данных с мыши? используя этот метод, вы можете ввести фрейм данных, скопированный в буфер обмена.
import pandas as pd #To read a dataframe from clipboard df = pd.read_clipboard() print(df) #Copy data to clipboard after performing operations on the df df.to_clipboard(excel=True, index=False)
Заключение
Здесь я обсуждал только файлы CSV, excel. Точно так же вы можете читать из различных файлов в таких форматах, как XML, JSON, паркет и т. д. Это очень просто, если вы будете следовать документации pandas здесь. Хотя у pandas есть ограничения при работе с очень большими наборами данных, для небольших и средних наборов данных это очень мощная библиотека. Вы можете выполнять с ним различные операции с данными.
Спасибо, что дочитали до конца. Это мой первый средний пост. Я надеюсь, что это поможет, и вам это нравится!
Будьте в безопасности и будьте здоровы!
Ссылки:
Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.