본문 바로가기

Development/Python

pandas를 사용하여 엑셀(Excel) 파일의 데이터를 데이터프레임(DataFrame)으로 불러오는 방법

들어가며

pandas를 활용하여 엑셀 파일.xlsx을 읽어 DataFrame 객체로 변환할 수 있다. 예시에서 사용할 엑셀 파일(exam.xlsx)의 정보는 다음과 같다.

  • 폴더명 : C:\Users\CHOEWY\Desktop\
  • 시트명 : Exam

위의 엑셀 파일의 데이터는 아래와 같이 구성되어 있다.

번호 케이블 레이스웨이
1 cable01 raceway01
2 cable01 raceway02
3 cable01 raceway03
4 cable01 raceway04
5 cable01 raceway05
6 cable02 raceway03
7 cable02 raceway05
8 cable02 raceway07
9 cable03 raceway10
10 cable03 raceway11
11 cable03 raceway12

엑셀 파일 불러오기

엑셀 파일의 데이터를 불러오기 위한 전체 코드는 다음과 같다. 먼저 pandas를 사용하기 위하여 import하고, 호출하기 편하도록 pd로 축약한다. 파일의 경로를 excel이라는 변수에 저장하는데, 문자열 내 한 개의 \기호는 escape 문자 중 개행문자로 인식하므로, \ 기호를 \\ 또는 /로 바꾸어준다. 이어서 pandasread_excel함수를 사용하여 엑셀 파일을 DataFrame객체로 불러온다. 불러온 객체는 다양하게 접근 가능한데, 이는 다른 포스팅에서 정리하도록 하겠다.

import pandas as pd

excel = "C://Users/CHOEWY/Desktop/exam.xlsx"
df = pd.read_excel(excel)

print(df)

위의 코드 실행하면 다음과 같이 DataFrame객체가 출력되는 것을 볼 수 있다.

'''
    번호        케이블         레이스웨이
0    1      cable01      raceway01
1    2      cable01      raceway02
2    3      cable01      raceway03
3    4      cable01      raceway04
4    5      cable01      raceway05
5    6      cable02     raceway03
6    7      cable02      raceway05
7    8      cable02      raceway07
8    9      cable03      raceway10
9   10      cable03      raceway11
10  11      cable03      raceway12
'''

마치며

다음에는 DataFrame을 엑셀 파일로 저장하는 방법에 대해서 정리해보겠다.