본문 바로가기

Python

[Python]특정 폴더 하위의 파일들 읽어서 하나의 dataframe 만들기

Q. 특정 폴더 하위에 여러개의 파일이 있는데, 해당 파일들을 다 읽어서 뒷단 작업을 하고 싶었다. (하나의 데이터프레임으로 만들어서 한꺼번에 작업하고 싶음!)

A. 하단 코드 참고

import pandas as pd

# 파일들 위치한 경로
path = 'target/'

#해당 경로 하위내 모든 파일
file_list = os.listdir(path)

#해당 경로 하위 내 csv로 끝나는 파일들
file_list_csv = [file for file in file_list if file.endswith('.csv')]

df = pd.DataFrame()

for i in file_list_csv:
	data = pd.read_csv(path+i, encoding = 'utf-8-sig')

df = pd.concat([df, data])

# reset_index() : 인덱스 리셋 <> set_index()
# 데이터프레임의 다양한 전처리 과정을 거치게 되면 인덱스가 뒤죽박죽인 경우가 많다. 
# 이럴때 인덱스를 다시 처음부터 재배열 해주는 유용한 함수

df = df.reset_index(drop = True)

python