Q. 특정 폴더 하위에 여러개의 파일이 있는데, 해당 파일들을 다 읽어서 뒷단 작업을 하고 싶었다. (하나의 데이터프레임으로 만들어서 한꺼번에 작업하고 싶음!)
A. 하단 코드 참고
import pandas as pd
# 파일들 위치한 경로
path = 'target/'
#해당 경로 하위내 모든 파일
file_list = os.listdir(path)
#해당 경로 하위 내 csv로 끝나는 파일들
file_list_csv = [file for file in file_list if file.endswith('.csv')]
df = pd.DataFrame()
for i in file_list_csv:
data = pd.read_csv(path+i, encoding = 'utf-8-sig')
df = pd.concat([df, data])
# reset_index() : 인덱스 리셋 <> set_index()
# 데이터프레임의 다양한 전처리 과정을 거치게 되면 인덱스가 뒤죽박죽인 경우가 많다.
# 이럴때 인덱스를 다시 처음부터 재배열 해주는 유용한 함수
df = df.reset_index(drop = True)
'Python' 카테고리의 다른 글
[Python] Unindent not expected Pylance 에러(VS Code 사용) (0) | 2022.12.20 |
---|---|
[Python] is_displayed(), is_selected(), is_enabled() 사용하기(Selenium) (0) | 2022.12.20 |
[Python]find_elements_by_class_name 사용해서 특정 버튼 클릭하고 값 읽어오기('더보기' 클릭, 동일한 class name 인 경우..) (0) | 2022.12.20 |
[Python] csv파일 읽을 때 한글 깨짐 현상 (0) | 2022.12.20 |
[Python]executable_path has been deprecated..에러 발생(Selenium 관련) (0) | 2022.12.20 |