1. Data Analyst/1-1. Python

[python 실무] 파이썬 csv 파일 불러오기 - 데이터가 1행에 없는 경우 해결방법 - 1초컷

Data Analyst 2023. 11. 28. 15:54
728x90
반응형

 

 

파이썬에서 csv 파일은 불러오는데 필요한 데이터가 

1행에 없는 경우 

어떻게 원하는 데이터를 불러올 수 있을까?


예를 들어 1,2행에는 업데이트 날짜와 데이터 입력방법에 대한 안내가 있다고 가정하자. 

흔하게 불러오는 방법대로라면 1행이 자동으로 컬럼명이 포함된 행으로 설정된다. 
하지만 데이터 파일이 아래와 같이 컬럼명이 4행에 있는 형태라면?

 

 

 

 

import pandas as pd
import os
import matplotlib.pyplot as plt

file = 'file_name.csv'

df = pd.read_csv(file)
df.head(5)

 

 

보여지는 결과는 1행이 기준이 되어 컬럼명에 Updated: 2031.07.03만 보일 것이다.

 

4행을 컬럼명이 있는 기준행으로 설정하기 위해서는 파일을 열 때 한 가지만 추가해주면 된다. 

header = 3

 

전체코드는 아래와 같다. 

 

 

import pandas as pd
import os
import matplotlib.pyplot as plt

file = 'file_name.csv'

df = pd.read_csv(file, header=3)
df.head(5)

 

 

header = n 의 의미는 불러오는 파일의 기준 행을 n으로 불러온다는 의미이다.

즉, n번째부터 불러온다고 생각하면 된다. 

 

 


참고로 파이썬 행,열을 제거할 때 사용하는 것으로 흔히 알려진 drop은 사용하면 안된다.

drop은 기준행 아래의 행들을 제거하므로, 자칫하다가는 컬럼명을 포함한 행을 삭제할 수 있다. 

 

그러므로 컬럼명이 들어한 행으로 변경할때는 무조건 HEADER! 기억하기.

 

728x90
반응형