파이썬(Python)&판다스(Pandas)&Polars

[polars] 데이터프레임의 결측값을 리스트 형태로 추출하고 변환 (null_count, to_list)

송채채 2024. 4. 9. 18:47

 

# 1. 데이터프레임의 null 값 개수 계산
null_count = df.null_count()

# 2. Series 객체의 첫 번째 행만 추출
head_row = null_count.head(1)

# 3. 첫 번째 행의 첫 번째 값만 추출 (리스트 형태)
value = [value[0] for value in head_row]

# 4. 리스트를 변환하여 최종 결과 반환
result = pl.Series(value).to_list()


# 한번에 조합한 코드
pl.Series([value[0] for value in df.null_count().head(1)]).to_list()

 

data.null_count() 함수를 사용하여 데이터프레임의 각 컬럼에 대한 null 값의 개수를 계산함

이 때, 출력값은 Series 객체로 반환됨


head(1) 함수를 사용하여 Series 객체의 첫 번째 행만 추출하여 결측값만 추출함


리스트 표현식을 사용하여 첫 번째 행의 첫 번째 값만 추출함 --> 이 과정을 하지 않으면, 요소가 리스트 형태로 추출돼서 최종 result가 이중 리스트 형태가 됨


pl.Series(value)를 사용하여 추출된 값을 Series 객체로 변환하고, to_list 함수를 사용하여 리스트 형태고 변환함

반응형