# 1. 데이터프레임의 null 값 개수 계산
null_count = df.null_count()
# 2. Series 객체의 첫 번째 행만 추출
head_row = null_count.head(1)
# 3. 첫 번째 행의 첫 번째 값만 추출 (리스트 형태)
value = [value[0] for value in head_row]
# 4. 리스트를 변환하여 최종 결과 반환
result = pl.Series(value).to_list()
# 한번에 조합한 코드
pl.Series([value[0] for value in df.null_count().head(1)]).to_list()
data.null_count() 함수를 사용하여 데이터프레임의 각 컬럼에 대한 null 값의 개수를 계산함
이 때, 출력값은 Series 객체로 반환됨
head(1) 함수를 사용하여 Series 객체의 첫 번째 행만 추출하여 결측값만 추출함
리스트 표현식을 사용하여 첫 번째 행의 첫 번째 값만 추출함 --> 이 과정을 하지 않으면, 요소가 리스트 형태로 추출돼서 최종 result가 이중 리스트 형태가 됨
pl.Series(value)를 사용하여 추출된 값을 Series 객체로 변환하고, to_list 함수를 사용하여 리스트 형태고 변환함
반응형
'파이썬(Python)&판다스(Pandas)&Polars' 카테고리의 다른 글
[Python] JSON의 모든 key, value를 재귀적으로 탐색해서 데이터프레임으로 만들기 (0) | 2024.04.24 |
---|---|
[polars] 데이터 EDA 코드 만들기 (컬럼수, 행수, 결측값 등) (0) | 2024.04.09 |
[Python] mp4를 mp3로 변환하기 (moviepy) (0) | 2024.02.13 |
[Python&Pandas] 유사한 문자열을 매칭하는 파이썬 라이브러리(difflib) (0) | 2024.01.04 |
[Pandas] 두 개의 데이터프레임에서 특정 문자열이 포함된 행 제거하기(~, isin) (2) | 2024.01.04 |