티스토리 뷰
파이썬(Python)&판다스(Pandas)&Polars
[polars] 데이터프레임의 결측값을 리스트 형태로 추출하고 변환 (null_count, to_list)
송채채 2024. 4. 9. 18:47
# 1. 데이터프레임의 null 값 개수 계산
null_count = df.null_count()
# 2. Series 객체의 첫 번째 행만 추출
head_row = null_count.head(1)
# 3. 첫 번째 행의 첫 번째 값만 추출 (리스트 형태)
value = [value[0] for value in head_row]
# 4. 리스트를 변환하여 최종 결과 반환
result = pl.Series(value).to_list()
# 한번에 조합한 코드
pl.Series([value[0] for value in df.null_count().head(1)]).to_list()
data.null_count() 함수를 사용하여 데이터프레임의 각 컬럼에 대한 null 값의 개수를 계산함
이 때, 출력값은 Series 객체로 반환됨
head(1) 함수를 사용하여 Series 객체의 첫 번째 행만 추출하여 결측값만 추출함
리스트 표현식을 사용하여 첫 번째 행의 첫 번째 값만 추출함 --> 이 과정을 하지 않으면, 요소가 리스트 형태로 추출돼서 최종 result가 이중 리스트 형태가 됨
pl.Series(value)를 사용하여 추출된 값을 Series 객체로 변환하고, to_list 함수를 사용하여 리스트 형태고 변환함
반응형
'파이썬(Python)&판다스(Pandas)&Polars' 카테고리의 다른 글
[Pandas] get_close_matches 함수를 사용한 유사한 데이터 값 매핑하기 (1) | 2024.06.14 |
---|---|
[Python] JSON의 모든 key, value를 재귀적으로 탐색해서 데이터프레임으로 만들기 (1) | 2024.04.24 |
[polars] 데이터 EDA 코드 만들기 (컬럼수, 행수, 결측값 등) (0) | 2024.04.09 |
[Python] mp4를 mp3로 변환하기 (moviepy) (1) | 2024.02.13 |
[Python&Pandas] 유사한 문자열을 매칭하는 파이썬 라이브러리(difflib) (0) | 2024.01.04 |
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- ChatGPT
- Postgis
- Encoding
- LLM
- MongoDB
- pandas
- python'
- python
- geospy
- Claude
- psycopg
- rdflib
- PostgreSQL
- pdfmathtranslate
- knowledgegraph
- 지식그래프임베딩
- 키워드추출
- rdffox
- Vue3
- polars
- 지식그래프
- writerow
- cursorai
- vscode
- hadoop
- vervel
- SPARQL
- TextRank
- PEFT
- deepseek
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함