티스토리 뷰
pandas를 사용한지 2년이 넘었지만, 사소한 부분에서 모르고 넘어간 부분이 많았다.
한글 인코딩은 'utf-8' 또는 'cp949'로 저장된 데이터가 많은것은 알고있었지만,
흔히 'utf-8'로 저장한 csv나 excel 파일을 열면 한글 깨짐의 상태로 열린다.
MS excel 365에서 깨지지 않게 보기 위해선 '데이터 > 데이터 가져오기 > 파일에서 > 텍스트/csv에서'를 클릭해
불러오고자하는 데이터를 선택하면 된다.
그 동안 이 방법으로 번거롭게 열었는데, 최근 'UTF-8-SIG'로 저장하면 파일형식간의 호환을 지원해주어 깨지지않고 바로 열 수 있다는 걸 알게 됐다.
import pandas as pd
# 데이터 프레임 만들기
df = pd.DataFrame(data=sample_data)
# 또는 파일불러오기
df = pd.read_csv('파일경로')
#파일 저장하기
df.to_csv('파일경로/파일제목.csv',
encoding = 'utf-8-sig', # 호환가능한 형식으로 인코딩
index = False) # 기본으로 생기는 인덱스 컬럼을 제외하고 저장
#데이터 불러올 때, utf-8로 열리지 않을 경우, 한글 인코딩은 'euckr', 'cp949'도 많이 사용됨
참고 블로그
- https://yganalyst.github.io/data_handling/Pd_4/
- http://blog.wystan.net/2007/08/18/bom-byte-order-mark-problem
반응형
'파이썬(Python)&판다스(Pandas)&Polars' 카테고리의 다른 글
[Pandas] 여러 파일의 행 수, 열 수를 하나의 데이터 프레임으로 만들기(listdir(), shape()) (0) | 2023.02.02 |
---|---|
[Pandas] 서로 다른 데이터프레임에서 특정 값을 매핑해 새로운 컬럼 만들기 (0) | 2023.01.10 |
[Pandas] combine_first - 두 컬럼 중 먼저 나온 값을 기준으로 새로운 컬럼 생성하기 (2) | 2022.10.24 |
[Pandas] literal_eval - 문자열 리스트를 list type으로 변환하기 (1) | 2022.10.24 |
[Pandas] '', NaN 값을 None으로 변환하기 (0) | 2022.10.24 |
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- rdflib
- elasticsesarch
- polars
- Vue3
- psycopg
- 3d-force-graph
- Postgis
- SPARQL
- python'
- knowledgegraph
- knowlegegraph
- p-tuing
- Encoding
- writerow
- volar
- hadoop
- v-tooltip
- PostgreSQL
- TextRank
- PEFT
- python
- 지식그래프임베딩
- MongoDB
- KRworkrank
- LLM
- vscode
- pandas
- difflib
- 지식그래프
- 키워드추출
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
글 보관함