[Python] 파이썬으로 특정 컬럼 기준으로 CSV 파일 분리
데이터 처리를 하려는 데 아래와 같은 데이터를 pd.read_csv로 읽어오려니 에러가 났다. ParserError: Error tokenizing data. C error: Expected 9 fields in line 2, saw 24 이 데이터는 여러 헤더를 가진 데이터가 하나로 제공되고 첫번째 열(11, 15)로 데이터를 구분해야한다.pandas는 헤더를 추론하기 때문에 계속 에러가 났고, 파이썬으로 하나의 CSV를 아예 분리하는 방법으로 생각했다. 코드는 Claude를 사용해 샘플데이터와 원하는 작업을 프롬프트에 작성해 얻은 것이다. import csvimport osdef split_csv(input_file, output_dir, column_index): if not os.path.e..
파이썬(Python)&판다스(Pandas)&Polars
2024. 8. 13. 11:20
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- pdfmathtranslate
- TextRank
- Encoding
- knowlegegraph
- 지식그래프임베딩
- MongoDB
- PEFT
- Claude
- PostgreSQL
- ChatGPT
- 지식그래프
- 키워드추출
- Postgis
- cursorai
- LLM
- psycopg
- Vue3
- writerow
- hadoop
- vervel
- difflib
- pandas
- python
- polars
- vscode
- python'
- rdflib
- knowledgegraph
- SPARQL
- p-tuing
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함