PDFMathTranslate는 과학 논문 PDF를 번역하면서 차트, 수식, 레이아웃을 그대로 유지할 수 있는 파이썬 라이브러리다. Github: https://github.com/Byaidu/PDFMathTranslate GitHub - Byaidu/PDFMathTranslate: PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDFPDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker - Byaidu/PDFMathTranslategi..
다양한 To do 앱을 사용하다가 올해는 업무일지를 겸해서 사용해보려고 노션으로 다시 돌아왔다.아직 학생 신분이라 무료로 사용할 수 있기 때문에 알차게 사용해보고 만약 다음에 필요하다면 옵시디언을 고려중이다. 일단,1) 가장 쉬운 방법으로 노션 템플릿을 사용해 데일리 템플릿을 만들고2) Claude나 ChatGPT를 사용해 하루 일과에 대한 체크리스트를 생성한다. 오늘 설명할 것은 아래 'Daily' 부분이다.'새 페이지'를 클릭하면 아래와 같은 템플릿이 바로 생성되는 형태이다. 본문 아래에 간단한 템플릿 링크도 공유했으니 참고하시면 됩니다. 1. PC 버전 App 설치앉아서 바로 켜야 오늘 뭐할지 생각할 수 있기 때문에 앱을 사용하는 걸 추천한다.주로 PC를 사용하기 때문에 윈도우 앱으로 notio..
본 글은 저의 대학원 과제 보고서를 요약하여 블로그로 작성한 것입니다.추론이란?1.1 추론의 기본 개념추론은 사실과 논리를 사용하여 답을 찾는 과정으로, 크게 3가지 유형이 있다.연역적 추론(Deductive Reasoning)전제에서 확실한 결론을 도출하는 방식논리적 필연성에 기반주어진 전제에서 확실한 결론 도출귀납적 추론(Inductive Reasoning)관찰을 통해 가능성 높은 결론을 예측경험적 관찰에 기반확률적 결론 도출가추적 추론(Abductive Reasoning)관찰된 현상을 설명할 수 있는 가능성이 높은 것을 찾는 방식현상의 원인을 추정 1.2 추론의 형식적 구분Formal 추론규칙 기반으로 지식을 토대로 논리적 규칙에 따라 결론 도출명시적이고 체계적인 접근Informal 추론직관이나 상..
본 글은 저의 대학원 과제 보고서를 요약하여 블로그로 정리한 글입니다.ChatGPT가 등장한 이후, 개발자들의 작업 방식이 크게 달라짐ChatGPT에게 "회원가입 폼 좀 만들어줘"라는 간단한 명령으로 기본적인 코드를 쉽게 만들 수 있게 됨이런 변화가 정확히 어떤 영향을 미치고 있는지, 실제 사례와 논문을 통해 분석함인공지능의 발전예전의 AI는 마치 계산기처럼 특정 작업만 수행하는 도구였다.코드에서 버그가 날 만한 부분 찾기프로젝트 비용이나 일정 예측하기반복되는 패턴 찾아서 최적화하기이런 작업들은 분명 유용했지만, 개발자가 직접 코드를 짜고 설계하는 핵심 작업은 여전히 사람의 몫이었고 보조적인 역할을 했다.현재의 ChatGPT, Claude, GitHub Copilot 같은 현대의 AI들은 보조적인 수단을..
RDFlib은 RDF 데이터를 처리하기 위한 파이썬 라이브러리다. 간단한 예제를 통해 그래프를 만들고, SPARQL 쿼리를 수행한 후 데이터를 pandas.DataFrame으로 변환하는 과정을 소개합니다.1. RDFlib 설치pip install rdflib2. 그래프 불러오기 또는 그래프 생성하기참고: RDFlib 공식 문서 - 그래프 파싱2-1. 그래프 데이터 불러오기Turtle(.ttl), XML/RDF(.rdf) 형식의 데이터가 있다면, .parse() 메서드를 사용한다.예시 파일: sample.ttlimport rdflibfrom rdflib import Graph# 파일 불러오기g = Graph()g.parse("sample.ttl", format="ttl")2-2. 그래프 데이터 생성하기RD..
원격 DB를 전제로 한 경우, 추가 설정이 필요합니다.MongoDB 원격 접속 설정1. 방화벽 설정먼저, MongoDB가 사용하는 기본 포트(27017)에 대한 인바운드 연결을 허용해야 합니다. Ubuntu나 Debian 기반 시스템에서는 UFW(Uncomplicated Firewall)를 사용하여 이를 설정할 수 있습니다.sudo ufw allow 27017이 명령은 27017 포트로의 모든 인바운드 연결을 허용합니다.2. MongoDB 설정 파일 수정MongoDB의 설정 파일을 수정하여 원격 접속을 허용해야 합니다. 설정 파일의 위치는 일반적으로 /etc/mongod.conf입니다.설정 파일을 엽니다:sudo nano /etc/mongod.confnet 섹션을 찾아 다음과 같이 수정합니다:net: ..
필요한 라이브러리를 설치해주기pip install--upgrade sqlalchemy pip install --upgrade geopandaspip install --upgrade psycopg2 pip install --upgrade GeoAlchemy2pip install "psycopg[binary,pool]" 테스트 데이터는 주소정보누리집의 도로도형의 SHP 파일을 사용했다.필요한 라이브러리를 불러온 뒤, 테이블을 생성해준다.import psycopg # psycopg3으로 쿼리나 스키마 만드는 작업import psycopg2 # sqlalchemy로 연결할 때 사용. sqlalchemy는 psycopg2를 사용함import osfrom dotenv import load_dotenv, set_ke..
몽고DB 설치하기공식 홈페이지: https://www.mongodb.com/try/download/community공식 가이드문서: https://www.mongodb.com/ko-kr/docs/manual/tutorial/install-mongodb-on-windows/#std-label-install-mdb-community-windows친절하게 OS 환경별로 어떻게 설치해야하는지 알려준다step by step을 원할경우, 아래 블로그를 참고하시길!https://velog.io/@chloe1205/STUDY-MongoDB-%EC%84%A4%EC%B9%98%EB%B0%A9%EB%B2%95-Community-Server [STUDY] MongoDB 설치방법 (Community Server)MongoDB를..
데이터 처리를 하려는 데 아래와 같은 데이터를 pd.read_csv로 읽어오려니 에러가 났다. ParserError: Error tokenizing data. C error: Expected 9 fields in line 2, saw 24 이 데이터는 여러 헤더를 가진 데이터가 하나로 제공되고 첫번째 열(11, 15)로 데이터를 구분해야한다.pandas는 헤더를 추론하기 때문에 계속 에러가 났고, 파이썬으로 하나의 CSV를 아예 분리하는 방법으로 생각했다. 코드는 Claude를 사용해 샘플데이터와 원하는 작업을 프롬프트에 작성해 얻은 것이다. import csvimport osdef split_csv(input_file, output_dir, column_index): if not os.path.e..
하둡의 단일 클러스터 구성문득..꼭 데비안을 써야하는가에 대한 의문이 들어서 찾아보니, 안정성을 위해선 데비안이 가장 안정적이라고 함어차피 우분투도 데비안 기반이라서 사용하는 명령어가 크게 다를 것 같지 않음.그리고 데비안 너무 아무것도 안깔려서 새로 다 설치해야하는 문제점이 있음..따라서 아래부터는 우분투 기준으로 실행하였습니다java 설치참고: https://settembre.tistory.com/516 Ubuntu 20.04 - OpenJDK 11 설치1. Install OpenJDK ( Using apt) $ sudo apt-get update && sudo apt-get upgrade 2. Install openjdk-11-jdk $ sudo apt-get install openjdk-11-jd..
- Total
- Today
- Yesterday
- psycopg
- 지식그래프
- python
- MongoDB
- polars
- knowlegegraph
- pdfmathtranslate
- difflib
- Encoding
- Claude
- Postgis
- rdflib
- writerow
- Vue3
- ChatGPT
- 지식그래프임베딩
- vscode
- 키워드추출
- cursorai
- hadoop
- LLM
- TextRank
- python'
- pandas
- vervel
- PostgreSQL
- knowledgegraph
- p-tuing
- SPARQL
- PEFT
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |