'분류 전체보기' 카테고리의 글 목록 (7 Page)

[TextRank] pytextrank와 spacy 한글 키워드 추출

pytextrank 설치pip install pytextrankdependency로 spacy가 함께 설치됨 한국어 키워드 추출 예시근데 성능 진짜 안좋은거같음...파라미터 조작이나 한글 모델을 더 정교한거 아니면 힘든것같음encoding 깨지면 # -*- coding: utf-8 -*- 추가하기# -*- coding: utf-8 -*-import spacyimport pytextrank# scapy의 한국어모델인 ko_core_news_sm을 사용함 https://spacy.io/models/ko/# example texttext = "서울 지진 피해에 대한 데이터 분석을 위해서는 어떤 종류의 데이터를 사용해야 할지 먼저 생각해보아야 합니다. 예를 들어, 지진 발생 시간, 지진 규모, 지진 발생 지역,..

개발일지 2023. 4. 27. 13:27

[docker] services.networks additional property search_network is not allowed

왼쪽 그림처럼 docker compose에서 networks를 썼는데 vscode로 빨간줄이 뜨길래 오른쪽으로 고쳤다. 그랬더니 'services.networks additional property search_network is not allowed' 에러코드가 떠서 찾아보니 대부분 들여쓰기 문제거나 문법 오류 문제라 하길래 다시 왼쪽으로 고쳐서 했더니 build됨.. 즉, 빨간줄 무시하고 들여쓰기 알맞게 하기!

오류 해결 2023. 4. 26. 14:04

[Vscode, nuxt3] prettier, volar formatting

1. vetur을 깔면 루트 폴더 - 서브 폴더 구조에서 vue를 못찾는 것 같음 2. vetur을 확장프로그램에서 지우고, 대신 volar를 설치함 3. nuxt3 포맷팅을 위해서 eslint, prettier를 설치함 https://velog.io/@korjsh/vue.js-vscode-eslint-prettier-%EC%84%A4%EC%A0%95 vue.js vscode eslint & prettier 설정 vue cli 라이브러리 설치 후, npx를 통해서, 프로젝트를 하나 만든다. 아래와 같이 설정 한다. 설정 완료후, 프로젝트 세팅을 진행 시켜준다. 아래와 같은 화면이 나오면 설치가 정상적으로 진행된 velog.io https://www.inflearn.com/questions/626182/n..

오류 해결 2023. 4. 23. 15:01

[Vscode, Nuxt3] Nuxt.js 디버깅(Debug) 설정하기 - unbound breakpoint some of your breakpoints could not be set. if you're having an issue you can

결론만 말하면 .vscode의 launch.json에서 webroot를 잘 설정하자!! 내 프로젝트의 경우 최상위 폴더에 back과 front가 있고 front안에 nuxt 프로젝트가 있었는데... 그걸 신경안쓰고 그냥 "webRoot": "${workspaceFolder}"로 작성했더니 front 폴더의 파일을 인식하지 못했던 것. 온갖 설정과 삽질을 다하다가 마지막으로 설마 경로가..?이러면서 "webRoot": "${workspaceFolder}/front"이렇게 고쳤더니 중단점 안되던 문제가 한번에 해결되어서 허탈했다.. { "version": "0.2.0", "configurations": [ { "type": "chrome", "request": "launch", "name": "client:..

오류 해결 2023. 4. 18. 18:31

[Pandas] 행정구역 추출하여 새로운 컬럼으로 정보 추가하기 str.cat()

목적 행정구역명 (시도명, 시군구명)이 포함된 특정 CSV, Excel 파일이 존재함 해당 파일에 특정 시도명, 시군구명이 포함된 셀이 있는지 찾고 새로운 데이터 프레임에 해당 파일명과 포함된 시도, 시군구 정보를 생성하기 행정구역 파일 불러오기 행정기관(행정동) 및 관할구역(법정동) 변경내역(2023. 3. 30.) juso_df = pd.read_excel('D:\행정구역추출\jsocde20230330\jsocde20230330\KIKmix.20230330.xlsx') 시도 리스트, 시군구 리스트, 읍면동 리스트 만들기 sido_list = list(juso_df.시도명.unique()) sido_list.remove('동해출장소') sido_list.remove('북부출장소') # nan 값 삭제 ..

파이썬(Python)&판다스(Pandas)&Polars 2023. 4. 7. 14:15

[Virtuoso] virtuoso opensouce 7 docker 설치와 port 변경

목표 목표는 이미 virtuoso가 설치되어있는 컴퓨터에 하나 더 설치해서 다른 포트로 새로운 버투소를 운영하고 싶었다.. 그래서 막연하게 다른 경로에 버투소를 설치하면 될 줄 알았지만 ㅜㅜ 소스코드 내에서 1111,8890을 이미 설정해놓았고 설치 후에 포트 변경은 가능하지만, 설치 진행할 때도 1111,8890을 체크하더라.. 그래서 설치 도중 에러가 나서 이것저것 다 해보다가 소스코드로 설치하는 것은 포기함! 도커로 virtuoso 설치하고 포트 변경하기 새롭게 생각한 방법은 도커로 설치하기! https://hub.docker.com/r/openlink/virtuoso-opensource-7/ # docker image 가져오기 $ docker pull openlink/virtuoso-opensou..

지식그래프(Knowledge Graph) 2023. 3. 7. 14:03

[Pandas] 여러 파일의 행 수, 열 수를 하나의 데이터 프레임으로 만들기(listdir(), shape())

file_list = os.listdir() file_list = [file for file in file_list if file.endswith(".txt")] # 확장자 print(file_list) df = pd.DataFrame() df["파일명"] = file_list df["행 수"] = None df["열 수"] = None for i in range(len(df)): file = df['파일명'][i] tmp = pd.read_csv(file, sep="|", low_memory=False, encoding="cp949") # 인코딩 선택 df['행 수'][i] = tmp.shape[0] df['열 수'][i] = tmp.shape[1]

파이썬(Python)&판다스(Pandas)&Polars 2023. 2. 2. 16:16

[Virtuoso] Virtuoso 7 버전 설치하기

7 버전 설치 ubuntu 20.04 기준 Install Virtuoso 7 on Ubuntu 20.04 LTS 오류가 있었음 (install-info 어쩌고 안된다고) 그래서 스택오버플로우에서 찾은 방법 dpkg: error processing package install-info sudo mv /var/lib/dpkg/info/install-info.postinst /var/lib/dpkg/info/install-info.postinst.bad sudo apt-get install libtool sudo apt-get install dpkg-dev build-essential sudo apt update sudo apt-get install autoconf automake bison checkinst..

지식그래프(Knowledge Graph) 2023. 1. 10. 15:35

[Pandas] 서로 다른 데이터프레임에서 특정 값을 매핑해 새로운 컬럼 만들기

기관코드와 전체기관명으로 구성된 df1 소관기관 컬럼에 전체기관명만 있는 df2 두 개의 데이터 프레임을 합쳐서 하나로 병합하고 싶다면, pd.merge 함수를 쓰면 된다. 하지만, merge 함수 만으로는 경찰관, 교육부가 입력된 셀은 매핑될 수 없다. 이 문제를 해결하기 위해 아래와 같은 코드를 작성하였다. # 기관코드 merge new_df = pd.merge(df2, df1, how="left", left_on="소관기관", right_on="전체기관명") new_df.replace({np.nan: None}, inplace=True) # 소관기관이 여러개 인 경우가 있음 for idx, row in new_df.iterrows(): if row['소관기관'] != None and ..

파이썬(Python)&판다스(Pandas)&Polars 2023. 1. 10. 15:28

[blazegraph] blazegraph 설치와 대용량 데이터 넣기

Blazegraph RDF, Turtle 등 트리플 형식의 데이터를 저장하고 탐색하는 오픈소스 데이터베이스이다. 데이터를 업로드하고, Endpoint를 사용해 SPARQL 쿼리로 데이터를 탐색할 수 있다. blazegraph 공식 홈페이지 1. 설치 Release Blazegraph 2.1.6 Release Candidate · blazegraph/database blazegraph 깃헙 페이지에서 다운로드 가능 bigdata.jar 또는 blazegraph.jar 다운로드 하여 커맨드를 통해 실행 2. 사용방법 Quick_Start · blazegraph/database Wiki cd [blazegraph.jar가 존재하는 폴더] java -server -Xmx16g -jar blazegraph.jar..

지식그래프(Knowledge Graph) 2023. 1. 10. 15:26

여분의 해마

티스토리툴바

« 2025/01 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31