TextRank 3

[TextRank] KR-WordRank 한국어 키워드 추출

https://github.com/lovit/KR-WordRank GitHub - lovit/KR-WordRank: 비지도학습 방법으로 한국어 텍스트에서 단어/키워드를 자동으로 추출하는 비지도학습 방법으로 한국어 텍스트에서 단어/키워드를 자동으로 추출하는 라이브러리입니다. Contribute to lovit/KR-WordRank development by creating an account on GitHub. github.com https://pypi.org/project/krwordrank/ krwordrank KR-WordRank: Korean Unsupervised Word/Keyword Extractor pypi.org 설치 pip install krwordrank 기본 활용 from krword..

개발일지 2023.04.27

[TextRank] pytextrank와 spacy 한글 키워드 추출

pytextrank 설치 pip install pytextrank dependency로 spacy가 함께 설치됨 한국어 키워드 추출 예시 근데 성능 진짜 안좋은거같음...파라미터 조작이나 한글 모델을 더 정교한거 아니면 힘든것같음 encoding 깨지면 # -*- coding: utf-8 -*- 추가하기 # -*- coding: utf-8 -*- import spacy import pytextrank # scapy의 한국어모델인 ko_core_news_sm을 사용함 https://spacy.io/models/ko/ # example text text = "서울 지진 피해에 대한 데이터 분석을 위해서는 어떤 종류의 데이터를 사용해야 할지 먼저 생각해보아야 합니다. 예를 들어, 지진 발생 시간, 지진 규모,..

개발일지 2023.04.27