Python 3.8.8 rc1
OpenJDK 18-ea
JPype1.2
초기에 Python 버전 3.9 KoNLPy 1.3_x64 버전으로 설치를 하였는데 버전이 안 맞는지 계속 에러가 발생하였습니다.
윈도우 환경에서 KoNLPy를 사용하기 위해서 먼저 파이썬과 Visual Studio Code를 설치합니다. 터미널을 실행하고 konlpy 명령으로 패키지를 설치합니다. KoNLPy 공식 웹사이트에 각 플랫폼별 설치 매뉴얼이 작성되어 있습니다.
https://konlpy.org/ko/latest/install/#id2
아래 웹사이트에서 다운로드할 수 있습니다.
https://www.python.org/downloads/
IDE는 서브라임 텍스트 혹은 Vim 등을 사용해도 됩니다.
https://code.visualstudio.com/
JDK 환경변수를 추가해야 합니다. Oracle JAVA의 경우 라이선스 문제가 있어 무료 라이선스인 AdotOpenJDK로 설치하였습니다.
또는 OpenJDK를 다운로드하여 설치해도 무방합니다.
파이썬이 설치가 완료되면은 터미널 창에서 pip 명령으로 KoNLPy 패키지를 설치할 수 있습니다.
pip install konlpy
정상적으로 설치가 되었는 아래 명령으로 확인합니다.
pip show konlpy
Requires를 보게 되면 numpy, beatifulsoup4, colorama, lxml, tweepy, JPype1 등 추가 설치되어 있는 것을 알 수 있습니다.
JPype1 이 잘못 설치가 되어 실행되지 않을 경우가 있을지 모르니 현재 컴퓨터의 환경에 맞게 JPype1을 재 설치 필요할 수도 있습니다. 컴퓨터의 환경에 따른 패키지는 아래 웹 사이트에서 확인할 수 있습니다.
https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype
JPype1 이 정상적으로 설치되었지만 아래와 같은 에러가 발생할 수 도 있다. https://visualstudio.microsoft.com/ko/visual-cpp-build-tools/ 웹사이트로 이동하여 Visual C++ 용 Build Tools를 다운로드합니다.
컴퓨터에 Visual Studio 가 설치되어있는 환경이라면 위에 에러는 발생하지 않습니다. 아무것도 없는 상황에서 발생함으로 이미 설치되어있는 환경에서는 다음 단계로 가도 무방합니다.
Python 버전이랑 JPype 버전이랑 무슨 차이가 있는지 3.9에서 동작하지 않아 우여곡절 끝에 코드를 실행합니다. morphs라는 메서드는 문장에서 형태소를 추출하는 기능을 합니다. 이외에 nouns는 명사 추출 품사 부착의 기능을 한다고 합니다.
테스트 코드에서 import 한 Okt 는 Open Korean Text의 줄임말로 https://github.com/open-korean-text/open-korean-text 오픈 소스 한국어 분석기이며 과거 트위터 형태소 분석기이며 이외에도 Hannanum, Kkma, Komoran, Mecab 등이 있습니다.
from konlpy.tag import Okt
okt = Okt()
token = okt.morphs("엄마가 방에 들어가신다.")
print(token)
token = okt.morphs("엄마 가방에 들어 가신다.")
print(token)
Okt 만 import 하여서 출력했을 때의 결과입니다.
환경설정 한참 하다가 문득 이런 제 모습이 생각나네요. 차라리 COLAB에서 할걸..
COLAB 에서 KoNLPy WordCloud 설치하기 (0) | 2021.07.10 |
---|---|
KoNLPy 로 워드 클라우드 만들어 보기 IDEA (0) | 2021.07.10 |
댓글 영역