일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- scrapy
- hadoop2
- Java
- LSTM
- 파이썬
- 텐서플로
- 선형대수
- codingthematrix
- python
- 딥러닝
- yarn
- hive
- recursion
- NumPy
- 하이브
- 코딩더매트릭스
- 하둡2
- C
- C언어
- tensorflow
- RNN
- GRU
- 알고리즘
- graph
- collections
- 그래프이론
- 주식분석
- effective python
- Sort
- HelloWorld
- Today
- Total
목록konlpy (2)
EXCELSIOR
이번 포스팅은 구글의 PageRank를 Text에 적용시킨 TextRank 알고리즘에 대한 내용이다. TextRank 알고리즘을 알아본 후 다음 포스팅에서 TextRank를 이용하여 문서를 요약해주는 시스템 구현을 포스팅할 예정이다. TextRank 란? TextRank는 Mihalcea(2004)이 제안한 알고리즘으로 텍스트에 관한 graph-based ranking model 로써, Google의 PageRank를 활용한 알고리즘이다. PageRank는Brin and Page(1998)이 제안한 알고리즘으로 하이퍼링크를 가지는 웹 문서에 상대적 중요도에 따라 가중치를 부여하는 방법이다. 서로간의 인용과 참조로 연결된 임의의 묶음에 적용할 수 있다.(wikipedia) PageRank가 높은 웹페이지는..
KoNLPy는 한글형태소 분석기이다. 학부생때 java로 프로젝트 할 때는 KOMORAN 형태소 분석기를 사용하였고, apache solr 공부할 때는 arirang 분석기를 가지고 공부하였다.파이썬에도 한글형태소 분석기가 있는데 그것이 바로 KoNLPy이다. KoNLPy는 오픈소스이며 누구나 개발과정에 참여할 수 있다.(참여할 수준이 되려면 엄청난 실력자가 돼야겠지만..ㅜㅜ) 1. 설치하기1) Ubuntu(우분투)우분투는 확실히 설치하기가 간단하다. 다음과 같은 명령어만 입력하면 된다. $ pip install konlpy # Python 2.x $ pip3 install konlpy # Python 3.x 2) 윈도우에 설치윈도우에 설치하려면 먼저 JPype를 설치해야 한다. 아래의 사이트에서 자신에..