일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- scrapy
- tensorflow
- graph
- yarn
- 하둡2
- hive
- python
- 딥러닝
- Sort
- NumPy
- recursion
- 파이썬
- 코딩더매트릭스
- 주식분석
- C
- LSTM
- collections
- 그래프이론
- 선형대수
- 하이브
- Java
- GRU
- hadoop2
- C언어
- 텐서플로
- effective python
- HelloWorld
- 알고리즘
- codingthematrix
- RNN
- Today
- Total
목록문서요약 (2)
EXCELSIOR
LEXRANK: GRAPH-BASED LEXICAL CENTRALITY AS SALIENCE IN TEXT SUMMARIZATION본 논문에서 제안한 LexRank는 Graph-based Extractive Summarization에 해당한다. LexRank는 문서 내 문장을 하나의 노드(node)로하는 그래프 표현하고, 한 문장의 중요도를 고유벡터 중심성(eigenvector centrality)를 이용하여 계산한다.1. INTRODUCTIONSummary는 두 가지 종류로 나눌 수 있다.Topic-oriented summaries : 사용자가 설정한 특정 주제(topic)를 중심으로 요약하는 방법generic summaries: 원본 텍스트가 포함하고 있는 전반적인 내용을 요약하는 방법 → 일반적인 ..
이번 포스팅은 구글의 PageRank를 Text에 적용시킨 TextRank 알고리즘에 대한 내용이다. TextRank 알고리즘을 알아본 후 다음 포스팅에서 TextRank를 이용하여 문서를 요약해주는 시스템 구현을 포스팅할 예정이다. TextRank 란? TextRank는 Mihalcea(2004)이 제안한 알고리즘으로 텍스트에 관한 graph-based ranking model 로써, Google의 PageRank를 활용한 알고리즘이다. PageRank는Brin and Page(1998)이 제안한 알고리즘으로 하이퍼링크를 가지는 웹 문서에 상대적 중요도에 따라 가중치를 부여하는 방법이다. 서로간의 인용과 참조로 연결된 임의의 묶음에 적용할 수 있다.(wikipedia) PageRank가 높은 웹페이지는..