일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- scrapy
- HelloWorld
- yarn
- tensorflow
- collections
- 파이썬
- 텐서플로
- GRU
- 알고리즘
- C
- C언어
- hadoop2
- effective python
- 하둡2
- Java
- 코딩더매트릭스
- 주식분석
- LSTM
- 그래프이론
- 하이브
- Sort
- NumPy
- RNN
- python
- codingthematrix
- 선형대수
- hive
- graph
- 딥러닝
- recursion
- Today
- Total
목록문서요약 (2)
EXCELSIOR
LEXRANK: GRAPH-BASED LEXICAL CENTRALITY AS SALIENCE IN TEXT SUMMARIZATION본 논문에서 제안한 LexRank는 Graph-based Extractive Summarization에 해당한다. LexRank는 문서 내 문장을 하나의 노드(node)로하는 그래프 표현하고, 한 문장의 중요도를 고유벡터 중심성(eigenvector centrality)를 이용하여 계산한다.1. INTRODUCTIONSummary는 두 가지 종류로 나눌 수 있다.Topic-oriented summaries : 사용자가 설정한 특정 주제(topic)를 중심으로 요약하는 방법generic summaries: 원본 텍스트가 포함하고 있는 전반적인 내용을 요약하는 방법 → 일반적인 ..
이번 포스팅은 구글의 PageRank를 Text에 적용시킨 TextRank 알고리즘에 대한 내용이다. TextRank 알고리즘을 알아본 후 다음 포스팅에서 TextRank를 이용하여 문서를 요약해주는 시스템 구현을 포스팅할 예정이다. TextRank 란? TextRank는 Mihalcea(2004)이 제안한 알고리즘으로 텍스트에 관한 graph-based ranking model 로써, Google의 PageRank를 활용한 알고리즘이다. PageRank는Brin and Page(1998)이 제안한 알고리즘으로 하이퍼링크를 가지는 웹 문서에 상대적 중요도에 따라 가중치를 부여하는 방법이다. 서로간의 인용과 참조로 연결된 임의의 묶음에 적용할 수 있다.(wikipedia) PageRank가 높은 웹페이지는..