일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- effective python
- 코딩더매트릭스
- 주식분석
- hive
- 파이썬
- python
- hadoop2
- GRU
- 하둡2
- codingthematrix
- NumPy
- 알고리즘
- 선형대수
- 하이브
- tensorflow
- C언어
- 딥러닝
- scrapy
- Java
- recursion
- C
- RNN
- HelloWorld
- yarn
- LSTM
- 텐서플로
- Sort
- collections
- graph
- 그래프이론
- Today
- Total
목록Study (184)
EXCELSIOR
collections.namedtuple() 1. namedtuple이란 명칭 그대로 index(idx)로만 값(value)에 접근 가능한 기본 투플(basic Tuple)과는 다르게 키(key)값으로 접근가능하도록 제공한다. 키(namedtuple에서는 field_names)를 가지고 값에 접근이 가능하다는 부분이 딕셔너리(dict)타입과 비슷하다고 할 수 있다. namedtuple()에 대한 자세한 내용은 docs.python.org에서 확인할 수 있다. namedtupled()은 collections.namedtuple(typename, field_names, verbose=False, rename=False)을 입력값으로 받으며, field_names 를 통해 namedtuple()의 키 즉, 필..
collections.deque 1. deque란 Deque(데크)는 double-ended queue 의 줄임말로, 앞과 뒤에서 즉, 양방향에서 데이터를 처리할 수 있는 queue형 자료구조를 의미한다. 아래의 [그림1]은 deque의 구조를 나타낸 그림이다. [그림1] Deque 구조 python에서 collections.deque는 list와 비슷하다. list의 append(), pop()등의 메소드를 deque에서도 제공한다. 예제 소스코드들을 통해 list와 deque의 차이를 알아보도록 하자. collections.deque의 자세한 설명은docs.python.org에서 확인할 수 있다. 2. collections.deque의 메소드(method)들 collections.deque의 메소드들..
collections.defaultdict 1. defaultdict란 collections.defaultdict는 딕셔너리(dictionary)와 거의 비슷하지만 key값이 없을 경우 미리 지정해 놓은 초기(default)값을 반환하는 dictionary이다. defaultdict과 관련하여 자세한 내용은 docs.python.org에서 확인할 수 있다. 예제의 소스코드를 통해 dict(기본 딕셔너리)와 defaultdict를 비교해보면, 예제(1-1)에서 기본 딕셔너리는 해당 키가 없는 값을 출력할 경우 KeyError Exception 에러가 나타난다. 반면에 예제(1-2)에서 defaultdict는 default_factory()라는 함수로 초기값(default)를 null로 지정해줬기 때문에 해..
collections.Counter() 컨테이너에 동일한 값의 자료가 몇개인지를 파악하는데 사용하는 객체이다. docs.python.org에서 Counter함수에 대해 자세히 알아볼 수 있다. A Counter is a dict subclass for counting hashable objects. It is an unordered collection where elements are stored as dictionary keys and their counts are stored as dictionary values. Counts are allowed to be any integer value including zero or negative counts. The Counter class is simila..
이번 포스팅은 구글의 PageRank를 Text에 적용시킨 TextRank 알고리즘에 대한 내용이다. TextRank 알고리즘을 알아본 후 다음 포스팅에서 TextRank를 이용하여 문서를 요약해주는 시스템 구현을 포스팅할 예정이다. TextRank 란? TextRank는 Mihalcea(2004)이 제안한 알고리즘으로 텍스트에 관한 graph-based ranking model 로써, Google의 PageRank를 활용한 알고리즘이다. PageRank는Brin and Page(1998)이 제안한 알고리즘으로 하이퍼링크를 가지는 웹 문서에 상대적 중요도에 따라 가중치를 부여하는 방법이다. 서로간의 인용과 참조로 연결된 임의의 묶음에 적용할 수 있다.(wikipedia) PageRank가 높은 웹페이지는..
이번 포스팅은 앞의 04.Scrapy를 이용한 뉴스 크롤링하기의 번외편으로써, Python의 newspaper라는 모듈을 이용하여 뉴스 기사를 크롤링하는 방법을 포스팅하고자 한다. newspaper 모듈 소개 newspaper는 사용자가 지정한 url에서 text를 추출해주는 모듈이다. 자세한 내용은 newspaper 0.0.9.8에서 확인할 수 있다. 이 모듈을 사용하면 앞에 포스팅했던 Scrapy를 몰라도 바로 사용이 가능한 아주 좋은 모듈이다. 아래의 내용은 newspaper 0.0.9.8에서 확인할 수 있는 newspaper에 대한 소개이다. “Newspaper is an amazing python library for extracting & curating articles.” – tweeted ..
이번 LSTM은 Chris송호연님의 블로그와 aikorea.org를 많이(실은 거의...) 참조하였으며, 이미지 출처는 원 저작자인 Colah.github.io 입니다. 문제가 될경우 삭제 하겠습니다..ㅜㅜ 1. LSTM 배경 - 장기 의존성(Long-Term Dependency) 문제점 RNN의 장점은 이전의 정보를 공유하여 활용할 수 있다는 것이다. 하지만, 시점간의 간격(Gap)이 크지 않을 경우에 가능하며 이러한 문제의 원인은 Vanishing Gradient에서 알 수 있듯이 BPTT에서 Chain Rule에 의해 [-1, 1]사이의 값들이 계속 곱해지다보니 앞쪽으로 갈 수록 그 값이 작아져, 결국에는 소멸해버려 Parameter들의 업데이트가 되지 않는 문제가 발생하기 때문이다. 이러한 문제를..
[문제] evenOrOdd 메소드는 int형 num을 매개변수로 받습니다. num이 짝수일 경우 "Even"을 반환하고 홀수인 경우 "Odd"를 반환하도록 evenOrOdd에 코드를 작성해 보세요. num은 0이상의 정수이며, num이 음수인 경우는 없습니다. 1. 내가 작성한 코드- if, else 문을 이용하여 2로 나눈 나머지가 0일 경우 'Even' 아닐경우 'Odds'를 리턴하도록 했다. 12345678910function evenOrOdd(num) { if(num % 2 == 0) return "Even"; else return "Odd";} // 아래는 테스트로 출력해 보기 위한 코드입니다.console.log("결과 : " + evenOrOdd(2));console.log("결과 : " +..