'정규표현' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

글쓰기
방명록
RSS
관리

목록정규표현 (1)

EXCELSIOR

Chap02-2 : Replacing and Correcting Words

1. Replacing words matching regular expressions앞의 포스팅(Stemming, Lemmatizing)에서는 언어의 압축(linguistic compression)이었다면 Word Replacement는 텍스트 정규화(text normalization) 또는 오타 수정으로 볼 수 있다. 아래의 예제는 영어의 축약형 표현을 원래의 표현으로 바꿔주는 예제이다. 예를 들어, "can't → can not", "would've → would have"로 바꿔준다. replacers.py의 RegexpReplacer( )를 import 하여 구현하였다. r'(\w+)\'ve'는 've을 포함하는 단어들을 찾아서 '\g have'에서 've 앞의 단어를 g로 그룹핑한 뒤 have를..

NLP/NLTK 2016. 12. 26. 14:10

Prev 1 Next

목록정규표현 (1)

EXCELSIOR

티스토리툴바