내일(아니, 오늘이구나) 아침 machine learning 스터디 때문에 집단지성 책을 보고 있는데, 막상 돌아가는 걸 보니 너무 신기하다. 난 처음에 한글 뉴스 기사에서 명사 단어를 추출하는데 힘을 너무 많이 뺐는데, 이 책 저자는 쿨하게 영어 단어를 빈칸 단위로 나눠서 썼다. 진작 나도 이렇게 할껄-_- 어쨌거나 저쨌거나, 내가 한글 형태소 분석기를 만들 수는 없었던 관계로, 각 단어를 빈칸 단위로 나눈 다음에, 네이버 사전에서 쿼리를 날린 다음, 네이버 사전이 “명사”라고 판단해 준 단어만 사용하였다. 조사가 포함된 단어를 던져도 네이버 사전은 알아서 분석해서 결과를 던져주니 그저 고마울 따름. :) 물론 네이버 사전을 파싱하는 삽집은 좀 했다. 매번 단어를 찾을 때 마다, 네이버 사전에 물어 볼..