TF-IDF를 반영한 word cloud 개선 서울 집값 뉴스 워드클라우드
페이지 정보
작성자 Chrissy 작성일24-09-06 14:16 조회52회 댓글0건관련링크
본문
;1. 워드클라우드 text 다운로드□ 워드클라우딩 대상 텍스트 파일을 웹 스크롤 등의 방법으로 확보하여 내 컴퓨터에 텍스트 파일로 저장2. text 전처리□ 메모장과 엑셀을 활용하여 non-text 제거 등3. 워드클라우드 전처리 후 text 파일 저장□ 저장시 인코딩 : ANSI 4. 명사 추출 ;1)개념□ R 언어 KoLNP 패키지 등을 활용하여 한글 문장 내에서 명사를 추출하는 워드클라우드 작업2)KoLNP 패키지□install.packadges(KoLNP)□library(KoLNP)3)한글사전 등을 R에 로딩1)usesejongDic( )□R 형태소 분석시 다용하는 형태소사전2)useNIADic( )□sejongDic의 부족한 단어수를 보완하여 한국정보진흥원(NIA)에서 개발4)extractNoun( )을 활용하여 명사 추출 ;예시) 카톡 대화내용 텍스트 워드클라우드 마이닝1) (text 다운로드) 카톡문자 내용 다운로드 하기 (핸드폰에서는 할 수 없고, 데스크탑이나 노트북에서만 가능)□우측 상단 석삼자(≡) 클릭하여 대화내용">대화내보내기"클릭하여 파일명을 ;로 저장2) (text 전처리) 메모장 워드클라우드 및 엑셀을 활용하여 전처리 하기□;를 클릭하여□순서대로 클릭 후 기타에 "] 를 입력하고 마침3) (text 전처리 후 저장) 엑셀의 텍스트만으로 정리된 열(colume)을 카피하여 메모장에 붙여넣기 워드클라우드 후 ;로 저정□저장할 때 중요 포인트 ㅇ인코딩을 ANSI로 해야 함 ㅇ저정할 폴더 : R 워킹 디렉토리4) extractNoun()함수를 이용하여 명사 추출;1.개념□ 텍스트마이닝 결과를 단어그림으로 나타낸 워드클라우드 것2.wordcloud2 패키지□ 2018년 출시. wordcloud에 interactive 기능 등 추가3. 워드 클라우딩1) 벡터로 변환(1)list.files() 함수로 워킹디렉토리 안에 텍스트 파일 확인(2)setwd(텍스트파일 저장 위치)함수로 워킹디렉토리 안에 텍스트 워드클라우드 파일 확인□ 파일저장경로 : 파일을 우측마우스 클릭하여 속성에서 위치에 기재되어 있으므로 이를 카피하여 붙여넣기 ㅇ중요 포인트 : R의 setwd(텍스트파일 저장 위치)안에 파일 위치를 붙여 워드클라우드 넣은 후 역스매쉬를 스매쉬(/)로 바꿔주어야함
댓글목록
등록된 댓글이 없습니다.