2018년 10월 1일 월요일

,

트위터 메시지 크롤링과 기초 (빈도) 분석 방법

동적 html 사이트 (트위터) 메시지 크롤링과 기초 (빈도) 분석 방법

1단계: 트위터에서 원하는 키워드를 이용해 텍스트를 서치한다.
       
            https://twitter.com/search-advanced?lang=ko
         * 키워드, 작성자 국가, 기간, 자세한 검색 조건 지정

2단계: 서치한 결과를 아래 프로그램에 복사한뒤, 원하는 텍스트만을 추출한다.

         트위터 텍스트 정제 엑셀프로그램 (제작 JLab 정재학 2016)

3단계 분석 프로그램 다운로드:

아래 링크를 이용해 워드 문서를 다운로드 한 뒤 화일을 여세요.

이문서는 매크로가 포함된 문서이므로 본인 컴퓨터의 ms word 환경설정에서 콘텐츠 사용 (매크로 허용)으로 되어 있어야 작동합니다. 작동 안할 경우, 본인 프로그램의 환경 설정을 매크로를 사용할 수 있도록 조정하세요.

4단계: 분석하고자 하는 텍스트를 위의 워드화일에 텍스트 형태로 복사
JLab Text Reformer를 통해 추출한 텍스트를 전체 복사하여 해당 워드문서에 복사하세요.
(주의사항: 워드문서에 복사시 반드시 선택하여붙여넣기를 해야 하며, 형식은 '서식없는 유니코드 텍스트'로 붙여넣기를 하세요. 왜? 그냥 붙여넣기 해보면 이유를 알겁니다.^^)

5단계: 분석 실행
   워드메뉴 중 추가기능 -> process를 연속 클릭하세요.



6단계: 결과 해석
 아래 처럼 가장 빈도수 높은 단어부터 단어와 해당 빈도수가 표시됩니다. 이상 끝! (해보면 무지 쉽지요^^;)




Share this post: