본문 바로가기

Data Analysis

비정형 데이터 분석 - Gephi를 이용한 데이터 필터링 및 시각화

Gephi를 조작하여 언론데이터를 필터링하고 분석해보자

데이터클렌징: 필요한 데이터만 남기는 과정 (토픽과 관련없는 단어) => 블랙리스트 과정

화이트리스트 과정: 꼭 필요한 단어 추출

이음동의어 단어정리 : 유사한 단어들을 하나의 통일된 단어로 정리

ex) 블록체, blockchain => 블록체인으로 통일

분석자가 직접 만들어야 함. 

,이날, 먼저 삭제하고 그 다음에 이날, 삭제 

 

데이터 - 텍스트 나누기 - 구분 기호로 분리됨

undirected 무방향성

<데이터 분석을 위한 importing이 완료된 상태>

 

<65만개의 까만 선으로 데이터가 나타난 모습>

 

<평균보기>

Modularity : 실제 자신이 그룹에 속하고 다른 그룹에 이질적인 정도

 

<degree range 설정>

node간 얼마나 연결되어 있는지 나타난다. 오른쪽 맨 하단에 1000개로 숫자 변경

Topology - Degree Range

<노드의 크기 설정하기>

Nodes > ranking > modularity class

Eigenvector centrality 기준으로 : 최대 크기 설정 : 250

한글이 깨지는 경우가 있기 때문에 글씨체를 맑은 고딕으로 설정