Data Analysis
비정형 데이터 분석 - Gephi를 이용한 데이터 필터링 및 시각화
웰던
2019. 5. 3. 02:39
Gephi를 조작하여 언론데이터를 필터링하고 분석해보자
데이터클렌징: 필요한 데이터만 남기는 과정 (토픽과 관련없는 단어) => 블랙리스트 과정
화이트리스트 과정: 꼭 필요한 단어 추출
이음동의어 단어정리 : 유사한 단어들을 하나의 통일된 단어로 정리
ex) 블록체, blockchain => 블록체인으로 통일
분석자가 직접 만들어야 함.
,이날, 먼저 삭제하고 그 다음에 이날, 삭제
데이터 - 텍스트 나누기 - 구분 기호로 분리됨
undirected 무방향성
<데이터 분석을 위한 importing이 완료된 상태>
<65만개의 까만 선으로 데이터가 나타난 모습>
<평균보기>
Modularity : 실제 자신이 그룹에 속하고 다른 그룹에 이질적인 정도
<degree range 설정>
node간 얼마나 연결되어 있는지 나타난다. 오른쪽 맨 하단에 1000개로 숫자 변경
Topology - Degree Range
<노드의 크기 설정하기>
Nodes > ranking > modularity class
Eigenvector centrality 기준으로 : 최대 크기 설정 : 250
한글이 깨지는 경우가 있기 때문에 글씨체를 맑은 고딕으로 설정