Gephi를 조작하여 언론데이터를 필터링하고 분석해보자
데이터클렌징: 필요한 데이터만 남기는 과정 (토픽과 관련없는 단어) => 블랙리스트 과정
화이트리스트 과정: 꼭 필요한 단어 추출
이음동의어 단어정리 : 유사한 단어들을 하나의 통일된 단어로 정리
ex) 블록체, blockchain => 블록체인으로 통일
분석자가 직접 만들어야 함.
,이날, 먼저 삭제하고 그 다음에 이날, 삭제
데이터 - 텍스트 나누기 - 구분 기호로 분리됨
undirected 무방향성
<데이터 분석을 위한 importing이 완료된 상태>
<65만개의 까만 선으로 데이터가 나타난 모습>
<평균보기>
Modularity : 실제 자신이 그룹에 속하고 다른 그룹에 이질적인 정도
<degree range 설정>
node간 얼마나 연결되어 있는지 나타난다. 오른쪽 맨 하단에 1000개로 숫자 변경
Topology - Degree Range
<노드의 크기 설정하기>
Nodes > ranking > modularity class
Eigenvector centrality 기준으로 : 최대 크기 설정 : 250
한글이 깨지는 경우가 있기 때문에 글씨체를 맑은 고딕으로 설정
'Data Analysis' 카테고리의 다른 글
데이터그리기 (0) | 2019.04.26 |
---|---|
무료 네트워크 분석 프로그램 - 데이터 시각화 도구 Gephi 설치 (0) | 2019.04.19 |
군집 분석을 위한 기초개념과 네트워크 분석 (1) | 2019.04.12 |
데이터 분석의 기초 (0) | 2019.04.05 |
데이터분석가가 갖추어야 할 스펙은 뭐가 있을까 (0) | 2019.04.04 |