We-Co

[R] symbols() - 심볼 그래프를 활용해서 데이터를 시각화해보자! 본문

R

[R] symbols() - 심볼 그래프를 활용해서 데이터를 시각화해보자!

위기의코딩맨 2024. 3. 18. 14:03
반응형

안녕하세요. 위기의 코딩맨입니다.

오늘은 symbols 함수를 이용해서 데이터를 시각화 해보는 방법을 알아보도록 하겠습니다.

빠르게 알아보도록 하죠!

 

[ symbols() ]

먼저 R의 내장된 데이터인 trees를 사용해보도록 하겠습니다.

미국에서 흑단나무 데이터를 저장해 놓은 것이라고 합니다.

trees를 확인해보면,

Girth(지름), Height(높이), Volume(볼륨)의 항목의 데이터를 확인할 수 있습니다.

head(trees)

 

아래의 코드를 확인해 보겠습니다.

먼저, with() 함수는 데이터 프레임, 리스트 변수에 이름으로 접글 가능할 있도록 도움을 주는 함수입니다.

그 함수에 trees 데이터를 적용  합니다.

그리고 Height, Volume을 설정했습니다. 순서로 x, y 좌표에 적용한다고 생각해주시면 됩니다.

circles 크기를 설정해 주었습니다. 13으로 나누는 이유는 Girth의 크기의 평균으로 적용했습니다.

inches는 원의 크기를 인치로 설정할 것인지(T), 플롯에 대한 크기에 상대적으로 표현할지 설정합니다.(F)

그리고 색상과 타이틀을 지정했습니다.

with(trees,{ symbols(Height, Volume, circles = Girth/13, inches=F, bg=1:N, fg =1:N, main="Symbols")})

 

 

 

간단하게 표현된 그래프를 설명하면

위에 1번 항목의 데이터로 예를 들어보겠습니다.

Height가 70인 값에 10.3의 Volume 데이터를 확인해보면

빨간색 네모칸의 데이터임을 확인할 수 있습니다.

 

 

또한 85~90 사이에 가장 큰 값이 있을것으로 예상됩니다.

데이터를 확인해 보니, 87에 77 값으로 가장 큰 데이터를 확인 되었습니다!

 

시각화도 재밋지만, 

데이터의 연관성을 시각화하는 방법도 차차 알아보도록 하곘습니다.

반응형