R을 활용한 데이터 시각화
PLOT() 함수
PLOT()은 산점도 뿐만 아니라 일반적으로 객체를 시각화하는데 모두 사용될 수 있는 일반 함수.
일반 함수란 주어진 데이터 타입과 옵션에 따라 여러 종류의 그래프(산점도, 선그래프등)를 그릴 수 있다.
그래픽 옵션
plot()과 같은 그래픽 함수들은 여러가지 파라미터들로 그모양을 다듬을 수 있다.
자세한 내용은 ?par의 도움말을 확인하면 된다.
옵션 |
설명 |
xlab |
x축의 이름 |
ylab |
y축의 이름 |
main |
그래프 제목 |
pch |
점의 종류 |
cex |
점의 크기 |
col |
색깔 |
xlim | x좌표축 값의 최대 범위 |
ylim | y좌표축 값의 최대 범위 |
type | 그래프의 종류 |
type옵션으로 그래프의 종류를 변경할 수 있다.
"l"은 직선, h는 수직선, s는 계단형, o는 점과 선을 overlap해서 그린다. 그외에도 다양한 옵션이 있다.
점(points)
pints()는 점을 그리는 함수이다. plot()을 연달아 호출하는 경우 매번 새로운 그래프가 그려지는 것과 달리 points()는 이미 생성된 plot에 점을 추가로 그려준다.
선(lines)
lines()는 points()와 마찬가지로 plot()으로 새로운 그래프를 그린 뒤 선을 그리는 목적으로 사용된다.
직선(ABLINE)
abline은 y = a + bx 형태의 직선 또는 h=y형태의 고로로 그은 직선 또는 v= y형태의 세로로 그은 직선을 그래프에 추가할 수 있다.
identify()
그래프상에서 특정 점을 클릭하면 클릭된 점과 가장 가까운 데이터의 번호를 표시해준다. 작업을 중단하려면 ESC키를 누른다.
범례(legend)
legend()는 범례를 표시하는데 사용된다. 가장 기본적인 형식은 legend(x, y=NULL, legend)인데, 범례가 보여질 (x,y)좌표를 지정할 수 있고, 사전에 정의된 키워드 중 하나로 범례의 위치를 지정해도 된다.
막대 그래프(Barplot)
흑히 볼 수 있는 막대 모양의 그래프로 다양한 형태로 사용될 수 있다.
히스토그램 Hist()
자료의 분포를 알아보는데 유용한 그래프는 히스토그램이다.
파이 그래프(PIE)
데이터 비율을 알아보는데 적합하다.
모자이크 플롯(MOSAICPLOT)
범주형 다변량 데이터를 표현하는데 적합한 그래프이다. 모자이크 플롯에는 사각형들이 그래프에 나열되며, 각 사각형의 넓이가 각 범주에 속한 데이터의 수에 해당한다. 타이타닉호 생존자의 정보를 담고 있는 Titanic데이터를 사용해 모자이크 플롯을 그려본다.
타이타닉은 table 클래스의 데이터이며 속성은 객실 부분, 성별, 성인인지의여부, 생존여부로 구성되어있다.
산점도 행렬(PAIRS)
산점도 행렬(Scatter Plot Matrix)은 다변량 데이터에서 변수 쌍간의 산점도 행렬을 그린 그래프
다음 코드는 iris 데이터에서 각 종별로 산점도 행렬을 그린다.
등고선 그래프
값이 같은 곳들을 선으로 연결한 등고선을 이용해 데이터를 표시
CHERNOFF FACE DIAGRAM
얼굴의 체르노프 얼굴은 다차원 통계 데이터를 사람의 얼굴 이미지를 이용해 시각적으료 표현하는 방법이다.
GGPLOT2
기본 R 그래픽스에서 제공하는 대부분의 작업을 효과적으로 수행할 수 있는 시각화 기본 패키지이다.
ggplot2의 문법을 구성하는 요소는 다음과 같다.
- 데이터 프레임
- 색상, 크기 같은 외적요소
- 점, 선, 모양 같은 기하학적 요소
- 통계적 처리 방법
- aes에서 사용할 스케일(scale)
위 상태는 ggplot2에서 어떤 데이터를 사용할지만 지정된 상태이다.
어떤 모양의 그래프를 원하는지 입력하지 않았기 때문에 그래프가 출력되지 않는다.
aes(색상, 크기 등의 원하는 디자인) 요소를 추가하면된다.
GEMO_의 종류
abline |
절편과 기울기를 이용하여 그리는 직선 |
area |
영역 그림 |
bar |
막대그림 |
boxplot |
상자그림 |
density |
smooth density |
histogram |
히스토그램 |
hline/vline |
수평직선/수직직선 |
jitter |
점 흐트려 그리기 |
line |
x값 순서로 점 연결하여 그리는 직선 |
smooth |
smooth line |
동적인 그래프 만들기(GOOGLEVIS)
install.packages("googleVis")
library(googleVis)
ggmap
지도 정보를 표기해주는 라이브러리
'Develop > R' 카테고리의 다른 글
R을 활용하여 데이터 처리하기 (0) | 2018.01.08 |
---|---|
R의 DataType이해 (0) | 2018.01.08 |
R의 기본 사용법 (0) | 2018.01.08 |
최근댓글