'Develop/R' 카테고리의 글 목록

R을 활용한 데이터 시각화

R을 활용한 데이터 시각화 PLOT() 함수 PLOT()은 산점도 뿐만 아니라 일반적으로 객체를 시각화하는데 모두 사용될 수 있는 일반 함수. 일반 함수란 주어진 데이터 타입과 옵션에 따라 여러 종류의 그래프(산점도, 선그래프등)를 그릴 수 있다. 그래픽 옵션 plot()과 같은 그래픽 함수들은 여러가지 파라미터들로 그모양을 다듬을 수 있다. 자세한 내용은 ?par의 도움말을 확인하면 된다. 옵션 설명 xlab x축의 이름 ylab y축의 이름 main 그래프 제목 pch 점의 종류 cex 점의 크기 col 색깔 xlimx좌표축 값의 최대 범위 ylim y좌표축 값의 최대 범위 type 그래프의 종류 type옵션으로 그래프의 종류를 변경할 수 있다."l"은 직선, h는 수직선, s는 계단형, o는 점과 ..

2018. 1. 9. 18:22

Develop/R

R을 활용하여 데이터 처리하기

데이터 처리머신러닝 또는 데이터 마이닝 등의 프로젝트에서 모델을 만드는데 소용되는 시간은 전체 프로젝트의 14%정도이며, 그 중 데이터 전 처리 단계의 소요시간은 다른 단계들에서의 소요시간보다 큰 경우가 많은 작업이다. 파일 입출력 일반적인 text 파일을 읽거나 쓴다. data = read.table("~.csv", header=TRUE, sep=",",stringsAsFactors=FALSE,comment.char="#",fileEncoding="UTF-8",encoding="CP949")~.csv파일을 읽어 data.frame형태로 저장 header : TURE이면 헤더 정보 있음 sep : 필드 구분자를 지정. default필드 구분자는 blank stringsASFactor : TRUE이면 문자..

2018. 1. 8. 21:18

Develop/R

R의 DataType이해

R의 DataType 이해 스칼라(SCALAR) 숫자, 문자등의 단일 값을 저장하는 data type 숫자 : 정수 및 부동소수 지원 문자열 : 문자열 데이터를 저장하는 data type 진리값(Boolean) : TRUE, FALSE판단 &(AND) , |(OR), !(NOT)사용 NA(결측치) : 만약 데이터에 값이 존재하지 않는다면 NA로 표시함. is.na() 함수로 NA 확인가능 요인(Factor) : 범주형(Categorical) 변수를 위한 데이터 타입. 미리 정해진 여러 개의 값 중 하나의 값을 가짐 벡터(VECTOR) - 같은 데이터 타입을 갖는 1차원 배열 구조 - 여러 개의 데이터를 모아서 함께 저장하는 것을 의미 - c(), seq(), rep() 함수 사용 가능 - 벡터는 중첩 불..

2018. 1. 8. 17:09

Develop/R

R의 기본 사용법

R의 기본 사용법 R은 1줄씩 처리하는 인터프리터 언어 >는 명령 프롬프트. 원하는 명령을 치고 엔터로 실행R은 대소문자를 구분만약 이전에 했던 작업을 다시 수행하고 싶으면 ↑키 사용종료하려면 q()작업하는 내용을 저장할 작업 디렉토리를 지정하고 진행하는 것이 좋음. 산술 연산자 기호 의미 + 덧셈 - 뺄셈 * 곱셈 / 나눗셈 %/% 정수나눗셈 %% 나머지 ^.**거듭제곱 주석문 주석문은 실행되지않으며, #으로 명시한다. 세미콜론 여러 개의 식을 한줄레 쓸 수 있으며, ; 로 명시한다. 주요 수학 함수 함수 설명 abs(x) x의 절대값 ceiling(x),floor(x),trunc(x) 버림 함수들로 각각 x보다 큰 수중 가장 작은 정수x보다 작은 수 중 가장 큰 정수 0과 x사이의 가장 큰 정수 출력..

2018. 1. 8. 15:50

R을 활용한 데이터 시각화

R을 활용하여 데이터 처리하기

R의 DataType이해

R의 기본 사용법

공지사항

전체 카테고리

태그

전체 방문자

블로그 인기글

티스토리툴바

R을 활용한 데이터 시각화

R을 활용하여 데이터 처리하기

R의 DataType이해

R의 기본 사용법

공지사항

전체 카테고리

최근 글

최근댓글

태그

전체 방문자

블로그 인기글

티스토리툴바