본문 바로가기

데이터 [Data]/R22

R Distributions: 이항분포의 누적분포함수 > ##### 실습2. 이항분포의 누적분포함수 ##### > opar > p points(x-1, binom.cdf.1, type='h', col="white", lwd=5) # type='h', col='white'로 하얀 세로막대선 생성, cdf에서 불필요한 y축 선을 하얀 선으로 덮는 효과 적용 > points(x-1, binom.cdf.1, pch=16) # 폐구간(시작점) > points(x, binom.cdf.1, pch=1) # 개구간(종료점) > > # 확률을 0.3으로 변경 > p (binom.cdf.2 plot(x, binom.cdf.2, type='S', ylab='F(x)', xlab='x', ylim=c(0,1), + main="X ~ B(10, 0.3); CDF", lwd=5, .. 2021. 6. 5.
R Distributions: 이항분포 > ##### [R Distributions] ##### > ##### 1. Binomial Distributions : 이항분포 ##### > > # 1) pmf을 이용한 확률 계산 > p p # 2) dbinom 함수를 이용한 확률 계산 > dbinom(1, size=n, prob=p) # dbinom = d(밀도함수) + binom(이항분포) = density + binomial [1] 0.4444444 > (binom.pdf > # 3) dbinom 함수와 cumsum 함수를 이용한 누적확률 계산 > cumsum(binom.pdf) # 전체 누적확률분포 계산 = cum(누적분포) + sum(합) [1] 0.2962963 0.7407407 0.9629630 1.0000000 > > # 4) pbin.. 2021. 6. 4.
R Graphics 3: 문자나 점의 크기, 그래픽모수, 플랏영역, 좌표축범위 > ##### 10. 문자나 점의 크기(cex)지정 / 디폴트: cex=1 ##### > plot(dist ~ speed, xlab ="Speed (mph)", ylab ="Stopping distance (ft)", + pch="+", cex=1, cars) > plot(dist ~ speed, xlab ="Speed (mph)", ylab ="Stopping distance (ft)", + pch="+", cars) > plot(dist ~ speed, xlab ="Speed (mph)", ylab ="Stopping distance (ft)", + pch="+", cex=2, cars) > ##### 11. par()함수를 이용한 그래픽모수 설정 ##### > plot(dist~speed, type.. 2021. 6. 3.
R Graphics 2: 그래프유형, 색상, 낮은 수준의 그래프함수 > ##### 7. 그래프유형(type) 지정 ##### > x y opar plot(x, y, type = "p", main="type=p") # point > plot(x, y, type = "l", main="type=l") # line > plot(x, y, type = "b", main="type=b") # both (point + line) > plot(x, y, type = "o", main="type=o") # line이 point를 관통 (overplotted) > plot(x, y, type = "c", main="type=c") # cancel (both - point) > plot(x, y, type = "s", main="type=s") # step ft. (stair steps).. 2021. 6. 2.
R Graphics 1: plot(), attach(), with() 함수, 제목, 축 이름, 점(pch) [R Graphics] ##### 1. cars 데이터 세트 ##### # plot을 출력하는 그래픽 장치는 여러 가지 그래픽 인수(graphical parameters)를 갖고있다. # 그래픽 인수는 그래픽 속성을 정의한 값으로, # 화면의 분할 방법, 그림 영역의 크기와 위치, 플랏 영역을 둘러싼 상자의 모양, 마진, # 좌표 영역에 데이터가 표시되는 형태, 선의 종류, 문자나 글자의 크기 및 색상 등의 설정값이다. > head(cars) # 자동차 속도(mph)에 따른 제동거리(ft)를 측정한 데이터 세트 speed dist 1 4 2 2 4 10 3 7 4 4 7 22 5 8 16 6 9 10 > ?cars # cars에 대한 가이드 > help(cars) # 위와 동일 > ##### 2. 산점도.. 2021. 6. 1.
R apply 함수군: apply(), lapply(), sapply(), tapply(), mapply() 참고도서: R 통계 프로그래밍의 이해 - 차영준, 박진표 (자유아카데미) 5장 www.yes24.com/Product/Goods/68712840 R 통계 프로그래밍의 이해 '최근에 빅데이터와 관련된 용어들이 많이 사용되고 있다. 인공지능, 머신러닝, 데이터 과학, 데이터 과학자, 4차 산업혁명 등과 같은 단어들을 많이 접하게 된다. 이처럼 많은 사람들이 빅데이 www.yes24.com > #### 5.1 apply() 함수 #### > > #행렬에 행 방향으로 apply() 함수 적용 > mData mData [,1] [,2] [1,] 1 6 [2,] 2 7 [3,] 3 8 [4,] 4 9 [5,] 5 10 > apply(mData, 1, mean) ## 행렬 또는 데이터 프레임 객체를 평균 함수를 지정.. 2021. 5. 1.
R 제어문: 조건문, 반복문 참고도서: R 통계 프로그래밍의 이해 - 차영준, 박진표 (자유아카데미) 4장 www.yes24.com/Product/Goods/68712840 R 통계 프로그래밍의 이해 '최근에 빅데이터와 관련된 용어들이 많이 사용되고 있다. 인공지능, 머신러닝, 데이터 과학, 데이터 과학자, 4차 산업혁명 등과 같은 단어들을 많이 접하게 된다. 이처럼 많은 사람들이 빅데이 www.yes24.com > #### 4.1 조건문 #### > > # 4.1.1 단순 if() 문 # > x y if(mean(x) == mean(y)) print ("mean(x) is equal to mean(y)") [1] "mean(x) is equal to mean(y)" > ## x의 평균과 y의 평균이 같을 경우 "mean(x) ~ .. 2021. 4. 30.
R 데이터 가공: 결측값 처리, 그룹별 요약통계량 계산, 변환 참고도서: R 통계 프로그래밍의 이해 - 차영준, 박진표 (자유아카데미) 3장 www.yes24.com/Product/Goods/68712840 R 통계 프로그래밍의 이해 '최근에 빅데이터와 관련된 용어들이 많이 사용되고 있다. 인공지능, 머신러닝, 데이터 과학, 데이터 과학자, 4차 산업혁명 등과 같은 단어들을 많이 접하게 된다. 이처럼 많은 사람들이 빅데이 www.yes24.com > #### 3.5 결측값 처리 #### > > # 3.5.1 na.omit() 함수 # > name gender toeic gpa xyz xyz name gender toeic gpa 1 Cha M 990 4.5 2 Park F 850 3.8 3 Jung M NA 4.5 4 Kim F 690 3.2 5 Lee F 730 .. 2021. 4. 29.
R 데이터 가공: 정렬, 결합 및 분리 참고도서: R 통계 프로그래밍의 이해 - 차영준, 박진표 (자유아카데미) 3장 www.yes24.com/Product/Goods/68712840 R 통계 프로그래밍의 이해 '최근에 빅데이터와 관련된 용어들이 많이 사용되고 있다. 인공지능, 머신러닝, 데이터 과학, 데이터 과학자, 4차 산업혁명 등과 같은 단어들을 많이 접하게 된다. 이처럼 많은 사람들이 빅데이 www.yes24.com > #### 3.3 데이터의 정렬 #### > > # 3.3.1 sort()와 order() 함수에 의한 데이터 정렬 # > #벡터 정렬 > x sort(x) ## 오름차순 정렬 [1] 11 22 33 44 55 > sort(x, decreasing = TRUE) ## 내림차순 정렬 [1] 55 44 33 22 11 > o.. 2021. 4. 28.