R 데이터시각화 함수를 활용한 탐색적 자료분석
질적 자료의 표현: 질적 자료를 표현하기 위하여 이용되는 그래프에는 막대그래프(bar graph), 원그래프(pie chart) 등이 있다. 막대그래프 : 질적 자료의 각 범주의 도수나 상대도수를 막대의 높이로 나타낸 그래프를 막대그래프라고 한다. > ### 1-1) 도수분포표와 막대그래프 #### > x x table(x) x 대중교통 도보 승용차 자전거 9 11 4 6 > barplot(table(x), xlab="범주", ylab="도수", main="통학수단 막대그래프") > ### 1-2) 히스토그램 #### > x=c(21.6, 23.6, 22.4, 25.3, 20.6, 26.1, 20.6, 23.4, 25.3, 21.3, + 35.1, 24.9, 21.8, 23.3, 22.2, 19.3, 1..
2021. 6. 10.
R plot: 이산형 분포의 근사
> # 1) 초기하분포의 이항근사 > > # 초기값 설정 : N=20, p=0.05 (K=1) > # n=5, x는 0부터 n=5까지, 반올림할 소수점 자리(eps=3) 지정 > N > # n=5, p=0.05(N=20, K=1)일 때의 초기하분포, 이항분포의 pdf를 벡터로 생성하여 비교 > # round() 함수를 사용하여 소수점 eps (3)번째 자리까지 표시 > # Excel의 round(number, num_digits) 함수와 사용방식 동일 > round(hyper.v1 round(binom.v1 > # N의 배수 지정: N을 20, 40, 60, 100, 1000, 10000까지로 만들기 위함 > N.times > # 초기하분포 행렬(hyper.m1)을 sapply와 N.times를 이용하여..
2021. 6. 9.
R plot: 이산형 분포의 누적분포함수
> # 2) 초기하분포의 누적분포함수 > > # 초기값으로 재설정 > N chpar > # phyper() 함수를 이용하여 초기하분포의 cdf 변수인 c.hyper 생성 > c.hyper1 # c.hyper의 plot 생성 : 누적확률분포이므로 y의 범위는 0부터 1까지로 지정 > plot(0:5, c.hyper1, type='S', col='Red', ylab='F(x)', xlab='X', lwd=3, ylim=c(0, 1), + main = c("X ~ HG(N=20; n=5, p=0.2); cdf")) > # 하얀 배경에 하얀 선을 삽입하여 세로선을 가리는 효과 적용 > points(x-1, c.hyper1, type='h', col="white", lwd=5) > # 폐구간(시작점) > poin..
2021. 6. 8.
R plot: 이산형 분포의 확률밀도함수
> ##### Theme 1. 이산형 분포의 pdf와 cdf ##### > # 1) 초기하분포의 확률밀도함수 > > # 초기값을 N=20, K=4(p=0.2)로 설정 > # n=5, x는 0부터 n=5까지 지정 > N # 초기하분포(hyper)의 pdf(p)이므로 변수 이름을 p.hyper로 지정 > # 모수의 초기값 N=20, K=4, n=5로 p.hyper1 생성 > p.hyper1 # 모든 p.hyper의 값이 0.47을 초과하지 않으므로 y의 범위를 0부터 0.5로 고정 > # col(색상)은 "Red", "Green", "Blue", "Orange", "Skyblue", "Purple" 순으로 지정 > plot(0:5, p.hyper1, type='h', col='Red', ylab='f(x)'..
2021. 6. 8.