Category Archives: 통계

[통계] 분석 대상 변수 유형과 분석 방법

분석 대상 변수 유형과 분석 방법 독립변수(설명변수) 종속변수(반응변수) 분석법 또는 연관성 측도 이분형(Dichotomous) 연속형 T-검정 범주형 연속형 ANOVA 연속형(일변량) 연속형 단순선형회귀분석 다변량 연속형 다중선형회귀분석 이분형(Dichotomous) 이분형(Dichotomous) 오즈비, 상대위험도, 차이 검정 등 범주형 범주형 카이제곱검정 다변량 이분형(Dichotomous) 로지스틱회귀분석 범주형 Time-to-event Kaplan-Meier curve/log-rank test 다변량 Time-to-event Cox-proportional hazards model

11. Unusual and Influential Data – 11.1 Outlier, Leverage, and Influence

library(car) data(Davis) davis<-cbind(Davis,”sex_cd”=ifelse(davis$sex==’M’, 0,1)) head(davis) reg<-lm(repwt~weight*sex_cd, data=davis) summary(reg) > summary(reg) Call: lm(formula = repwt ~ weight * sex_cd, data = davis) Residuals: Min 1Q Median 3Q Max -29.2230 -2.3247 -0.1325 2.0741 15.5783 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.35864 3.27719 0.415 0.679 weight 0.98982 0.04260 23.236 <2e-16 *** sex_cd 39.96412 3.92932 10.171 <2e-16… Read More »

R 에서 컬럼 제거

> iris[c(-ncol(iris))] # 마지막 컬럼 삭제 > iris[c(-1, -2)] # 첫번째, 두번째 컬럼 삭제 > iris <- iris[c(-ncol(iris))] # 컬럼 삭제 후 데이타 재설정

R 에서 샘플링 데이타 만들기

100만행 * 2열 의 샘플링 데이타 만들기 data <- cbind(sample(1000000), sample(1000000)) edit(data) 해보면 100만개의 샘플링 데이타를 조회할 수 있다. — 평균 = 175, 표준편차 = 5 인 정규분포로 부터 샘플 10000 개 생성 data <- rnorm(n=10000, mean=175, sd=5) 여기서 샘플 100개를 추출. sample2 <- sample(data, size=100)

R 에서 데이타 편집하기

내장 데이타인 cars 를 예제로 cars2 <- edit(cars) 를 실행하면 편집창이 뜨고, 그기서 편집한 후 창을 닫으면 변경된 내용이 cars2 변수에 저장된다. edit 는 설정에서 본인이 편한 것을 설정할 수 있음. 기본값은 내장 편집 (엑셀 같은 창이 뜸)

우도의 개념과 최대우도추정법(Maximum Likelihood Estimation)

우도의 개념과 최대우도추정법(Maximum Likelihood Estimation) 우도의 개념을 최대한 단순하게(물론 문제가 있겠지만) 정의하면 확률과 정확하게 대칭되는 것이라 생각하면 맞을 것 같다. 다시 말하면 확률에서는 모비율이 특정되어 있고 불변인데 그 위에서 관찰된 값이 나오는 반면(동전을 던질 때 앞면이 나올 확률은 일반적으로 1/2이며 그것을 바탕으로 특정 관찰이 나올 확률을 계산한다), 우도의 개념에서는 역으로 관찰치는 고정되어 있고, 그것이 가장… Read More »