반응형

@notepad_jj2

츄르사려고 코딩하는 코집사입니다.


복원추출(Sampling with replacement)

추첨 후, 다음번에도 중복 추출이 가능하도록 한 번 뽑은 표본을 모집단에 다시 넣고 다른 표본을 추출하는 방법.

즉, 같은 표본이 중복해서 추출될 수 있다.

 

복원추출인 경우 표본평균의 평균과 분산은 아래와 같다.

 

평균 = 모평균

분산 = 모분산 / N


비복원추출(Sampling without replacement)

추첨 후, 한번 뽑힌 표본은 다시 뽑히지 않도록 모집단에 넣지 않고 다른 표본을 추출하는 방법.

즉, 한번 추출된 표본은 다시 추출되지 않는다.


예를 들어, 숫자 카드 1, 2, 3이 있다. 숫자 카드를 뽑는 방법은 아래와 같다.

복원추출(Sampling with replacement)

-> (1,2), (1,3), (2,3) 으로 총 3개로 1/3의 확률을 가지고 있다.

 

비복원추출(Sampling without replacement)

-> (1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3) 으로 총 9개로 1/9의 확률을 가지고 있다.

 

위의 예시와 같이, 복원추출(Sampling with replacement)과 비복원추출(Sampling without replacement)은 모집단의 모든 원소가 표본으로 추출될 확률이 동일한 확률추출법이다.


샘플링 기반의 추정이나 모델링에서 데이터의 품질은 데이터의 양보다 더 중요하다. 그렇기에, 복원추출(Sampling with replacement)과 비복원추출(Sampling without replacement)의 선택에 따라 결과가 달라진다.

 

 

반응형

+ Recent posts