예를 들어 보자.
주사위를 10번 굴리면
X1, X2,... , X10으로 이루어진 크기 10의 랜덤벡터(물론 각 random variable은 i.i.d일 것이다.)에서
크기 10짜리 데이터 셋한 개가 나온다.
즉, 크기 10 짜리 랜덤 샘플 1개가 나온다.
주사위를 10번 굴리는 걸 10번 반복하면
크기 10 짜리 데이터 셋 10개 나오게 된다.
즉, 크기 10짜리 랜덤 샘플 10개가 나온다.
정리해 보면
1. X1, X2,... , X10 : 랜덤 벡터. 아직 실현되기 전의 확률변수들의 집합.
2. 여기서 실제 숫자로 실현되면 : 크기 10짜리 랜덤샘플 = 크기 10짜리 데이터셋
(다만, 맥락에 따라 랜덤벡터, 랜덤샘플이 혼용되어 사용된다.
보통은 랜덤벡터라는 말보다는 실현 전후에 관계없이 랜덤샘플이라는 이름으로 불린다.
예를 들어 "통계량"의 정의는 "랜덤 샘플들의 함수"라고 하지 "랜덤 벡터들의 함수"라고 하진 않는다.
따라서 맥락을 고려할 필요가 있다.
혹은 랜덤벡터들의 요소들이 i.i.d면 랜덤샘플이라고 봐도 될 것 같긴 하다.)
(랜덤벡터는 단순히 random variable들을 모아둔 것이다. )
'Statistics' 카테고리의 다른 글
표본 분산에 대한 분포와 조건 (feat. 카이제곱분포) (1) | 2024.12.15 |
---|---|
Statistics. 대수의 법칙, 수렴속도와 베이지안 (0) | 2024.08.16 |
Probabilistic Thinking. 베이지안, 리스크 관리, 헷징, 장기적 관점 (0) | 2024.08.15 |