중심화와 척도화를 통한 표준화
시험 점수처럼 서로 다른 환경에서 측정된 값들을 비교하려면 표준화(Z-score 변환) 과정이 필요하다. 이를 위해 중심화와 척도화를 사용한다.
중심화(Centering):
- 평균을 기준으로 값을 이동시키는 과정
- 즉, 각 데이터에서 평균을 빼줌
예: (X는 점수, μ는 평균)
척도화(Scaling):
- 데이터의 변동성을 조정하는 과정
- 표준편차(σ\sigma)로 나누어 변수를 표준 단위로 변환
예: (X−μ)/
이를 통해 서로 다른 시험의 점수를 표준 정규분포(평균 0, 표준편차 1)로 변환하여 비교할 수 있다.
예를 들어, 아래와 같이 두 가지 서로 다른 시험에서의 점수가 있다고 가정하자
A시험: 평균이 47.8이고 표준편차가 19.7인 시험에서 80점을 기록
B시험: 평균이 55.4이고 표준편차가 28.5인 시험에서 100점을 기록
(1) 첫 번째 시험 (평균 47.8, 표준편차 19.7)에서 80점의 Z-score
= 1.63
(2) 두 번째 시험 (평균 55.4, 표준편차 28.5)에서 100점의 Z-score
=1.56
- 첫 번째 시험에서 80점의 Z-score: 1.63
- 두 번째 시험에서 100점의 Z-score: 1.56
Z-score가 클수록 평균 대비 더 높은 성적을 의미한다.
- 첫 번째 시험에서 80점은 평균보다 1.63 표준편차만큼 높음
- 두 번째 시험에서 100점은 평균보다 1.56 표준편차만큼 높음
→ 첫 번째 시험에서 80점을 받은 것이 상대적으로 더 좋은 성적
변수를 먼저 중심화하고 다음으로 척도화 하는 과정을 표준화라고 한다. 중심화를 통해서 단순히 값이 크다 작다가 아니라 평균에 비해서 얼마나 크고 작은지를 확인한다. 그 다음 척도화를 통해서 단위 차이를 없앤 숫자를 만들어 낸다. 어떤 변수를 가져오든 상관없이 표준화를 거친 변수의 평균은 0이 되고 표준편차는 1이 된다. 평균도, 표준편차도, 단위도 달랐던 변수들이 똑같은 특징을 가지게 되면 드디어 다른 변수에 있는 관측치들을 비교할 수 있다.
이렇게 중앙화(Centering)과 척도화(Scaling)을 통해서 표준화를 진행하면 서로 다른 시험에서 받은 성적을 비교해서 누가 더 잘 한 것인지 답변 할 수 있다.