성적과 통계학 (1)
평균이 50점이고 표준편차가 20점인 시험이 있다고 합시다.
그렇다면 이 시험에서 70점을 받은 학생은 일반적으로 3등급 후반이 된다는 사실을 아시나요?
이 시험에서 85점을 받으면 웬만하면 1등급이 됩니다. 물론 다 된다는건 아니고, 안되는 특이 케이스도 있기는 하지만 대부분은 1등급이 됩니다.
오늘은 이런 이야기를 한 번 해보려고 합니다.
수능이나 모의고사에서 표준점수는 응시자들의 성적을 적절하게 조작해서 평균과 표준편차를 일정하게 맞춘 점수입니다.
원점수가 100점 만점인 국어, 수학에서는 응시자들의 표준점수 평균이 100점, 표준편차가 20점이 되도록 맞추고,
원점수가 50점 만점인 탐구에서는 응시자들의 표준점수 평균이 50점, 표준편차가 10점이 되도록 맞춥니다.
표준점수의 평균이 100점이고 표준편차가 20점인 국어, 수학에서
표준점수가 100점이라는 것은 어떤 의미일까요? 표준점수의 평균이 100점이라고 했으니 그냥 딱 평균만큼 받았다는 의미입니다.
그렇다면 표준점수가 120점이라는 것은 어떤 의미일까요? 평균보다 1표준편차만큼 잘 봤다는 의미가 됩니다. 평균이 100점, 표준편차가 20점이니까 (평균) + 1×(표준편차)를 하면 딱 120이 되죠
마찬가지로 표준점수가 140점이면 평균보다 2표준편차만큼 잘 봤다는 의미가 되고
표준점수가 130점이면 평균보다 1.5표준편차만큼 잘 봤다는 의미가 됩니다.
이렇게 평균보다 몇 표준편차만큼 잘(못) 봤는지를 따지는게 이번 글 내용의 핵심이라고 할 수 있습니다.
그렇다면 이걸 왜 따지느냐? 이걸 따지면 나의 상대적 위치를 예측해볼 수 있기 때문입니다.
국어나 수학에서 표준점수 100점이면, 그러니까 딱 평균만큼 받았으면 몇 등급이 나올거라고 예상하시나요?
사실 이건 너무 쉽죠. 평균이라고 하면 보통 가운데 등급인 5등급이 연상되잖아요?
실제로 국어나 수학에서 표준점수 100점을 받으면 5등급이 나옵니다.
탐구에서도 마찬가지로 표준점수 50점을 받으면 일반적으로 5등급이 나옵니다.
그러면 처음에 소개했던 것처럼, 평균보다 1표준편차만큼 잘 본 경우에도 등급을 예측할 수 있을까요? 그러니까 국어나 수학에서는 표준점수가 120점, 탐구에서는 표준점수가 60점이라면 보통 몇 등급인지 예측할 수 있을까요?
복잡하게 생각할 것 없이 과거 사례들을 찾아보면 답이 나옵니다.
국어, 수학에서 표준점수 3등급컷은 보통 116 ~ 118에서 형성되는 경향이 있습니다. 작년 뿐만 아니라 그 전년도를 찾아봐도 마찬가지입니다. 3등급컷이 높게 나오면 119까지도 올라가긴 하지만 120을 넘어가는 시험은 거의 찾아보기 어렵습니다. 따라서 표준점수 120점이 나오면 매우 높은 확률로 3등급이 된다는 사실을 알 수 있습니다.
탐구 같은 경우에도 표준점수 60점이면 웬만하면 3등급이 됩니다. 그렇다고 모두 3등급이 된다는건 아니고, 다음과 같이 4등급으로 떨어지는 경우도 있습니다.
이거는 성적 분포 양상에 따라 차이가 있어서 그렇습니다. 평균보다 1표준편차만큼 잘 보면 무조건 3등급이 된다는 절대적인 법칙은 없어요. 하지만 작년 수능의 경우, 한국지리를 제외하면 표준점수 60점이면 모두 3등급이 되었습니다. 따라서 100%는 아니지만, 탐구 표준점수 60점도 높은 확률로 3등급이 된다는 사실을 알 수 있죠.
그렇다면 혹시 내신에서도, 평균과 표준편차만 가지고 나의 상대적인 위치를 파악할 수 있지 않을까요? 오늘 그걸 알아보기 위해 제가 대략 코딩을 해왔습니다.
먼저, 실제 내신 시험처럼 학생 수를 250명으로 가정하였습니다.
그리고 0부터 100까지의 정수를 학생 수만큼 랜덤으로 추출합니다. 학생 수가 250명이니까 250개를 추출하게 되겠군요. 이때 추출된 숫자가 각 학생의 시험 점수가 됩니다.
그리고 추출된 250개 점수의 평균과 표준편차를 구해서, (평균)+z×(표준편차)에 해당하는 학생이 몇 등급에 속하는지를 기록합니다. 이 과정을 10,000번 반복해서 최종적으로 이 학생이 몇 등급에 속할 확률이 가장 높은지 따져보는 것입니다.
먼저 z=0으로 했을 때의 결과입니다. 딱 평균만큼 받았을 때죠. (국어 수학 표준점수 100점, 탐구 표준점수 50점에 해당)
반복 횟수 10,000번에 대해서 10,000번 모두 5등급이 나왔습니다(등급 분포 양상의 왼쪽부터 1등급이 나온 횟수, 2등급이 나온 횟수, ...로 읽으시면 됩니다.). 평균적으로 상위 49.95%로 딱 중간 위치를 차지하고 있다는 것을 알 수 있네요
이번에는 z=1로 해보겠습니다.
예를 들어 원점수 평균이 52점이고 표준편차가 23점인 시험이 있다면, 52+23=75점을 받은 학생은 보통 몇 등급에 속하는지를 알아보려고 합니다. (국어 수학 표준점수 120점, 탐구 표준점수 60점에 해당)
반복 횟수 10,000번에 대해서 3등급이 나온 횟수는 9,183회이고, 4등급이 나온 횟수는 817회입니다.
그러니까 대부분은 3등급이 나오는데 운이 나쁘면 4등급으로 떨어질 수도 있는 것이네요
이렇게 z값을 변경시켜가며 각 z에 대해 응시자들의 등급이 어디에 해당할지 몇 가지 살펴봤습니다.
z=1.2일 때 (국어 수학 표준점수 124점, 탐구 표준점수 62점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.2×23=79.6점은 보통 몇 등급에 해당되는가?
3등급일 확률이 가장 높다!
z=1.5일 때 (국어 수학 표준점수 130점, 탐구 표준점수 65점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.5×23=86.5점은 보통 몇 등급에 해당되는가?
2등급일 확률이 가장 높다!
z=1.8일 때 (국어 수학 표준점수 136점, 탐구 표준점수 68점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.8×23=93.4점은 보통 몇 등급에 해당되는가?
1등급일 확률이 가장 높다!
z=0.5일 때 (국어 수학 표준점수 110점, 탐구 표준점수 55점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+0.5×23=63.5점은 보통 몇 등급에 해당되는가?
4등급일 확률이 가장 높다!
결과 자체는 꽤 일리 있어 보이게 나왔습니다.
그런데 사실 이렇게 점수를 완전 랜덤으로 추출하면 별로 마음에 들지 않는 분포가 나옵니다.
뭐가 마음에 들지 않을까요?
점수를 완전히 랜덤으로 추출했다는 것은, 0부터 100까지의 숫자가 나올 확률이 1/101씩으로 완전 동일하다는 의미입니다.
그러니까 거의
90점대 인원 = 80점대 인원 = 70점대 인원 = ... = 10점대 인원 = 한 자리수 인원
꼴로 인원 분포가 나온다는 것입니다.
그런데 이는 현실적인 성적 분포와 좀 동떨어져 있죠
보통 성적 분포라고 하면 90점대 인원보다 80점대 인원이 조금 더 많고, 80점대보다 70점대가 조금 더 많은 분포를 생각하지, 저렇게 각 점수대별 인원이 다 똑같을 거라고 생각하진 않죠.
실제로 저렇게 추출하면 표준편차가 거의 28~30으로 나오는데, 이것도 현실의 표준편차와 많이 동떨어져 있다고 할 수 있습니다.
따라서 다음 편에서는 확률 분포를 직접 커스터마이징해서 등급 분포 양상을 구해보도록 하겠습니다.
감사합니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
내일도 4시에 일어나야
-
가나다순 3칸3칸3칸 잭팟메타로 가자
-
연대 빵꾸 5
시간대별 경쟁률 이정도로 낮았던적이 있나요?? 진짜궁금해서 물어보는건데 이정도면...
-
뭔가 멀리서 바라보면 귀여운데 나한테 다가오면 뭔가 무서움 무섭다기보다 거부반응을...
-
댓글 수정하면 오르비 스티커 단거 날아갔는데 이제는 유지된 상태로 나오네
-
국어 너무 안해서 불안해져서 뭐라도 해야뎃음
-
칠전팔기 미2
-
제 프로필이 이상해요. 12
아니 난 남자에 99년에 태어났는데 왜 여자에 90년으로 되어있을까요?? 대체...
-
90 1
90
-
아 개부럽 ..유현주 선생님도 만들어주셨으면 ㅠㅠ
-
이과구요 ㅈㄴㅅ 기준 4칸이랑 5칸 놓고 고민중입니다... 4칸짜리는 최종컷이랑...
-
홍대랑 항공대 1
홍대랑 한국항공대랑 입결차이 어떤가요? 어디가 높은지 궁금합니다~ 다군에 쓸 곳 찾고있어서요...
-
지금 보니까 대략 도시공은 5칸 서강대 수학은 4칸 뜨던데 붙는다는 보장은 없지만...
-
가군- 수의대 희망 경북대 수의예 - 4칸 경상대 수의예 - 3칸 이 둘중에...
-
안주무시고계신분들.. 33
몇년생입니가?1. 98년 이상 귀요미.. = 십팔2. 97년 = 193. 96년 =...
-
아놔 열심히 댓글달고 있었늗네 갑자기 글이 사라졋다해가지고글쓴이 : 오빠, 머하고...
-
지금 남은 기간동안 공부계획이국어 - Only 기출수학 - 입시플라이 5개년 평가원...
-
아득한 고층 아파트 위 태양이 가슴을 쥐어뜯으며 낮달 옆에서 어찌할 바를 모른다...
-
이문재 - 사막 0
사막에 모래보다 더 많은 것이 있다. 모래와 모래 사이다. 사막에는 모래보다 모래와...
-
안녕하세요. 전 지금 그냥 갔다올까 하는데... 조언 좀 구하려고 합니다. 6월...
-
길고양이가 차도를 빠르게 건너가서 놓치고 온 제 그림자를 물끄러미 돌아본다 그림자가...
-
황인숙 - 장마 1
빗방울보다 단단한 것들이 빗방울을 가볍게맞받아치는 소리 들린다또 하염없이...
-
죽을 때 죽는다는 걸 알 수 있어? 죽으면 어디로 가는 거야?죽을 때 모습 그대로...
-
중앙대 철학과vs건국대 경제학과 조언좀 부탁드려요! 6
서울 하위권 경제학과 재학중 올해 편입하여 중앙대 철학과와 건국대 경제학과에...
-
밖에는 비가 오고 아내는 지금 샤워를 하고 있다 모든 것이 젖어드는 칠월...
-
중학교 졸업한지 1
9년이 지났어요
-
문인수 - 개펄 0
일몰 보러 갔다. 갯가에 붙여 지은 이 횟집엔 서쪽을 잘 바라볼 수 있는 위치에...
-
옆에서 심하게 울고 있는 사내가 있다 살아야 하겠는 것누구나 울 수 있는 면허를...
-
흰 하늘이 구부러진다 창문을 열면 나지막한 담벼락이 있고담벼락 고양이가실내를...
-
아침마다 머리맡에는 15층이 있다. 이부자리에 엎드려 머리카락을 움켜쥐고.이건 삶이...
-
수능끝나고 무료한 시간 외국인 교환학생 친구들하고 토론하고 교류해보는거 어때요? 0
수능도 끝났는데 막상 할 것들이 없지않나요ㅎㅎㅎ 저도 2년전에는 끝나면 뭐하고...
-
순간들 0
가장 힘들다고 생각했었던 순간들을 그리워 한다면 나는 어떤 마음인거야도저히 잊어버릴...
-
2014년 하반기 신입사원 채용합니다. #학력 : 무관 #나이 : 무관 #근무시간...
-
가장 어려운것. 0
친구들하고 잘 지내거라 선생님 말씀 잘듣거라시간이 멈춰 있는것만 같았다.졸업식 사진...
-
쉬엄쉬엄 하거라 16
울 엄마가 저에게 하는 말입니다. 이미 군대도 갔다왔고, 서울에서 대학도 다니다가...
-
뭐하고사니 0
너희들은 ...
-
네번째 수능을 치른 후 나는 패배자가 될 줄 알았다.거침없고 허여멀겋고 미흡한...
-
어느 특목고 학생의 한탄.... (고입준비하시는 분 보세요) 3
입시도 끝나가고 시간도 남고 해서 답답한 마음 풀어봅니다 ㅠㅠ저는 중학교때 1등으로...
-
우앜 2
부끄럽다 예전에 쓴 글 지워야지
-
이과 삼수생인데 진로에 대한 막막함이 크네요,, 도와주세요,, 1
재수 하면서 망했죠 물론 제가 열심히 하지않은 것은 압니다. 그런데 저는 왠지 수식...
-
고3 : "서울대,연대,고대생들 부럽다...."대1 : "여자 많은과(간호학과)에...
-
2013학년도 정시모집 전형일정자세히 보기구분기간원서접수 가, 나, 가·나군...
-
미필,사수해서 마지못해 간 학교,그리고 차마 미련을 떨치지 못해 시작한...
-
만 22살이고 내년1월에 만 23살 되는데현재 외국 대학교 휴학하고 한국에 들어온 상태임..
-
옛날에 여기서 꽤나 폐인처럼 살았는데 그게 무려 5년전.. ㅋㅋㅋㅋㅋ 시간 빠르다...
-
우선 저는 90년생이구요 삼수해서 수능을 많이 망쳐서 국숭세단라인의 상경계 대학에...
-
시간 참 빠르다 1
9009동에서 모두랑 목표 세우고 대입 준비하다 미끄덩해서 원하는 대학에 못 들어간...
-
일단 저는 오르비님들 처럼 성적이 좋지 못합니다.늦은 나이에 수능을 다시 준비하게...
-
제목은 거창하게 썼지만 아침에 도서관 출첵 정도 같이 했으면 좋겠습니다. 나이 과...
Sexual & statistics
그 성적 아니고...
개재미따