Web Analytics Made Easy - Statcounter

생각나는대로

[실험은 어려워] 9. 통계분석

sleepy_wug 2024. 11. 22. 03:09

 

(지난이야기: 한국어 화자들이 비단어에서 유음화를 적용하는지 안하는지 발음 녹음한 데이터를 수집하였다. 이제 통계분석을 해야 함 ['실험은어려워' 시리즈 보기])

 

1화에서 8화까지의 내용을 다시 정리하자면, 

- 한국어에서 유음화가 적용될수도 안 적용될수도 있다. "전략"을 [절략]으로 발음하는 게 표준발음이지만, [전냑], [전략]도 발견된다.
- 세대에 따라 유음화의 적용이 다르다는 선행연구가 있다.
- 비단어를 이용해서 세대별로 유음화가 다른지 실험했다. 비단어는 "갈농" "골눕" "널넥" "흘닙" "돈량" "논룽" 등 유음화 적용 가능한 ㄴㄹ 혹은 ㄹㄴ연쇄를 가지지만 한국어에 없는 단어들. 
- 각 녹음마다 '비음의 정도'를 수치로 환산한 Nasality Score를 추출했다.

 

Nasality Score가 결정적인 이유는, 이것이 유음화의 적용여부를 판정하는 수치이기 때문이다.

 

유음화가 적용되었으면 타겟에서 다 ㄹㄹ로 발음될 것이므로 Nasality Score가 낮을 것이다.

 

유음화가 적용 안 되고 비음화가 적용되어서 ㄴㄴ로 실현된다면 Nasality Score가 높을 것이다.

마지막으로 어떠한 규칙도 적용을 안 한다면 Nasality Score에서 Trajectory가 발견될 것이다. 

 

그런데 어떠한 측정치가 높다 낮다 변했다 이런 걸 판단하려면 통계처리를 해야한다. 물론, 모든 사람들의 모든 데이터가 동일한 크기의 동일한 방향성을 가진다면 세상 편하겠지만, 우리가 사는 세상은 그런 세상이 아니다. 관측에는 노이즈가 많고, 통계는 노이즈가 있다는 걸 고려하더라도 '효과가 있다고 할 수 있다'라고 말할 수 있는 근거를 제공한다.

 

또한 측정치가 높다 낮다를 판단하려면 무엇에 비해서가 중요하다. 즉 기준점(reference)이 필요하다. 따라서 한국어에 이미 존재하는 단어들에서 각 화자가 종성 ㄴ을 어떻게 발음했는지, ㄹ을 어떻게 발음했는지에 대해서도 Nasality Score를 측정해야 한다. 나는 연습 세션에서 한국어 기존 존재 단어들의 발음을 녹음해놓았다.

 

마지막으로 측정치가 변했다 안 변했다를 판단하려면 다수의 측정구간(window라고 부른다)이 필요하다. 구간1에서 3이 나왔는데 구간2에서 1이 나왔다면 감소라고 말하는 것이다. 물론, 측정구간을 아주 많이 할수록 gradual하고 좀더 세밀한 변화를 포착할 수 있다. 그러나 우리가 하는 언어학의 기본 전제는 언어가 categorically 혹은 binarily 작동한다고 본다.[각주:1] 그래서 측정은 보통 두 군데에서 하는데, 앞부분 25%지점과 뒷부분 25%지점 정도에서 한다.

 

통계는 크게 두 파트로 구성했다. 첫째는 기술통계(descriptive statistics) 둘째는 추론통계(inferential statistics).

 

기술통계는 말그대로 무슨일이 일어났는지 기술(그대로 보여줌)하는 것이다. 전통적으로는 boxplot을 그리거나 했는데, 최근에는 데이터포인트 개수가 많더라도 각 포인트를 직접 점으로 보여주는 방식이 선호되는 듯하다. 유음화 실험에서는 violin plot을 사용했다. 아래는 가상의 데이터인데 대략 어떤 얘길 하는건지 인상을 주기위해 가져왔다.

 

물론, 나에게 10대 데이터는 없었다. 20대 30대 40대 데이터만 있었다.

 

그런데 실제 데이터를 까보니 20대와 40대가 비슷한 패턴을 보였고 30대만 이상한 패턴을 보였다. 30대는 아주 높은 비율로 표준발음(유음화 적용)을 하였는데 20대와 40대는 그렇지 않았던 것이다.

 

여기서 일단 사실이 어떠하다라고 보고를 했는데, 논의 부분에서 40대 데이터의 대표성에 의문을 제기하며 실제 논의는 20대와 30대를 하였다. 왜냐면 40대 표본수가 워낙에 적었고, 실제 녹음을 들어보았을 때, 피실험자들이 실험목적을 제대로 이해하지 못했음이 분명했기 때문이다. 구체적으로 이 사람들은 대부분의 음절을 한 글자씩 한 글자씩 읽었고, 그래서 실제 한국어를 사용할 때 유음화를 적용하더라도 유음화를 적용하지 않는 것처럼 관측된 것이다.

 

이어서 추론통계는 혼합효과모형(mixed-effects model)을 사용했다. 요즘 이루어지는 음성실험에서는 혼합효과모형이 흔히 사용된다. 혼합효과라고 말하는 이유는 고정효과(fixed effects)인 '세대' '성별' 그리고 '음소배열'과는 별개로 무작위효과(random effects)인 '개인간차이'와 '단어간차이'도 고려되기 때문이다.

 

측정치에 어떤 차이가 존재한다고 했을 때, 이 차이는 세대 차이 때문일 수도 있지만 실험에 참가한 사람이나 실험에 동원된 비단어 때문일 수도 있다. 어떤 사람은 애초에 유음화를 안해도 Nasality Score가 낮게 나오는 사람일 수 있고, 어떤 단어는 모종의 이유로 모든 사람들이 유음화를 꺼릴 수도 있다 (외래어처럼 생겼다거나. 근데 Henry 발음하는 거 보면 [헬리] [헨니] 등 외래어도 유음화/비음화의 대상이 되긴 한다). 혼합효과모형은 이와 같이 피실험자/실험단어 차이에서 오는 무작위효과를 보정해준다.

 

혼합효과모형을 돌린 결과 세대간 차이는 20대-30대 간에서만 유의미한 효과가 있었다. 30대-40대 차이가 존재하나 유의미하진 않았고, 20대-40대에는 크기 자체가 작을 뿐더러 유의미하지도 않았다. 성별간에는 차이가 없었다. 성별 세대 간 interaction 은 모두 유의미하지 않았다.

 

이제 이 결과를 가지고 썰을 풀어보는 일이 남았다.

 

 

 


  • 글이 유익했다면 후원해주세요 (최소100원). 투네이션 || BuyMeACoffee (해외카드필요)
  • 아래 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
  • 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
  • 반박이나 오류 수정을 특히 환영합니다.
  • 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.

 

 

  1. 즉, 무슨 스위치가 있어서 그걸 넣고 빼고 하는것이지 옛날 아날로그 전축마냥 스무-스 하게 중간값을 가진다고 보지 않는다. [본문으로]