0. 요약
드라마에서 남주가 핸드폰 앱을 이용해서 즉석에서 여성의 모음 분석을 해주는데, 우리도 따라해봅시다. 남주는 크기(dB)랑 음높이(pitch, Hz)만 분석하는데, 우리는 praat을 이용해서 포먼트도 봅시다.
목차
1. 목소리 분석해주는 남주
The item included is used under the principles of "fair use" as outlined in Section 107 of the Copyright Act of 1976. It is provided solely for educational purposes to facilitate learning, research, and the advancement of knowledge. 여기 포함된 자료는 미국 1976년 저작권법 제107조에 명시된 "공정 이용" 원칙에 따라 사용됩니다. 학습, 연구 및 지식 증진을 촉진하기 위해 오직 교육 목적으로 제공됩니다.
BBC 드라마 Listeners의 에피소드1 중 일부다. 남주가 어떤 핸드폰 앱을 이용해서 여성의 목소리를 분석한다. 여성은 [ʔɑː]를 발화하는데, 핸드폰에 대고 발화하니 앱이 음높이와 크기를 분석해준다. 저 남자 너무 nerdy하고 매력있는듯.
결과는 23dB, 192Hz로 나왔다고 한다. 192Hz는 fundamental frequency인 것으로 보인다. Fundamental frequency (F0)는 목소리의 높낮이, 즉 pitch이다.
2. 드라마보다 갑자기 모음분석
그런데 이 값은 정말 맞는 값일까? 아님 그냥 대본에 써있는 걸 읽은 것일까? 23dB은 뭐 핸드폰 마이크와의 거리에 따라 가변적인 것이니까 의미가 크지 않지만 F0 (fundamental frequency)는 정말 192Hz가 맞는지 궁금해졌다.
그래서 드라마 보다가 갑자기 모음을 분석해보자.
Praat을 이용하면 매우 간편하게 알아볼 수 있다. Praat은 여기에서 무료로 받을 수 있다.
그리고 여성이 [ʔɑː] 발음하는 음성파일(분석대상파일)은 추출해서 아래와 같이 올려놓았다.
2.1 정말 192Hz?
우선 praat에서 해당 파일을 불러오기한다. Praat Objects 윈도우에서 Open 버튼을 눌러서 경로를 선택하면 wav파일을 객체(object)로 리스트해준다. 아래와 같이 된 창에서 우측 여러 버튼 중 View & Edit을 누른다.
그러면 아래 스크린샷처럼 waveform과 spectrogram이 곧바로 나온다. 지그재그로 막 그려져 있는 윗부분이 waveform이고, 아래에 무슨 초음파사진처럼 표시되어있는 게 spectrogram이다.
이미 눈치 챈 사람도 있겠지만, 아주 시시하게도 여성의 발화에서 pitch가 192Hz가 아니란 것이 판명나버렸다. 바로, spectrogram 상에 이미 pitch에 대한 정보가 나와버린 것이다. 다홍색으로 181.1Hz라고 적혀있는데, 그것이 pitch값이다. 만약 파란선과 다홍색 숫자가 보이지 않는다면 waveform 위에 있는 File, Edit, Time, Play.... 버튼 중 Pitch를 누르고 잇달아 "Show Pitch"를 클릭하자. Pitch > Show Pitch
결론: 여성의 발화에서 F0는 192Hz가 아니었다. 181.1Hz였다. 남주는 거짓말을 한 셈이다. 하지만 잘생겼다.
2.2 기왕에 포먼트도
2.2.1 측정하기
파일 연 김에 포먼트도 분석해보자.
여성은 처음에는 모음을 크고 분명하게 발음하지만 뒤로 갈수록 점점 숨이 차는지 모음이 약해진다. 위에 노랑색으로 표시된 intensity (dB) 보면 차이가 다소 드러난다. 높고 평탄한 앞부분과 조금 왔다갔다하는 뒷부분으로 되어있다.
모음은 언제나 이런식으로 조금씩 흔들흔들한 것이 보통이다. 가만히 있지 못하고 이렇게 옴싹달싹 못하는 정도가 심하면 영어처럼 거의 모든 모음이 디테일한 수준에서 이중모음처럼 조음되기도 한다.(diphthongize) 영어화자의 한국어를 묘사할 때 "오우 한쿠거 어려워요우" 처럼 하는데, 이처럼 외국어화자의 입장에서는 이게 그 언어의 특징으로 인식되기도 한다. 반면 한국어는 영어에 비해 이중모음화가 덜한 편이다. 그래도 한국어 화자의 모음 발화도 고정적이지 못하고 조금씩은 왔다갔다한다.
이 얘길 왜하냐하면, 일반적으로 모음을 분석할 때는 특정 구간에서 포먼트를 특정하고, 그 구간 내에서도 시간차를 두고 여러지점을 측정한 다음 평균을 내거나 변화양상을 관측하기 때문이다.
여성화자가 분명하고 크게 모음을 발화한 앞부분을 이렇게 범위로 지정하자. Spectrogram이나 waveform 위에서 드래그하면 범위지정이 핑크색으로 된다. 나는 노랑선이 고점에서 평탄한 지점을 기준으로 범위를 지정했으나, 분명한 기준이 있으면 무엇도 가능하다. 논문 쓸 것도 아니고 난 대충 그냥 스윽 했다.
이렇게 어디서 측정할지 범위를 지정해주고, Formants > Formants listing
하면 구간 내 여러 지점에서 formant값들을 측정하여 쫙 리스트업 해준다.
아래의 스크린샷 같이 Praat info 창이 새로 나오고 거기에 아주 예쁘게 정렬해서 보여준다. 만약 이게 안나오고 경고메시지가 대신 나오면 formant 측정이 비활성화되어 있는 것이기 때문에, 활성화해주자. File, Edit, Time.... 중에서 Formants 클릭하고 잇달아 Show formants 체크하면 된다.
이제 이 숫자들의 평균을 내서 F1과 F2의 평균값을 구해보자. F1과 F2는 공교롭게도 모음공간과 대응된다. F1은 모음의 높이와 대응된다. [i], [u]같은 고모음일수록 F1이 낮고, [a] 같은 저모음일수록 F1이 높다. 한편 F2는 모음의 전설-후설(frontness)과 대응된다. 전설모음은 F2가 높고 후설모음은 F2가 낮다.
그리고 구간 내 F1, F2 값의 평균을 낸다고 했는데, 평균내는 이유가 뭐냐? 전제는, "여성화자가 이 평균값을 지향하여 모음을 발화했는데, 온갖 이유로 값이 약간씩 왔다갔다 했다"는 것이다. 즉, 여성화자는 이 평균값을 내고싶어서 발성기관의 모양을 이리저리 했고, 이 의도된 모음이 바로 우리가 궁금한 지점이다.
결론: 평균을 내보니 F1은 850Hz, F2는 1322Hz로 나왔다.
2.2.2 해석하기
문제는 이 값 하나만 가지고는 무엇도 알 수 없다는 것. F1이 높은지 낮은지 F2가 높은지 낮은지 알고 싶으면 비교대상이 있어야 한다.
아래는 위키피디아에서 가져온 포먼트 별 IPA 모음 기호들이다.
출처도 없고 Любослов Езыкин 라는 위키러가 독자 연구한 결과라고만 나와있다. 학부생들한테 위키백과(더더욱이 나무위키) 인용하지 말라고 하는 이유가 바로 이러한 것이다. 비판이나 통제를 받지 않은, 권위없는 개인의 독자 연구 결과가 '오직 유일한 사실'인양 막 돌아다님.
뭐 근데 일단은 이 차트가 사실이라고 받아들이자. 음성학 교과서 펴서 찾기도 귀찮고, 뭐 심각한 거 하는 것 아니고 어디까지나 "갑자기 분위기 언어학"하는 글이니까.
위 그림에다가 내가 새로 측정한 여성화자의 포먼트값을 그려보자. 빨간 점이 내가 측정한 평균값이다. 내맘대로 크게 점을 찍어보았다.
앞서 영상에서 자막으로 여성이 [ʔɑː] 라고 발화한다고 써놨는데, 단순히 기호로만으로 전달되지 않는 디테일을 더 알게되었다. 이 여성화자가 조음한 모음은 통상적인 [ɑ]보다 더 저모음이고 (구강 공간을 더 크게 만듦) 좀더 입 앞부분에서 발화되었다. 물론, 이 결론은 Любослов Езыкин가 보고한 모음 평균 포먼트값을 100퍼센트 신뢰한다는 걸 전제한다.
3. 기호 없이 해볼까?
IPA 기호로 모음을 전사하면 잃게되는 디테일들이 많이 있다. 앞 섹션 마지막 문단에서처럼 단순히 [ɑ]라고 전사했을 때, 해당 특정 발화가 가지는 부가정보들은 다 삭제되어버린다.
그러나 본질적으로 모음의 인식은 범주적으로 이루어진다. 같은 범주의 [ɑ] 모음이라면 미세한 차이는 음운론적으로 중요하지 않다. 그래서 그냥 [ɑ]라고 하는 것이다.
마지막으로 기호에 의존하지 않는 뭔가뭔가(?)를 해보자. Praat에는 굳이 모음기호 쓰지 않고 포먼트값만으로 소리를 만들어내는 기능이 있다.
다시 Praat Objects 윈도우로 돌아와서 New > Sound > Create sound from VowelEditor...
를 선택하자.
그러면 모음차트 비슷한 게 나오는데, 여기서 클릭하거나 드래그하면, 해당 포먼트값에 해당하는 인공적인 소리를 만들어준다. 당연하게도 사람 말소리의 모음처럼 들린다. 다만 사람의 말소리에는 F1 F2말고도 다양한 요소들이 포함되기 때문에, F1 F2의 조합만으로 만든 소리는 인공적인 느낌이 든다.
나는 여러번의 시도끝에, 여성의 발화에서 나온 평균(F1=850Hz F2=1322Hz)과 유사한 지점을 찍었다. VowelEditor창 하단 상태표시줄에 843.3, 1321.2 라고 나와있다. 차트 상에서 |<- 이렇게 생긴 기호가 위치를 나타낸다. 마찬가지로 통상적인 [ɑ]모음보다는 조금 더 전설모음이다.
여기에다가 "Start f0" 파라미터에 우리가 아는 여성발화의 pitch 정보도 포함해보자. 현재 220Hz 라고 적혀있는 곳에다가 181.1 Hz 라고 적으면 된다 (잘생긴 남자가 말했던 192Hz가 아니라!ㅋㅋ)
이렇게 인조적으로 만든 소리도 아래에 공유한다.
여성의 모음과 비교해보면 비슷한 느낌적인 느낌.
아래의 영상에서, 1. Sound aaaaaa 가 여성화자가 진짜로 발음한 모음 발화이고 2. Sound fake_aaaa 가 pitch, F1, F2를 지정해서 인조적으로 만든 모음이다. 왔다갔다 하면서 재생해본다.
4. 결론
막상 써놓고 보니, 이거 학부생 개론 음성학 과제로 내기에 딱 좋은 것같다. 보통 포먼트 가르칠때 과제로 "니가 직접 모음 조음하는 거 praat에서 녹음한 다음에 F1 F2 측정해봐" 하는 과제를 내주는데, F1 F2 제대로 측정했니 못했니 판단할 때, 교과서에 나온 모음표랑 비교를 시킨다.
그런데 그러지말고 "니가 측정한 F1 F2로 인조모음 만들어서 그거랑 니 실제 발화랑 비교해봐" 시키면 더 좋을 것 같다. (니똥 니가 먹어봐라) 왜냐면 모음표 사용하는 게 이번학기에 아주아주 비판을 받았기 때문이다. 모음표 사용이 왜 안좋은지는 나중에 따로 글을 팔 생각이 있다.
- 글이 유익했다면 후원해주세요 (최소100원). 투네이션 || BuyMeACoffee (해외카드필요)
- 아래 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
- 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
- 반박이나 오류 수정을 특히 환영합니다.
- 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.
'갑자기 분위기 언어학' 카테고리의 다른 글
어원지식은 언어의 일부가 아닐지 모른다 (6) | 2024.11.26 |
---|---|
한국어의 [s↓] (7) | 2024.11.24 |
동남방언의 게임2벤트 (0) | 2024.11.21 |
입짧은 햇님의 중의성 (0) | 2024.11.18 |
한국어 단모음체계와 개념에 잡아먹힌 좀비 (2) | 2024.10.28 |