Web Analytics Made Easy - Statcounter

Bouncing ideas 생각 작업실/data sharing 생각재료 나누기

윤석열은 정말 '바이든'이라고 말했을까?

sleepy_wug 2022. 9. 27. 09:58

이 포스팅은 2022년 9월, 윤석열 대통령이 hot mic에 실수로 했던 발언에 '바이든'이 나왔는지를 기본적인 음향분석을 통해 살펴보는 것입니다. 윤석열 대통령은 미국 순방 중 글로벌 펀드 재정기업 회의에서 조 바이든 미국 대통령과 잠시 환담을 나누고 행사장에서 나오는 도중에 음성이 녹음되는 줄 모르고 인근에 있는 사람들에게 실언합니다.

 

많은 사람들이 이때 윤 대통령이 "(...) 바이든은 쪽팔려서 어떡하냐?" 라고 말했다고 생각하였습니다. 그러나 청와대의 해명에서는 "(...) 날리면 쪽팔려서 어떡하냐?" 라고 말했다고 주장했습니다. 이 두가지 주장 모두 어느정도 지지받고 어느정도 지지받지 못한다는 점을 보이고자 합니다.

 

저는 음향음성학자가 아니라 음운론자입니다.[각주:1] 그러나 실험데이터 분석 등을 할 때 어두에서 파열음의 조음위치는 파열 순간과 그 뒤에 이어지는 모음의 포먼트 형태에 영향을 준다는 점을 활용하곤 합니다. 윤석열 대통령 발언 소스에서도 이러한 것들을 '아마도' 관찰 가능할지도 모릅니다. '아마도'를 붙이는 이유는 소음이 많아서입니다. 어쨌든, 간편하게 스펙트로그램을 보았습니다.

 

참고로, 파형(waveform)을 보지 않았는데, 저는 이 상황에서 파형을 보는 것은 무의미하다고 생각합니다. 왜냐하면 쟁점이 조음점에 있기 때문입니다. 파형이 소리의 음높이나 크기는 잘 나타내지만 조음점에 따라 다른 파형이 나타나지는 않습니다. 

 

MBC에서 최초보도된 영상[유튜브 링크]에 나오는 오디오 소스를 프랏(praat)[각주:2]으로 분석하였습니다.

분석에 사용된 파일은 .collection으로 아래에 제공하니 원하시는 분은 받아서 살펴보시기 바랍니다.

 

yoon.Collection
10.49MB

 

소위 소음 제거된 영상을 쓰지 않은 이유는 정확한 제거방식을 제시한 소음제거 소스를 찾지 못하였기 때문입니다. 즉, 소음 제거 과정에서 어떤 왜곡이 있었는지 제가 알 수 없는 상황이어서 그렇습니다.

 

그림1. 문제의 스펙트로그램

 

스펙트로그램 세팅은 100Hz - 4000Hz범위에서 0.004의 Window length로 보았습니다. 프랏 기본값은 5000Hz범위인데, 윤석열 대통령은 남성이므로 범위를 줄였습니다.

 

위의 그림은 어떤 자음 (사람들이 ㅂ라고 생각하나 대통령실에서는 ㄴ라고 주장하는) 뒤에 이어지는 ㅏ 모음 혹은 ㅏㅣ 연쇄 부분입니다. 포먼트 트래킹 결과를 보면 모음 끝(ve) 으로 향할수록 F2가 상승하는 것을 볼 수 있는데 전형적인 [j]의 모습입니다. 하지만 중요한 것은 어두 자음입니다. 

 

우리가 가지고 있는 두 가설은 이것이 양순음(여론) 아니면 치경음(대통령실)이라는 것입니다.

 

가설1: "(...) 바이든은 쪽팔려서 어떡하냐?"

가설2: ""(...) 날리면 쪽팔려서 어떡하냐?"

 

1. '바이든'인가?

치경음과 비교되는 양순음의 특징은 두 가지입니다. burst 순간의 에너지가 강하지 않고 뒤이어 나오는 모음이 아래와 같이 어떤 모음이든 모음 고유의 포먼트 패턴에 앞서 상향곡선을 그리게됩니다. 

출처: Johnson, Keith (2003). Acoustic and auditory phonetics. Blackwell: Malden, MA. (p.143)

 

안타깝게도 소음이 많아서 burst 순간의 에너지가 관측될 수 없고, 또한 공교롭게도 모음 초반부 역시 불분명해서 조음위치에 대한 정보를 제공하기에는 부족합니다.

따라서 맥락에 의존할 수밖에 없는데, 이 발화가 이루어진 맥락이 바이든과 만난 직후였다면, 맥락에 따라 [?a...]'의 신호를 들었다면 그것을 '바이든'으로 해석하게 될 가능성이 높습니다. 거기에 더불어 burst 순간에 에너지가 희미하다는 사실이 양순음 신호를 주는 가장 큰 요인이라고 생각합니다. 

 

2. '날리면'인가?

만약 해당 부분이 '날리면'이었다면, burst 순간이 그림1의 모습보다는 더 뚜렷했으리라 예상됩니다. 그러나 역시 소음때문에 burst 측정이 제대로 되지 않았기에 진실은 알 수 없습니다.

이어지는 모음 포먼트를 본다면 모음 초반부에 F2가 서서히 하강하는 것을 가지고 치경음이라는 주장을 할 수 있을 것 같습니다. 그러나 그러기에는 시작점이 너무 높습니다. 통상적으로 turbulence 지점이 뒤로 빠질수록 높아지는데 (그래서 velar 이후에 velar pinch가 나오고...)  2600Hz무렵이라면 치경음치고는 조금 뒤쪽이 아닌가 생각됩니다. 물론 윤석열의 치경음 조음점이 뒤쪽이라고 주장한다면 할말 없습니다.

또한, "날리..."와 같이 모음 직후에 ㄹ이 출현했는지 여부에도 회의적입니다. 여러모로 baseline이 필요해보입니다.

 

그래서 아래는 대통령 취임식 당시의 음성입니다. 가장 깔끔하게 기록되었을 윤석열 대통령의 음성자료로 보입니다. 구체적으로는 어절 초에서 "바로"를 발음하는 부분입니다.

 

그림2. 대통령 취임사 중 "바로"

 

하이라이트된 부분이 바로 "바로" 중 "ㄹ" 부분인데, 혀가 다시 ㄹ 조음을 위해 이동해야 하기 때문에 모음이 끊기거나 모음 포먼트 트래킹 라인이 왜곡될 수밖에 없습니다. 그러나 그림1 (문제의 발언)을 보면 '아이' 모음이 끊김없이 매끄럽게 트래킹된 것을 볼 수 있습니다. 따라서 ㄹ의 조음은 없었을 가능성이 높습니다.

 

또한 그림2에서 알 수 있는 것은 아주 선명하게 녹음된 상황에서도 윤석열의 양순음/ㅂ/은 burst가 그리 크지 않다는 점입니다.

 

3. 결론

잠재적 결론은, 음향적 분석으로 확실히 결론을 내리기에는 소음이 너무 강하다는 것입니다. 다만 확실한 것은 "날리면"이 지지받기가 어렵다는 것입니다. ㄹ의 조음이 불확실하고, 특히 치경음ㄴ이 있었다고 하기 어렵습니다. "냘"에서 처럼 [ɲ]이면 모를까...

 

'바이든' 이라고 말했다는 결정적 근거도 희박합니다. '바이든'을 말했다는 것은 전적으로 정황상 (맥락적인) 증거일 뿐 소음이 많은 녹취본을 통해서는 확실히 알 수 없을 것 같습니다.

 

 

하지만 제가 감히 누구라고 결론을 내겠습니까? 한국에는 훌륭하신 음성자들, 음향음성 연구자들이 엄청 많은데 저는 단지 ""하는 사람인걸요.ㅋㅋㅋ

 

 

 


  • 아래에 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
  • 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
  • 반박이나 오류 수정을 특히 환영합니다.
  • 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.

 

  1. 이게 뭔소린가 모르겠으면, 간단하게 말해서 제 전공분야는 말소리기는 하지만 소리 그 자체의 물리적 특성은 저의 전문분야가 아니라는 뜻입니다. 요리로 비유하자면, 요리사와 셰프로 비교할 수 있을 것 같습니다. 음성학자들은 시장에서 야채와 고기를 사서 껍질을 까고 다듬는 데부터 시작해서 멋진 요리를 하는 셰프들이고, 음운론자들은 '깐마늘', '토마토소스', '냉동콩' 등을 사서 요리하는 요리사입니다. 이 글을 올리고 나서 곧 고려대 신지영 교수님이 '김어준의 뉴스공장' 방송에서 윤석열 대통령의 해당 발화에 대해 분석한 것을 소개하셨으니 참고하시기 바랍니다. (유튜브 링크) [본문으로]
  2. Boersma, Paul & Weenink, David (2022). Praat: doing phonetics by computer [Computer program]. Version 6.1.16, retrieved from http://www.praat.org/ [본문으로]