연구 대상으로 자연발화 코퍼스를 많이 본다.
당장 화자를 모집해서 실험하기 어려운 코로나 상황에서 자연발화 코퍼스는 큰 도움이 된다. 영어의 경우 당연히 오하이오 주립대에서 구축한 Buckeye Corpus [링크] 를 많이 보고, 일본어에도 Corpus of Spontaneous Japanese (CSJ) [링크]가 있다.
한국어에는 '서울 코퍼스'가 있다. 상당한 규모의 음성자료가 있어서 큰 힘이 된다.
참고로 국립국어원에서 제공하는 '모두의말뭉치'라는 사이트가 있기는 하지만, '실명인증'을 해야만 자료를 받을 수 있다. 즉, 나와 같은 해외 연구자의 경우 한국 핸드폰 번호가 없어서 접근이 안 된다. 일본어 코퍼스 자료인 CSJ의 사례를 따라서, 좀 더 개방적으로 개선했으면 좋겠다고 생각한다.
그런데 하루는 서울 코퍼스 데이터를 보다가 아래와 같은 사례를 발견했다.
일련번호 S17F24F2, 그니까 24세 여성의 자연발화 자료인데, 595.51초부터 602.08초 사이이다. 이 화자는 "음운론 수업을 들었는데 꼭 수학처럼 그게 딱딱 떨어지는 거에요"라고 말했다.
나는 한편으로는 부럽기도 하고, 한편으로는 내가 잘못된 방향으로 가고 있는가 싶었다. 왜냐하면 나의 음운론은 수학처럼 딱딱 떨어지지 않기 때문이다. 오히려 갈수록 불안정하다. 그런데 생각해보면 음운론이 괜히 음운론이겠는가? 말소리를 논(論)하는 말의 싸움이니까 음운론이고, 말소리에 대한 논리(logos) 싸움이니까 phonology다. 하지만 나의 연구도 수학처럼 딱딱 떨어졌으면 좋겠다.
정말 두서없고 생각나는 대로의 감상이다. 그래서 글을 어떻게 마무리지어야할 지 모르겠다. 적어도 이 글을 읽을 사람들은 자연발화코퍼스가 존재한다는 것을 얻어갔으면 좋겠다. 모두들 서울 코퍼스 사용하시오.
'생각나는대로' 카테고리의 다른 글
한글을 음성기호 IPA나 예일 Yale 로 자동 전사하기 (16) | 2022.07.25 |
---|---|
"봐봐"를 "봐바"로 발음하는 /w/탈락 (2) | 2022.02.15 |
좀비의 차용 (2) | 2021.11.18 |
한국어에서 어순을 바꾸면 비문법적인 문장이 되는 경우 (7) | 2021.05.18 |
'너무'의 polysemy 그리고 QR의 surfacing으로서의 prosodic patterning (0) | 2021.05.08 |