이번에 음성음운형태론연구 27집 1호에 흥미로운 논문이 하나 나왔다.
A maximum-entropy model of phonotactics for Korean male and female names (이하 Cho 2021)
두 가지 지점에 대한 메모.
1. Sound symbolism
이름을 짓는 작명은 매우 의도적인 행위다. 작명의 대상이 되는 특징을 이름에 담기 때문이다. 따라서 작명이라는 행위를 중심에 두면 소쉬르의 '기표와 기의 사이의 무작위성'이 다소 흔들린다. 물론, 궁극적으로는 무작위가 맞지만, 이러한 결과론적인 접근 말고, 처음 이름이 지어지고 그 후에 이름이 통시적으로 변이, 변화되는 과정을 하나하나 분리해낼 수 있으면 아마도 그 겉보기의 무작위도 다양한 필연적 자질들로 환원될 수 있을 것이다.
이러한 생각은 결국 sound symbolism이라고 불리는 음운론의 관심연구주제로 귀결된다. 기표는 그것이 상징하는 기의와 일정한 상관관계를 가지고, 그것은 생리적으로 당연한 (예: 몸집이 크면 성대가 길어서 저음) 특성을 언어적으로 모방하는 양상으로 나타난다. 이 논문에서도 소개되었지만 흔히 'bouba-kiki 효과'라고 불린다. bouba는 왠지 둥글둥글한 (그리고 뭉툭하고 큰?) 물건을 지칭하는 느낌이고, kiki는 뾰족뾰족한 (그리고 작은?) 물건을 지칭하는 느낌이다.
Ohala의 80년대 90년대 연구가 아마도? 기반일 것이다. 혹은, 아마도 의외로 화용론쪽에서부터 연구되었을지도 모르겠다. (Ohala의 홈페이지)
고전적으로 sound symbolism은 ideophone과 단짝이었다. 의성어 의태어가 발달한 한국어, 일본어, 태평양제어 등이 연구대상이었다. 또한 아주 많은 언어들에서 소위 '기본단어' 사이의 음운적 유사성을 발견하는 것도 sound symbolism에서 연구되던 방식. 어머니를 지칭할때 양순음(bilabial)이 들어간다느니 그런 것 말이다.
'작명법 음운론'은 최근에 각광받기 시작했다. 이 방법론에서는 다양한 실존이름 (특히, 별명) 그리고 가상이름 (포켓몬 같은 캐릭터이름)을 연구한다. 지시대상이 가진 특성을 독립변수로 하고 vowel height, articulatory manner 등 음성학적 자질들을 종속변수로 하여 통계적 유의미성을 따진다. Stephanie S Shih (USC)의 야구선수 별명 연구나 Shigeto Kawahara (Keio) 등의 포켓몬 연구가 유명하다.
실존이름을 연구할 때, 두 가지 이슈가 있을 것이다. 첫번째는, 실제인간이 가진 특성들이 차별의 근거가 되는 경우이다. 남녀차이 중 생물학적인 부분이 아니라 사회적으로 정해진 '편견'들이 이름에 반영될까? 둘째, 그렇다면 이러한 편견들이 '작위적'이라는 점에서, 이렇게 편견이 반영된 이름 역시 작위적인 것 아닌가?
'언어학이 무엇을 연구해야하느냐' 라는 질문에 어떻게 답하느냐에 따라 sound symbolism은 언어학의 관심대상이 아닐수도 있다. 만약 언어학이 주어진 기호의 조합 방식에 집중해야한다면 sound symbolism은 딱히 관심대상이 아닐 수도 있다.
2. Constraint-based phonotactics vs. generative phonotactics
Sound symbolism이 표면화되는 방식은 음소의 배열이다. 이를 연구하는 분야가 음소배열론(phonotactics)인데, 현대의 음소배열론은 크게 두 흐름으로 나뉘는 것 같다.
첫째는 constraint-based approach로서, OT(최적성이론)의 확장이다. 이 접근법에서는 학습자가 제약을 학습하고 제약에 따라 어휘형이 선택된다. 2000년대에 OT는 거의 표준이 되었다시피 하였기 때문에, 어쩌면 오늘날에 와서는 최적성이론이 maximum entropy model로 수렴되는 양상이라는 점에서 이쪽도 궁극적으로는 베이지언 통계학 기반. 이쪽 진영에서의 방법론은 Hayes and Wilson (2008)이 끝판왕인 것 같다. 본 포스팅의 출발점이 된 Cho (2021) 역시 Hayes and Wilson (2008)의 방법론을 따랐고, 최근 나온 박나영의 2020 SNU dissertation 역시 그러하다.
둘째는 generative phonotactics라고 하여 n-gram 식의 (확률적)음소배열규칙을 인간이 학습하고 그 규칙에 따라 recursive하고 선형적으로 어휘가 생성된다는 접근법이다. 베이지언 통계학을 이용한 parameter setting 방식으로 학습자가 n-gram 음소배열규칙을 어떻게 학습하는지 규명하는 것이 목표이다. OT식 MaxEnt 모델이 learnability 문제에 봉착하는 사례들이 나오면서 이를 비판하며 등장하였다. 나의 토픽인 어휘층위 역시 MaxEnt 모델로 설명이 이미 많이 되어있지만, 문제는 "층위정보가 prior에 들어있지 않으면 층위 판단에 기여하는 제약을 학습할 수 없다" 는 것이다. 거칠게 말하면 한자어들에서 나오는 패턴을 미리 알고있어야 어떤 단어를 한자어로 판단할 수 있다. 그렇다면 그 패턴은 어떻게 배우나? generative phonotactics는 Gorman의 2013 UPenn dissertation이 대표적이고 이후 Futrell et al. (2017) 에서도 이론적 기반이 마련되었다. 어휘층위에 대해서도 Morita의 2018년 MIT dissertation 이 generative phonotactics를 이용하였다.
아직 '작명 음운론'에서 generative phonotactics를 이용한 논문은 보지 못한 것 같다. 애초에 나 자신이 sound symbolism에 흥미가 없어서, 적극적으로 찾아보지 않았기 때문일지도 모르겠다.
'Bouncing ideas 생각 작업실' 카테고리의 다른 글
나의 연구주제를 간략하게 표현하기 (0) | 2022.01.21 |
---|---|
단어 차용에서 공명자음의 gemination (0) | 2021.07.03 |