0. 요약
학부생이 수업 중 던진 질문에 우리 teaching team 모두가 깊은 생각에 빠졌던 일을 공유합니다.
때는 개론 수업 중에 규범주의와 기술주의에 대해 설명하는 부분이었습니다. '언어학은 기술주의적으로 언어를 다룬다' 어쩌고저쩌고 이런 만트라 같은 이야기 반복하는 날이었습니다. 학부 3학년인가 4학년 정도 된 학생이 불쑥 질문을 했습니다. 컴퓨터과학 혹은 컴퓨터공학 전공 학생이었던 걸로 기억합니다. 그 친구는 언어학자도 규범주의적인 말 많이 하지 않냐, 도대체 기술적(descriptive)이라는 걸 이해할 수 없다. 라고 말했습니다.
일면 타당한 면이 있었고 분명 우문(어리석은 질문)은 아니었습니다. 1
그 친구의 말처럼 과연 '언어학은 기술주의적이다' 는 도그마에 불과한가요? 결국 언어학이 말하는 '기술주의'도 그냥 내로남불에 불과할까요?
다양한 가능성을 생각해보았습니다. 이 글에서는 그 경우들을 소개합니다.
목차
1. 너무 많은 자칭 '언어학자'
언어에 대해 규범적 판단을 내린다는 사람이 정말 언어학적 훈련을 받은 언어학자일까요?
한국어에서 '박사'라는 말이 너무 과용되어 '족발박사' 같은 말도 가능한 것처럼 영미권에서 linguist 역시 너무 과용되는 측면이 있는 것 같습니다. 언어학과 관련이 없는데도 단지 '언어를 여러 개 구사하는 사람 = linguist' 이런 도식이 있는 것 같습니다.
언어학자가 언어를 여러 개 아는 것은 사실이지만 반드시 여러 언어를 구사할 줄 아는 건 아닙니다. 다개국어를 하는 사람을 영어로 polyglot이라고 하는데, polyglot 과 linguist를 혼용해서 사용하는 것 같습니다.
이러한 맥락에서 아마도 어떤 polyglot이 자신의 언어 지식을 권위로 삼아 영어에 대해 어떤 표현이 옳다 그르다 판단을 내리는 것을 그 학생이 들었을 수 있습니다. 그런 polyglot은 스스로를 '언어학자'라고 자칭했겠지요. 그래서 "언어학자도 규범적 판단을 내리잖아?"라는 관찰을 했을 수 있습니다.
외국어 교사가 언어학자로 혼동되는 경우가 있습니다. ESL(제2언어로서의영어) 전문가가 자신의 언어학적 지식을 권위로 삼아 어떤 영어는 올바른 언어고 어떤 영어표현은 잘못되었다 이렇게 말하는 경우가 있을 수 있는데, 그것이 "언어학자가 내리는 규범적 판단"으로 보일 수도 있을 것 같습니다.
제대로 된 언어학 훈련을 받은 사람은 실제로 사용되는 언어표현에 대해 옳다/그르다의 가치판단을 내리지 않습니다. 그러한 가치판단이 관심사가 아닐뿐더러 그런 판단을 하는 것이 위험하기 때문입니다.
2. 규칙과 규범을 혼동
"언어학자들도 규범주의적인 말을 많이한다"라는 주장을 하는 사람은, 언어학에서 말하는 규칙을 규범과 혼동했을 가능성이 있습니다.
언어학에 입문하는 학부생들 가운데에는 언어학에서 사용하는 '규칙'(rule)이라는 개념을 혼동하는 사람들이 있습니다. 그것을 마치 신호등처럼 '사회적으로 지키기로 합의된 자의적 약속'이나, 법령처럼 '누군가 정해놓아서 안 지키면 처벌받는 것'으로 생각하는 경우가 가끔 있습니다. 만약 그렇게 생각한다면 규범과 차이가 뭔지 혼란스러울 수 있습니다.
언어학적 규칙은 그러한 것이 아닙니다. 열역학 제1법칙은 "고립된 시스템에서는 에너지의 총량이 일정하다" 입니다. 그런데 이것을 "고립된 시스템에 에너지 늘어나면 아주 그냥 혼난다!" 는 식의 규범으로 이해하는 사람은 없습니다. 자의적 약속이거나 법령 같은 것도 아니죠. 이것은 "고립된 시스템에서는 에너지의 총량이 일정하다"라는 일반화 혹은 기술입니다.
언어학에서 말하는 규칙도 마찬가지입니다. "영어에서 3인칭 단수 주어와 함께 쓰일 때는 동사 뒤에 -s를 붙이는 활용을 한다"라는 규칙은, "-s 안 붙이면 아주 그냥 혼날 줄 알아. 언어학자들이 쫓아다니면서 단속할 거야"라든가, "-s 안 붙이면 대화상대방이 막 화를 낼거야! 반드시 붙여!" 가 아닙니다. 언어학에서 쓰는 규칙이라는 개념은 '언어생활을 단속'하는 게 아니라 언어 사용의 관찰들을 일반화한 진술문입니다.
영어 사용자들의 언어사용을 관찰했을 때, "주어가 Alex 일때, 동사 eat에 -s 붙였어", "주어가 같은 Alex인데, 다른 동사인 read에 -s 붙였어", "이번에는 동사가 같은데 주어가 The cat일 때도 read에 -s 붙였어" 이런 사례들을 일반화하여서 "영어에서 3인칭 단수 주어와 함께 쓰일 때는 동사 뒤에 -s 붙인다"라고 정리하는 것입니다.
열역학 제1법칙을 기초로 증기기관을 새로 구성할 수 있듯이, "영어에서 3인칭 단수 주어면 동사 뒤에 -s를 붙인다"라는 규칙도 마찬가지입니다. 언어학의 규칙도 새로운 언어현상을 예측합니다. -s를 붙여야 한다는 법령이 아니라 처음 본 명사 "Jessica" 와 처음 본 동사 "sing"가 있을 때 "sings"로 활용하는 게 화자직관에 타당하다는 예측을 합니다.
3. 기계학습적 언어관에 반대하는 게 전부 규범주의가 아님
언어표현 중 일부에 초점을 맞추는 것을 규범주의로 판단할 수도 있습니다. 존재하는 언어표현 중 무엇을 배제한다는 것이 규범주의가 아니면 무엇이냐는 말이죠. 그러나 이것은 언어학의 학문적 관심사 때문에 어쩔 수 없는 면이 있습니다.
코로나 이후 캠퍼스로 돌아온 학부생들을 상대하면서 여러차례 느끼는 것인데, 기계학습적인 패턴학습 패러다임에 갇혀 생각이 고정되어버린 친구들이 많아졌습니다.
무슨 뜻이냐면, 그 친구들에게 언어학은 (혹은 그 어떤 학문이든) 설명대상에 존재하는 input-output 쌍을 많이 많이 모아서 그걸로부터 패턴을 학습하여 처음보는 input을 예측하는 학문입니다. 즉, 초점이 output이 정확하게 도출되었느냐에 심각하게 편향되어 있습니다. 심지어 잘못된 input에 대해서도요. 한국어 음운론을 열심히 학습한 기계한테 한국어에 존재하지 않는 음소들을 결합헤서 input으로 던져주면 뭐라도 output을 내겠지만, 이게 무슨 의미가 있나요?
저나 제 주변의 연구자들에게 있어서 언어학은 전통적으로 output이 아니라 언어 과정에 대한 명시적 기술에 초점을 둡니다. 정확도 높은 output을 도출해내는 건 공학적 방식으로 어떻게든 가능할 테지요. 그런데 블랙박스에 넣든, John Searle의 '중국인의 방'에 넣든 결과만 잘 나오면 장땡인가요? 이론언어학자들은 결코 그렇게 생각하지 않습니다. 우리에게 중요한 것은 블랙박스 그 자체이고 중국인의 방 그 자체입니다. 블랙박스를 열고 중국인의 방을 여는 것이 언어학의 관심입니다.
하지만 이를 위해서는 필연적으로 '초점맞추기'가 필요합니다. 연구대상인 '언어'가 무엇인지 범위를 설정하는 것이지요. 따라서 야생의 언어(?) 데이터 가운데 분석의 대상으로 삼는 언어표현의 초점을 맞추기 위해 데이터전처리(preprocessing)가 들어가는데, 컴퓨터과학에서 보기에는 정도가 과도할 수도 있고, 그래서 그것을 규범주의적이다라고 판단할 수도 있습니다.
사실은, 언어데이터와 언어학의 목적에 대한 이해에서 언어학과 타분야, 혹은 언어학 내에서도 이견이 있던 건 하루이틀의 일이 아닙니다.
놈 촘스키가 미셸 공드리(Michel Gondry)의 영화 'Is the man who is tall happy'에서 했었던 이야기였던 것으로 기억하는데, 촘스키가 대학원생이었던 때에도 똑같았다고 합디다. 아주 전통이 깊은 셈이죠. 당시 이론언어학의 일부 사람들은 "최근(1950년대) 컴퓨터의 발달을 보니, 이제부터 언어학은 언어데이터만 열심히 수집하고 실수없이 입력만 할 수 있으면 될 것이다"라고 생각했습니다.
그러나 언어학에서 생성문법의 패러다임이 들어서고, 컴퓨터과학에서는 Minsky and Papert (1969)이후 소위 "AI Winter"가 20년 가까이 이어지면서 아무도 그렇게 생각하지 않게 되었죠.
AI Winter를 초래한 Minsky and Papert (1969)는 Perceptron이라는 교과서인데, 신경망 기반의 인공지능 알고리즘이 단순히 데이터만 가지고 그것을 생성한 XOR function을 학습할 수는 없다는 수학적 논증을 포함하고 있었습니다. 신경망 모델은 오늘날 기계학습에서 아마도 가장 널리 쓰이는 방식일 것입니다. 그런데 Minsky and Papert (1969)가 나왔던 당시 존재하던 최신의 신경망 모델은 Rosenblatt의 Perceptron 모델이었습니다. 이 모델이 (훌륭하긴 하지만) 학습할 수 없는 function이 있다는 것은 연구자들을 많이 실망시켰고, 연구동력 자체를 20년가까이 상실하게 만든 계기가 되었죠. 물론, 오늘날에는 perceptron 모델이더라도 multi-layer network를 사용하면 이런 패턴을 학습할 수 있다고 알려져 있습니다. 2
재밌게도 게임 Detroit: Become Human에 Marvin Minsky를 기리는 이스터에그가 있습니다. Android의 창조자 Elijah Kamski의 저택에 가면 계속 잔잔하게 흘러나오는 배경음악이 있는데, 이 곡들은 Marvin Minsky가 작곡한 것들입니다.
어쨌든! '데이터만능주의'의 망령(?)은 인공지능의 성취가 조명받을 때마다 다시 돌아오는가봅니다.ㅋㅋㅋ
이런 판단은 '데이터 선별하고 왜곡하는 게 규범주의가 아니면 도대체 뭔데?' 라는 근본적인 질문을 낳는 것 같습니다. 그리고 이 질문에 대해 저 스스로는 엄밀한 답을 하기는 어려운 것 같습니다. 적당히 소쉬르의 Langue 개념이나 촘스키의 I-Language (혹은 competence) 개념을 주절거리겠지만, 뭐가 Lanuge (I-Language) 고 뭐가 Parole (E-Language) 인지는 누가 판단하느냐 라는 추가질문으로 이어질 게 뻔하므로 근본적 답은 될 수 없겠지요.
- 아래에 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
- 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
- 반박이나 오류 수정을 특히 환영합니다.
- 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.
'생각나는대로' 카테고리의 다른 글
피인용은 늘 짜릿해 (2) | 2024.03.01 |
---|---|
티스토리 그만둘 고민 (10) | 2024.01.27 |
교양수업 커리큘럼 고민 (0) | 2024.01.17 |
음운론 연구자가 찾아보는 언어 레퍼런스 (1) | 2024.01.10 |
층위에 따른 양순음 뒤 고모음 실현 (0) | 2024.01.03 |