Web Analytics Made Easy - Statcounter

생각나는대로

왜 앞말잇기는 어렵지? 연산과 인출에 관한 생각

sleepy_wug 2023. 1. 7. 08:02

연말연시 개인적으로 가지고 있던 화두는 연산과 인출의 구분에 대한 고민이었다.

 

형식주의 언어학의 큰 전제 중 하나는 연산부로서의 '문법'(grammar)과 저장부로서의 '어휘부'(lexicon)의 구분이다. 자연언어모델은 어휘부로부터 연산가능단위를 가져다가 문법(그것이 제약군이 되었건 규칙군이 되었건)으로 연산한다는 것이 큰 그림이다. 마치 컴퓨터가 RAM이나 HDD SSD등의 메모리에서 정보를 인출하여 CPU나 GPU로 연산을 하는 것과 동일한 모델이다. Chomsky (1981)[각주:1] 이후 아래와 같이 표준적인 Y-Model로 표현한다. 

Y-Model

 

사람들은 무작위로 저장소에서 정보를 가져오는 것을 쉽고 재미있어한다. 저장소에서 정보를 가져오는 것을 '인출'이라고 한다. 인출을 정확하고 빠르게 하는 것은 재밌는 놀이가 된다. '구구단을 외자'가 게임이 되고, 잡학다식을 서로의 저장소에서 인출하여 교환하는 것이 유희가 되는 것은 신기하다. 한자릿수 곱하기 한자릿수를 대부분 초등학생 때 암기하기 때문에 구구단은 실시간으로 이루어지는 연산이 아니라 저장소에서 인출하는 과정이다. 잡학다식은 단순히 책이나 인터넷을 통해 접근할 수 있는데, 사람들은 굳이 자신의 머리에 저장된 정보를 인출하여 상대방에게 보여주는 것을 좋아하고, 가끔은 듣는 사람들도 좋아하는 것 같다.

 

반면 연산은 사람들이 어려워하고 기피한다. '구구단을 외자'에서 살짝 비틀어서 덧셈 뺄셈 등 실시간 연산을 필요로 하는 '박명수 게임'을 만들면 순식간에 재미가 없어져버린다.

 

박명수 게임 스크린캡처
재미없는 박명수 게임

 

 

 

20세기 들어와 컴퓨터가 발명되고 사람들이 가장 먼저 한 일은 지겨운 연산을 기계한테 대신 시키는 것이었다.

 

(여담으로 아래 스크린캡처에서와 같이 오늘날 어린 친구들은 컴퓨터를 '저장공간이 있는 통신기기' 정도로 생각하는 모양인데 computer가 compute-er 즉 연산하는 기계라는 점을 생각해보면 격세지감이다. 당연히 컴퓨터의 핵심에 연산을 놓는 내가 그냥 노땅인 것일까.. 연산기능이 없는 단순 저장장치가 과연 컴퓨터인지를 별도로 논의해주어야 하는 시대가 오고 있다. 원본링크는 여기)

 

연산은 놀이가 될 수 없지만 인출은 놀이가 되는 이유는 아마 사람의 뇌가 인출에 빠르고 연산에 느린 특징을 가지고 있기 때문일 것이다. 또한 연산은 실수가 잦고 부정확한 경우가 발생한다. 만약 구구단을 암기하지 않고 매번 실시간으로 연산한다면 속도도 느릴 것이고 실수도 잦을 것이다. 한때 19단 외우기가 유행했던 것도 이 까닭일 것이다. 즉 연산으로 해야하는 영역의 일부를 인출의 영역으로 돌리는 것이다.

 

끝말잇기와 앞말잇기도 연산과 인출의 놀이로 생각할 수 있다.

 

끝말잇기는, 적어도 한국과 일본에서 매우 인기있는 말놀이이다. 이 놀이를 연산과 인출의 관점에서 본다면, 가장 첫 음절이 주어졌을 때 그것으로 시작하는 단어를 인출하는 놀이라고 할 수 있다.

그리고 이 놀이의 재미는 어떠한 공유된 단어 저장소로부터 순발력있게 단어를 인출하는 데 있다. 즉 첫 번째 재미는 놀이에 참여하는 사람들이 놀이 과정을 통해 암묵적으로 '한국어 렉시콘'이라는 동일한 저장소를 공유하고 있다는 걸 확인하는 데 있고, 두 번째 재미는 렉시콘으로부터 단어를 빠르게 인출하는 과정에 있다. 특히 두 번째 재미의 경우, '구구단을 외자'와 동일한 종류의 재미이다.

 

그러나 끝말잇기에 파생된 앞말잇기는 어떠한가?

 

앞말잇기는 흔히 "XXX의 X를 맨끝으로 보내면" 등의 노래를 통해 앞사람의 단어의 첫음절을 다음사람이 가져다가 그것으로 끝나는 단어를 제시하는 놀이이다. 내 경우 스타골든벨에서 하던 버전으로 기억한다. 아래에 동영상으로 제시한다.

 

(2006년 8월 26일 자 '스타골든벨'의 일부. [출처])

끝말잇기에 비해 앞말잇기는 상당히 난이도가 있는 놀이이다. 왜 그런걸까? 한국어의 어휘부가 물리적 사전처럼 색인이 되어있을 리도 없고 왜 첫음절이 주어졌을 때 단어인출이 더 빠른 것일까? 혹시 앞말잇기는 연산의 과정을 거치는 것이 아닌가?

 

내 연구주제는 석사논문 이래로 줄곧 렉시콘의 구조에 대한 문제로 천착한다. 구체적으로는 렉시콘에 대한 기존 연구들의 전제를 재검토하는 과정이다. 형식주의 언어학의 기존 연구에서와 같이 렉시콘은 '패턴이 없는' '무작위'한 정보들의 저장소인가? 만약 그렇다면 끝말잇기나 앞말잇기나 동일하게 어려워야 하는 게 아닌가? 결국은 선형성(linearity)의 문제이고 그래서 이론언어학에서 유일하게 선형성을 다루는 분과인 음운론의 관심사가 된다. 

 

 

 


  • 아래에 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
  • 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
  • 반박이나 오류 수정을 특히 환영합니다.
  • 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.

 

  1. Chomsky, Noam. (1981). Lectures on government and binding. Walter de Gruyter. [본문으로]
반응형