Web Analytics Made Easy - Statcounter

생각나는대로

음운부를 괴롭히자

sleepy_wug 2024. 5. 2. 13:58

 

오늘 산책하다가 갑자기 든 생각인데 도대체 한국어의 ㅡ 모음 혹은 영어의 ə 중에서 기저형에서부터 specify되어야만 하는 게 비율적으로 얼마나 될까 궁금해졌다.

 

예를들어 tomorrow. 렉시콘에 /tmɑɹo/ 만 넣어두면 tm 연쇄 깨려고 ə 넣고 등등해서 실제 사용되는 형태를 만들어낼 수 있다.

 

반대로 기저에서부터 반드시 specify되어야 하는 ə들이 있을 것이다. about, adobe, arise, alaska 처럼 어두에 ə가 있는데 그거 없어도 [baʊt], [doʊbɪ], [ɹaɪz], [læskə] 와 같이 음운적으로 하등 문제가 없는 단어들은 분명히 어두 ə가 기저에서부터 온 것이다.

 

tomorrow의 ə 같은 게 많을까 아니면 about의 ə 같은 게 많을까?

 

그리고 한국어의 ㅡ 모음의 경우는 어떨까? 음소배열제약이 조금 더 빡빡하기 때문에 '음성학적인 이유로 들어간' 비율이 영어보다 더 높을까? 진짜 전혀 정말 모르겠다. 이건 정말로 코퍼스를 봐야 한다. 

 

렉시콘을 슬림하게 설정하는 대신 음운부가 고생하므로, 이러한 프레임워크는 음운부를 더 괴롭히는 일일텐데, 이상하게 어떤 음운론자들은 렉시콘을 최소한으로 하고 음운부 크게 설정하는 걸 선호하는 듯하다. 안 친한 친구(렉시콘)은 불편해서 손님 대하듯 극진히 대해주면서 친한 친구(음운부)를 더 괴롭히는 이상한 심리.😈

 

농담으로 '이론언어학자들은 아직도 컴퓨터가 16MB 램으로 돌아가는 줄 안다'고 하던데, 정말 어떤 이론가들은 인간의 언어기관을 관념적으로 떠올릴 때 메모리가 적은 옛날 컴퓨터를 생각하는 걸지도 모르겠다. 데이터 엄청많이 욱여넣어서 결과 내는 방법론의 자연어처리가 흥하는 데에는 "메모리 타이어보다 싸다!" 시대인 까닭이 한몫 할텐데, 촘스키가 NLP하던 시절을 생각하면 그땐 메모리가 비쌌으니...[각주:1] 렉시콘을 최소화하는 데에는 역사적 이유 말고도 이론 내적인 이유가 있기도 하다. 렉시콘은 무한정 방대하게 가져갈 수가 없다. 왜냐하면 "렉시콘은 학습, 연산부는 타고남" 이런 전제가 있기 때문이다. 렉시콘이 이렇게 방대하면 그거 어떻게 인간이 학습함? 이런 생각. 렉시콘은 '소소익선'이어야 언어습득을 설명하기 쉽다는 논리인데, 렉시콘이 작아지는 만큼 음운부 등 연산부의 부담은 더 커진다. 그리고 연산부의 복잡성은 "아 그거 UG임" 이런 식으로 덤핑하고, 또 그 덤핑을 받은 다른 연구자들은 UG를 엄밀정의하기보단 "아 그거 유전자 관련이니까 생물학에 물어보셈. 그리고 님 업데이트좀 하세요. 언젯적 UG에요? 이제 ✨FL✨[각주:2]이에요" 이런 식으로 또 덤핑하는 거다.

 

별개의 이야기지만 표면형에서 음가가 없고 형태론적인 이유로도 자리차리할 이유가 없는 것은 무조건 적지 않고 학생들에게도 적지 말라고 한다. 난 이렇게 하는 게 이론의 여지 없이 모두 그런 줄 알았는데 또 그렇지도 않은가보다. 일례로 한번은 저널 논문 투고했을 때였나 학회 발표 abstract 냈을 때였나, 어쩌니저쩌니 예시를 들다가 하필이면 catholic 이라는 단어를 예시로 들었다. 근데 기저형 표기에서 의도적으로 철자 o 에 대응될 음소를 넣지 않았는데 거기에 대해 코멘트를 받았던 기억이 난다. 내 발음이 잘못됐나 싶어서 iphod 찾아보니 K AE TH L IH K 으로 전사되어 있다. 규범주의 사전인 Oxford English Dictionary에도 [kæθlɪk]으로 되어있다.

 

 

 


  • 아래에 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
  • 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
  • 반박이나 오류 수정을 특히 환영합니다.
  • 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.

 

  1. 옛날옛적 이론언어학은 음운론의 SPE, 통사론의 표준이론 등 다시쓰기규칙으로 점철되었는데, 사실 다시쓰기규칙은 언어처리 방식에 있어서 50-60년대 고전 컴퓨터과학의 튜링머신 specification을 철저히 따른다. 그러한 구상에서 인간이 언어를 처리하는 방식은 마치 튜링머신에서 헤드가 테이프(렉시콘의 항목)에 순차적으로 접근한 다음, 각 테이프 슬롯에 대해 현재 상태에 따라 action table을 적용하여 값을 유지하거나 바꾸거나 하는 것이다. [본문으로]
  2. The Faculty of Language [본문으로]
반응형