Web Analytics Made Easy - Statcounter

Bouncing ideas 생각 작업실/lexical subclassing

lexical subclassing 일단 쓰면서 생각하기.

sleepy_wug 2022. 6. 21. 08:02

현상적으로, 음운규칙의 선택적 적용 문제가 관찰됨. 

 

Schematically speaking,

언어 L에 속하는 음운형태적 환경이 동일한 단어 w1, w2이 있을 때, Grammar G의 일부인 특정 Phonological process P는 w1에만 적용되고 w2에는 적용되지 않는다. 

 

For example,

한국어의 층위 의존 작용들 그리고 다른 언어들에서의 사례(Michif 등)가 이 글의 하단부에 제시됨.

 

통상적으로 이것은 co-phonology, lexical strata, split-phonology 등으로 불렸음.

 

SPE 이후 이 현상을 모델링하는 표준(?)적인 방식은 다음과 같음 (이 글의 첫 단락):

 

Phonological process P에 대하여, morpheme μ 가 lexical (i.e., idiosyncratic) feature φ를 가지면 P를 적용하고 φ를 가지지 않으면 P를 적용하지 않는다.

 

문제는, μ에 φ가 어떻게 부여되는가임. 이것이 설명되지 않기에 SPE는 단순히 기술만 할 뿐이고 설명적 타당성을 가지지 않았음.

 

lexical feature 부여하는 문제에 대해 두 가지 모델이 존재할 수 있음.

Model 1. indexation: μ에 φ 부여하는 문제는 마치 '꼬리표를 붙인다'와 같이 비유하여 indexation이라고 불림.
이러한 접근에 따르면 학습의 진행과정은 다음과 같음. μ에 규칙 P가 적용되는 것을 관찰하고 μ에 자질을 부여하는 방식으로 학습이 진행됨. By default, alternation이 없는 상태이고 *예외적인 경우만* 규칙적용되는 사례를 저장. Coetzee와 같이 strict하게 P 관찰된 어휘에만 '예외표지'를 하는 경우가 있을 수 있고, Pinker처럼 조금 lenient하게 analogously similar forms에도 P를 적용하는 것으로 표시할 수도 있음. 어쨌든 따라서 렉시콘은 homogenous하며 apparently co-phonology는 actually 예외의 집합임.

Model 2. (phonotactic) subclassing: 이 글에서 나온 2단계의 과정을 거치는 모델. 이 경우 렉시콘은 sub-lexica로 나뉘고 co-phonology는 실재함. 
1단계: (어원이 되었건 무엇이 되었건), lexicon을 subclassing하기. 이때 subclassing은 Natural Language Processing literature에서 말하는 "Classification problem"이다.[각주:1]
2단계: 어떤 한 subclass에서 규칙적용이 발견되면 해당 subclass의 다른 어휘에도 규칙을 적용시킴. 그러나 동일한 환경이더라도 다른 subclass에는 규칙이 적용되지 않음. 마치 케이크를 조각으로 잘랐는데, 만약 케이크 한 조각에서 벌레가 나오면 그 조각의 다른 부분에서도 벌레가 있을 것이라고 취급하고 그 조각을 버리는 것에 비유. 

 

Model 2가 타당한 관념적/선행연구로부터의 이유, 특히 *phonotactically learnable* subclassing이 타당한 이유는 다음과 같음

- Morita 의 주장처럼 phonotactic subclasses는 statistically viable함

- (어원에 비해 phonotactics가 타당한 이유) 어원정보와 실제 인식이 다른 경우가 존재함 (Misalignment between strata and partitions). 그리고 왜 mismatch가 발생하는지를 phonotactially accounted for 될 수 있음.

 

하지만 이 논거는 전적으로 Model 1을 배제할 수는 없음. 따라서 Model 1과 Model 2-1(etymological subclassing)을 반박하기 위해서는 다음과 같은 현상을 포착하여야 함. 어떤 현상이냐 하면, P의 적용을 받는 환경을 가진 2개의 nonce words NW1 NW2에 대하여, likely in class X인 NW1가 규칙적용을 받으나 likely in class Y인 NW2가 규칙적용을 받지 않는 현상을 포착해야 함. 

 

예컨대, 한국어의 l-tensification을 비유하여 예를 들자면 아래와 같을 것이다.

 

[Phonotactic subclassing + co-phonology가 참일 때 예측되는 관찰]

Assumption

아래와 같은 렉시콘에서, (e.g., 'E:1, P:1' indicates etymologically group1 and phonotactically class1; 'E:1, P:2' indicates etymologically group1 but phonotactically class2)

w1: VLTV{E:1, P:1}
w2: VLKV{E:1, P:1}
w3: VLTV{E:1, P:2}
w4: VLKV{E:1, P:2}
w5: VLTV{E:2, P:1}
w6: VLKV{E:2, P:1}
w7: VLTV{E:2, P:2}
w8: VLKV{E:2, P:2}

Phonological process Pr이 아래와 같을 때,

Process Pr:

T -> T* / VL_V

 

아래와 같은 노출 e의 결과,

Exposure

e: VLT*V , where e being classified as "P:1"

 

 

렉시콘의 어휘 중 w1 w5에만 규칙을 적용하는 결과를 가져온다.

  1. "[L]abelling words with their morphological properties [...] as a classification problem." (Borg and Gatt, 2017) [본문으로]
반응형