Web Analytics Made Easy - Statcounter
반응형

Bouncing ideas 생각 작업실/lexical subclassing 19

Different contrastiveness by strata?

인식되는 층위에 따라 절대적 음향정보(모음지속시간)이 다른 모음길이로 인식된다. (Moreton and Amano 1999) 왜 일본어에서는 층위에 따라 모음길이 인식 차이가 나타나지? → 기존 층위가 activate되고 난 후, 그 층위라면 기대될 모음길이. (조건부확률) 한국어에서도 층위에 따라 contrastiveness가 다른 사례가 존재하나? 그렇다면 실험을 할 수 있을 것이다.

음운이웃의 층위효과?

실증적으로 음운이웃개수가 어원적 층위에 따라 다르다 (Nam 2018). 그런데 어떠한 방식으로든 하위분류를 한다면 하위분류별로 음운이웃 개수는 다를 가능성이 높다. 지금 나에게는 소규모 어휘로 기계학습한 층위 (이하 subclass) 데이터가 있다. 이 subclass들은 어원적 층위와는 다르다. 그렇다면 subclass별로 음운이웃 개수를 구해서 음운이웃효과가 관측되는지 알 수 있지 않을까? 이것은 실험이 가능할지도 모른다. 왜냐하면, 이웃 많으면 retrieve 느리고 이웃 적으면 retrieve 빠르다. (이논문) (이 논문과 여기에 인용된 논문들) (참고로 그 유명한 Neighbourhood Activation Model은 perception에 관한 모델이다.) 이 관찰에 의존하여 다음과 같은 ..

subclassing 학습 2 어떻게 평가할 것인가

Subclassing에 대해서는 여기 저기 참고 subclassing이 가능하게 만드는 학습 2가지 학습으로 나누는 것에 대해서는 여기 참고 Artificial grammar learning experiment를 이용해서 층위 한정된 음운 작용의 학습이 가능하다고 말할 것이다. Artificial grammar learning experiments Coetzee 2009 Learning lexical indexation 논문에 나온 실험방법 James White의 2017년 논문에 나온 Saltation 실험방법, 그리고 Begus의 2019년 논문에 나온 실험방법 (p15부터) 참고할 수 있지 않을까?

lexical subclassing은 사실 '범주분류'와 '선택적(규칙)적용'의 두단계 학습

Moreton and Amano (1999)에 따르면 일본어에서는 같은 음향 신호가 있을때라도, 그것이 음소배열 상 '외래어 같은' 단어 속에 있으면 장모음으로 인식하고, 반대로 그것이 고유어나 한자어로 생각되는 단어 속에 있으면 단모음으로 인식한다. (Moreton, E., & Amano, S. (1999). Phonotactics in the perception of Japanese vowel length: evidence for long-distance dependencies.) 한국어에서도 어떤 단어가 한자어처럼 보이면 ㄹ뒤에 나오는 치경음을 경음화하고 그렇지 않으면 경음화하지 않는다. (그리고 내 블로그에 적었든 다른 작용들도 층위 의존적인 것들이 있다.) 이 언어현상을 곰곰이 생각해보면 2가지..

한국어 발음형을 계층적 클러스터링 해보자

한국어 어휘집(렉시콘)은 한자어/고유어/외래어로 통칭되는 층위, 내지는 하위단위를 가지고 있다. 놀랍게도 어떤 음운작용은 층위의존적이다. (관련글) 통상적으로 층위를 나누는 기준은 어원이다. 외국어에서 왔으면 외래어, 한자가 어원이면 한자어 등등. 그런데 조금만 생각해보면 조금 석연치 않은 부분이 있다. 한국인 부모의 자손으로 태어나면 어원정보를 UG로 탑재한 채 태어나는 것도 아니고, 대체 아기는 각 단어의 어원을 어떻게 '상고'해서 어떤 음운작용을 적용할지 말지를 결정하는 것일까? 특히 l-tensification처럼 한자어라면 반드시 적용되는 규칙은 어떻게 실수없이 적용하는 것일까? 또한 '바'라는 음가를 가진 한자는 없는데, 대학생들은 "분명 내가 모르는 어떤 한자는 음이 '바'일 것이다"라고 생..

한국어 층위의존 음운작용 stratum-sensitive phonological process

1. L-tensification 어떤 2음절어가 있는데 제1음절 종성이 /ㄹ/라고 하자. 그 2음절어가... 한자어로 인식되면: 2번째 음절 초성 stop sound를 경음화한다.고유어로 인식된다면 경음화하지 않는다. 신지영 교과서에서 캡처."... 이렇게 한자어 /ㄹ/ 뒤 경음화 현상은 한자어의 경우 음운론적 환경이 맞으면 무조건적으로 예외 없이 일어난다는 특징이 있다." (p.311) 와우! 무조건적이고 게다가 예외 없이 일어난다고? 오늘 내 생일이니?    이 교과서의 영어판인 Shin Kiaer Cha (2012) 에서는 p.203 (챕터 9.2.2)에서 언급된다. 또한 Kim-Renaud (1974) 하와이대 박사논문에서도 언급되어있다 (p. 171)그리고 규칙도 제시해놓았음.  이 현상은 그..

Split-phonology 용어정리와 접근법 제안

관련 이전글: 링크1 링크2 아예 "Emergent approach to lexical partitioning" 이런식으로 접근법을 틀어버리는 게 나을 것 같다는 생각이다. 1. 용어정리 (strata vs partitions) "고유어(즉, 순우리말/大和言葉 etc.) - 한자어 - 외래어" 라는 층위(Strata) 용어가 etymologically-based grouping에서 overused되었으므로 stratum 대신 partition을 사용하고, 따라서 고유어-한자어-외래어 대신 partition I, partition II, partition III ...을 사용하기로. 다시말해서, 이미주어진(어쩌면 학습자가 도달해야 하는 이상적인 상태?) 그룹들을 Strata라고 한다. Strata는 ety..

Split phonology 선행연구들 실타래 엮기

0. 이 포스팅은 split phonology 혹은 stratified phonology에 대한 선행연구들을 늘어놓은 이전 포스팅을 기초로 하여서 선행연구들을 실타래로 엮기 위해 작성하는 것임. 1. 펀치라인...? '모든 단어가 똑같진 않다' (not all words are created equal). 역사적으로 보았을 때, 단어들이 렉시콘에 유입된 시기에 따라 (etymological approach) 렉시콘의 단어들은 '층위'를 이루고있다. 놀라운 것은, 어휘의 어원이니 언제 유입되었느니 하는 역사를 모른 채 태어나는 (즉, diachronic/etymological knowledge에 접근할 수 없는) 언어습득자 (synchronic learner)도 층위 지식을 습득하여 사용한다는 것이다. 2..

Split-phonology hypothesis 혹은 Stratified lexicon

목차[SPE의 어휘 자질 접근. 프랑스어, foreign vs non-foreign, glide]일단 음운론의 고전부터 시작해보자 SPE. 불어에서 어종별로 glide의 자연부류가 다르다. non-foreign이라면 vowel과 자연부류를 이루고 foreign일 경우 liquid와 자연부류를 이룬다. (SPE pp. 353-354) [SPE의 어휘 자질 접근. 터키어 Turkish 러시아어 Russian] 영어 Germanic vs Latinate 문제도 그렇지만 터키어, 러시아어에서도 이런 층위문제가 나타난다. 궁극적으로 SPE가 취하는 입장은 [foreign] [native] 등의 lexical features를 상정하는 것이다. SPE p. 373     [SPE의 어휘 자질 접근으로 한국어 층위를..

반응형