Web Analytics Made Easy - Statcounter

Bouncing ideas 생각 작업실 71

재밌는 부분첩어 partial reduplication 사례 저장소

0. 들어가는 말 제가 2018년 가을학기 즈음 텀페이퍼로 Hindi의 부분첩어를 분석한 논문을 쓴 적이 있었습니다. Echo compounding이라는 키워드로 불리는 현상이었는데, 일단 완전중첩(total reduplication) 이후 음소배열적 이유로 인해 중첩부위에 voiced bilabial fricative [β]가 삽입되거나 base initial consonant가 [β]로 교체되는 현상입니다. 현상에 대한 기술은 그 페이퍼에서 사용한 표로 갈음합니다. 표 상에 굵게표시 된 것이 base이고 그것이 중첩되어 suffixation되는 것으로 볼 수 있습니다. 발음형 [β]는 철자로는 v로 표기됩니다. 첫째, 둘째, 그리고 셋째줄은 매우 규칙적입니다. reduplicant의 첫 자리에 v를 ..

lexical subclassing 일단 쓰면서 생각하기.

현상적으로, 음운규칙의 선택적 적용 문제가 관찰됨. Schematically speaking, 언어 L에 속하는 음운형태적 환경이 동일한 단어 w1, w2이 있을 때, Grammar G의 일부인 특정 Phonological process P는 w1에만 적용되고 w2에는 적용되지 않는다. For example, 한국어의 층위 의존 작용들 그리고 다른 언어들에서의 사례(Michif 등)가 이 글의 하단부에 제시됨. 통상적으로 이것은 co-phonology, lexical strata, split-phonology 등으로 불렸음. SPE 이후 이 현상을 모델링하는 표준(?)적인 방식은 다음과 같음 (이 글의 첫 단락): Phonological process P에 대하여, morpheme μ 가 lexical ..

Phonological CorpusTools 용 한국어 코퍼스 (층위분류됨)

[설명]이 포스팅의 목적은 한국어 음운 코퍼스 (단어 발음형의 목록) 를 공유하는 것이다. 한국어 어휘들의 발음형 목록이 있다면 컴퓨터를 이용해서 다양한 양적 분석을 할 수 있다. 양적 분석은 다른 말로 "계량언어학적 분석"이라고도 하는데, 예를 들어서 아래와 같은 주제를 실증적인 방향성으로 연구하는 것을 말한다. 한국어 단어 발음형들의 목록인 '음운 코퍼스'는 이러한 연구를 위해 필수적이다. 모음 /i/ 앞에서 자음이 구개음화(palatalized)되기 쉬운데, 이 과정이 세대에 걸쳐서 중첩된다면 렉시콘 자체에 [구개음]-/i/ 연쇄가 많이 나타날 것으로 예측된다. 이 예측을 확인하기 위해, 실제로 한국어에 이러한 연쇄가 유의미하게 많은지를 보려면 한국어 어휘들의 발음형들 대상으로 음운 검색(phono..

Different contrastiveness by strata?

인식되는 층위에 따라 절대적 음향정보(모음지속시간)이 다른 모음길이로 인식된다. (Moreton and Amano 1999) 왜 일본어에서는 층위에 따라 모음길이 인식 차이가 나타나지? → 기존 층위가 activate되고 난 후, 그 층위라면 기대될 모음길이. (조건부확률) 한국어에서도 층위에 따라 contrastiveness가 다른 사례가 존재하나? 그렇다면 실험을 할 수 있을 것이다.

음운이웃의 층위효과?

실증적으로 음운이웃개수가 어원적 층위에 따라 다르다 (Nam 2018). 그런데 어떠한 방식으로든 하위분류를 한다면 하위분류별로 음운이웃 개수는 다를 가능성이 높다. 지금 나에게는 소규모 어휘로 기계학습한 층위 (이하 subclass) 데이터가 있다. 이 subclass들은 어원적 층위와는 다르다. 그렇다면 subclass별로 음운이웃 개수를 구해서 음운이웃효과가 관측되는지 알 수 있지 않을까? 이것은 실험이 가능할지도 모른다. 왜냐하면, 이웃 많으면 retrieve 느리고 이웃 적으면 retrieve 빠르다. (이논문) (이 논문과 여기에 인용된 논문들) (참고로 그 유명한 Neighbourhood Activation Model은 perception에 관한 모델이다.) 이 관찰에 의존하여 다음과 같은 ..

n-insertion and intrusive r

ㄴ삽입(n-insertion) 관련하여 선행연구를 읽다가 ㄴ삽입과 영국영어의 intrusive /ɹ/을 동일선상에 놓는 것을 발견했다. 이 글은 그것에 대해 메모한다. 본격적인 나열에 앞서 국민의례하는 심정으로 n-insertion 규칙의 formal notation과 어종별 양상 차이가 존재함을 제시해본다: /n/-insertion in Seoul Korean ∅ → [n] ⧸ C ] μ1 ______ μ2[ i/j "[n] is inserted at the juncture of two morphemes, M1 and M2, when M1 ends in a consonant and M2 begins in a high front vocoid /i j/ (Jun 2015: 419)" "두 형태소 사이에서 ..

컴퓨터로 읽을 수 있는 한국어 ㄴ삽입 (n-insertion) 실험결과

ㄴ삽입 (n-insertion)은 한국어의 흥미로운 음운 현상 중 하나이다. 형태론적인 작용들 뿐만 아니라 렉시콘 층위도 영향을 주기에 겉보기에는 gradient한 현상이다. 렉시콘 층위와 ㄴ삽입 관련하여서는 다른 글에서도 언급을 했었다. 이 포스팅 목적은 ㄴ삽입 현상과 관련한 선행 설문 연구결과 원자료를 csv 형식으로 제공하는 것이다. 전종호 교수님의 2015년 Phonology 논문(링크)와 2021년 Glossa 논문(링크)은 ㄴ삽입 현상을 연구했는데, 해당 논문들에서는 ㄴ삽입 관련 단어 설문 결과 원자료 3건이 언급된다. 그것들은 국립국어원 조사자료 2건 (최혜원 2002, 김선철 2003)과 더불어 국경아 등 2005이다. 이것들은 ㄴ삽입과 관련하여 어느정도 규모가 되는 3건의 설문 데이터이다..

subclassing 학습 2 어떻게 평가할 것인가

Subclassing에 대해서는 여기 저기 참고 subclassing이 가능하게 만드는 학습 2가지 학습으로 나누는 것에 대해서는 여기 참고 Artificial grammar learning experiment를 이용해서 층위 한정된 음운 작용의 학습이 가능하다고 말할 것이다. Artificial grammar learning experiments Coetzee 2009 Learning lexical indexation 논문에 나온 실험방법 James White의 2017년 논문에 나온 Saltation 실험방법, 그리고 Begus의 2019년 논문에 나온 실험방법 (p15부터) 참고할 수 있지 않을까?

lexical subclassing은 사실 '범주분류'와 '선택적(규칙)적용'의 두단계 학습

Moreton and Amano (1999)에 따르면 일본어에서는 같은 음향 신호가 있을때라도, 그것이 음소배열 상 '외래어 같은' 단어 속에 있으면 장모음으로 인식하고, 반대로 그것이 고유어나 한자어로 생각되는 단어 속에 있으면 단모음으로 인식한다. (Moreton, E., & Amano, S. (1999). Phonotactics in the perception of Japanese vowel length: evidence for long-distance dependencies.) 한국어에서도 어떤 단어가 한자어처럼 보이면 ㄹ뒤에 나오는 치경음을 경음화하고 그렇지 않으면 경음화하지 않는다. (그리고 내 블로그에 적었든 다른 작용들도 층위 의존적인 것들이 있다.) 이 언어현상을 곰곰이 생각해보면 2가지..

한국어 발음형을 계층적 클러스터링 해보자

한국어 어휘집(렉시콘)은 한자어/고유어/외래어로 통칭되는 층위, 내지는 하위단위를 가지고 있다. 놀랍게도 어떤 음운작용은 층위의존적이다. (관련글) 통상적으로 층위를 나누는 기준은 어원이다. 외국어에서 왔으면 외래어, 한자가 어원이면 한자어 등등. 그런데 조금만 생각해보면 조금 석연치 않은 부분이 있다. 한국인 부모의 자손으로 태어나면 어원정보를 UG로 탑재한 채 태어나는 것도 아니고, 대체 아기는 각 단어의 어원을 어떻게 '상고'해서 어떤 음운작용을 적용할지 말지를 결정하는 것일까? 특히 l-tensification처럼 한자어라면 반드시 적용되는 규칙은 어떻게 실수없이 적용하는 것일까? 또한 '바'라는 음가를 가진 한자는 없는데, 대학생들은 "분명 내가 모르는 어떤 한자는 음이 '바'일 것이다"라고 생..