Web Analytics Made Easy - Statcounter
반응형

생각나는대로 38

왜 앞말잇기는 어렵지? 연산과 인출에 관한 생각

연말연시 개인적으로 가지고 있던 화두는 연산과 인출의 구분에 대한 고민이었다. 형식주의 언어학의 큰 전제 중 하나는 연산부로서의 '문법'(grammar)과 저장부로서의 '어휘부'(lexicon)의 구분이다. 자연언어모델은 어휘부로부터 연산가능단위를 가져다가 문법(그것이 제약군이 되었건 규칙군이 되었건)으로 연산한다는 것이 큰 그림이다. 마치 컴퓨터가 RAM이나 HDD SSD등의 메모리에서 정보를 인출하여 CPU나 GPU로 연산을 하는 것과 동일한 모델이다. Chomsky (1981) 이후 아래와 같이 표준적인 Y-Model로 표현한다. 사람들은 무작위로 저장소에서 정보를 가져오는 것을 쉽고 재미있어한다. 저장소에서 정보를 가져오는 것을 '인출'이라고 한다. 인출을 정확하고 빠르게 하는 것은 재밌는 놀이가..

생각나는대로 2023.01.07

IPA 자동 전사 프로그램 후일담

0. https://linguisting.tistory.com/67 ← 이 글에서 소개한 Hangul to IPA 프로그램에 대한 후일담이다. 2주간 주말동안 살짝살짝 건드렸는데 이제 일단은 더 추가하고 싶은 기능은 없다. 오류가 발견된다거나 (높은 확률로 내가 쓰다가 오류를 발견할 가능성이 높음) 조금 리팩터링이 필요하다거나 하다면 그때 다시 코드를 열어볼 수는 있지만 일단 묻어둘 생각이다. 1. 사실 이것은 내가 석사때인 2016년에 짰던 R코드를 기초로 약간 손보고 웹 유저 인터페이스를 입힌 것이다. 그것은 형태론적으로 단순한 어휘목록에 음운규칙을 아주 단순히 (아주 SPE적인 수준에서) 적용하는 기계였다. 강범모 김흥규 2009 [책링크] 한국어 어휘목록을 집어넣으면 규칙적용형(논리적 표면형)이 ..

생각나는대로 2022.07.31

한글을 음성기호 IPA나 예일 Yale 로 자동 전사하기

0. 요약 저 자신의 편의를 위해서, 또한 아마도 다른 분들 중에도 필요하실 사람이 있을 것 같아서, 한글을 쓰면 IPA로 바꾸어주는 웹앱을 만들었습니다. "감기"를 넣으면 "[kɑŋɡi]"를 출력해요. 그리고 "분가" 넣으면 "[puŋɡɑ]"를 출력하죠. 저희 [puŋɡɑ]하겠습니다 링크는 아래와 같습니다. https://linguisting.tistory.com/84 더보기 2022-12-07 수정: 현재 heroku에서 무료 호스팅을 더 이상 제공하지 않아서 웹앱이 내려간 상태입니다. 대안은 아래와 같습니다. 1. 부산대 AI Lab에서 만든 '표준발음 변환기'를 이용해주세요. 2. 본 웹앱의 소스코드는 공개되어있으니 그것을 이용해주세요. https://github.com/stannam/hangul..

생각나는대로 2022.07.25

"봐봐"를 "봐바"로 발음하는 /w/탈락

0. 결론부터 '먹어!' -> '먹어봐' '가!' -> '가봐' '신어!' ->'신어봐' 인 것처럼 '봐!' 역시 '봐봐'가 맞는 표기이다. 그러나 '봐봐'는 흔히 '봐바' 혹은 '바바' 라고 발음되는데, 이것은 언어보편적인 관찰인 OCP에 따라 당연히 예측되는 것이다. 목차 1. 과거의 나에게 주는 선물 오늘 아침, 페이스북에 "ㅇ년전 오늘 포스팅"이라고 어떤 글이 올라왔다. 어떤 것이었냐하면, '봐봐'를 '봐바'로 발음하는 것에 관한 것이었다. 아마도, 내가 석사 나부랭이였을 때, 한국어에서 "봐" 라는 음절에서 /w/가 탈락해서 마치 "바"처럼 발음되는 것에 관심이 있었던 모양이었다. 그것이 성별이나 나이 등의 변인에 의해서 영향을 받는지 알고싶다는 포스팅이었다. 성별과 나이는 사회언어학적으로 자주..

생각나는대로 2022.02.15

수학처럼 딱딱 떨어지는 음운론

연구 대상으로 자연발화 코퍼스를 많이 본다. 당장 화자를 모집해서 실험하기 어려운 코로나 상황에서 자연발화 코퍼스는 큰 도움이 된다. 영어의 경우 당연히 오하이오 주립대에서 구축한 Buckeye Corpus [링크] 를 많이 보고, 일본어에도 Corpus of Spontaneous Japanese (CSJ) [링크]가 있다. 한국어에는 '서울 코퍼스'가 있다. 상당한 규모의 음성자료가 있어서 큰 힘이 된다. 더보기 참고로 국립국어원에서 제공하는 '모두의말뭉치'라는 사이트가 있기는 하지만, '실명인증'을 해야만 자료를 받을 수 있다. 즉, 나와 같은 해외 연구자의 경우 한국 핸드폰 번호가 없어서 접근이 안 된다. 일본어 코퍼스 자료인 CSJ의 사례를 따라서, 좀 더 개방적으로 개선했으면 좋겠다고 생각한다...

생각나는대로 2021.11.24

좀비의 차용

내 방송에 오는 사람 중 한글을 뗀 영어권화자가 한명 있다. 그저께는 "댄큐" 라길래 무슨말을 하고싶은건가 싶어서 물어보니 Thank you를 한글로 쓰고 싶었나보다. (이어서 th 발음을 어떻게 한글로 적는지에 대해 물어봤고, 나는 ㄸ을 말했고 동시에 다른 청자는 ㅆ을 말했다.) Thank의 기저형은 절대 tha[n]k 가 될 수 없다. 이것은 단일어이고 따라서 해당 비음이 조음위치동화가 되지 않은 상태로 출현하는 경우가 존재하지 않는다. 그렇다면 왜 한국어에서 thank you를 "댄큐"라고 쓸 것이라고 생각했을까. 아마도 철자의 영향일 것이다. 아니 그전에 애초에 어휘차용에서 출발어화자가 주체가 되는 것이 논리적으로 가능한가? 이런 생각을 해본적은 없었다. 말그대로 정의 상 차용은 도착어화자가 출발..

생각나는대로 2021.11.18

한국어에서 어순을 바꾸면 비문법적인 문장이 되는 경우

한국어는 교착어이기 때문에 어순이 상대적으로 자유롭다. 단어의 정의를 어떻게 하느냐에 따라 다르겠지만, 만약 단어를 의존형태소를 모두 붙인 형태 -- 즉, 흔히 일반인이 생각하는 '띄어쓰기로 나뉘어지는 단위' 정도로 생각한다면, 한국어는 단어의 순서를 바꾸어도 어지간하면 문법적인 문장이 된다. 그러나 반드시 그런 것은 아니다. 한국어에서 어순을 바꾸면 비문법적인 문장이 되는 경우들을 알아보자. 1. Scrambling word order 언어학적으로 한국어는 완전히 자유로운 어순(free word order)을 가진 언어는 아니고, scrambling 을 허용하는 어순을 가졌다고 본다. 가장 무표적인 어순은 예컨대 "철수가 영희에게 꽃을 준다"이다. 그러나 이 문장은 아래와 같이 뒤죽박죽 만들 수 있다...

생각나는대로 2021.05.18

'너무'의 polysemy 그리고 QR의 surfacing으로서의 prosodic patterning

prescriptivism에서는 '너무'가 준-부정극어(NPI)이기 때문에 부정적인 의미를 가진 표현에 쓰일때만 정문이라고 함. A. * 냄새가 너무 좋아. B. 냄새가 너무 지독해. 그러나 현대한국어에서 실제로는 A와 같은 문장이 문법적 문장이고 이 때 '너무'는 "참, 매우, 무척" 등과 동의어로 볼 수 있다. 즉, '너무'는 긍정의 정도성도, 부정의 정도성도 표현할 수 있음. 다시말해서 1. 민준이는 너무 양말을 좋아한다. 라는 문장은, 아래와 같은 두 가지 의미를 가짐. 1a. 민준이가 양말을 좋아하는 정도가 너무 심하다. (부정) 1b. 민준이가 양말을 무척 좋아한다. (긍정) 그러나 나의 직관으로, 이 '너무'에 억양강세를 주어서 아래 2. 와 같은 문장을 만들면, 부정의 뜻으로만 가능함. (..

생각나는대로 2021.05.08

5형식 영어문장 수형도 tree diagram 그리기

0. 머리말 이 글의 예상 독자는 영어학개론 혹은 통사론 입문을 듣는 학부생입니다. 영어문장의 5형식론은 엄밀한 분류는 아니지만 한국인 독자라면 친숙할 것이므로, 본 글에서도 5형식으로 목차를 만들어보았습니다. 아래 목록에서 원하시는 부분을 누르시면 됩니다. 혹은 "보어" 등으로 검색해도 됩니다. 이 글에서 소개하는 수형도를 보기 전에 몇가지 유념하실 것들이 있습니다. 아래 사항들을 꼭 읽어보세요. 첫째, 학부 개론 수준(X-bar schema, 문장=TP)의 수형도입니다. 저는 학부 개론 수업을 가르치면서 통사론을 다룹니다. 따라서 본 글에서도 학부 개론 수준에서 영어문장을 분석하고 수형도를 그릴 것입니다. 구문의 분석을 아주 철저하게 하는것은 매우 복잡하고, 학부 고학년 내지는 대학원에서 다룹니다. ..

생각나는대로 2021.04.24

영어학 학부 졸업논문 주제는 어떻게 정하지?

0. 요약 이 글의 대상 독자는 영어영문학과 학부 3-4학년생입니다. 즉, 통사론, 음운론이 뭔지 아는 수준의, 졸업논문이 고민인 사람들을 위한 글입니다. 학부논문을 위해서는, 기존에 수업에 배운 것에 대해 여러 논문들에서 어떻게 주장했는지를 정리하는 게 중심입니다. 그리고 선택사항으로 그 이론을 새로운 데이터에 적용해보세요! 데이터에 적용하는 것은 "여기에 적용해보았다" 만으로도 충분합니다. 정 주제를 모르겠으면, 저널이나 언어학 블로그에서 어슬렁거리면 좋은 주제를 잡을 수도 있습니다. 이 블로그도 언어학 블로그인데요, [학부수준 논문 주제 리스트] 등의 포스팅이 있습니다. 목차 1. 나는 왜 이 글을 쓰고 있는가 대학생들이 일반언어학으로 유입되는 큰 경로 중 하나는 영어영문학과에서 영어학을 접하면서인..

생각나는대로 2021.02.07
반응형