Web Analytics Made Easy - Statcounter
반응형

전체 글 223

폴더를 만드는 것으로부터 시작한다

0. 요약"이불부터 개라"처럼 "폴더부터 만들라"라는 교훈 겸 일상 글입니다.  목차 1. 몰타어 다시 시작몰타어 분석을 다시 시작했다. 몰타어 섹션을 아예 버리는 수준까지 고려했던 걸 생각하면 화려한 부활. Transformer model 학습데이터 추려내는 것이 이번주의 목표였는데 막상 하려니 막연하다. 그래서 폴더부터 만들었다. 모든 일은 폴더를 만들고 이름을 붙이는 것으로부터 시작한다.  - 오늘의 날짜와 뒤이어 Maltese- 그리고 그 안에 몰타어 데이터베이스인 Ġabra 덤프파일을 다시 받았다. 월초마다 그쪽에서 자동 덤핑을 하는데 마침 8월. 이렇게 하고 나니 당장 해야할 일이 명확해졌다. 일단 Mifsud (1995)의 단어목록을 디지털화하는 것이다. 2. 다시 내 질문으로 돌아가기궁극적..

생각나는대로 2024.08.03

한달만에 논문 실적 만들어드립니다

https://korea.inha.ac.kr/sites/inhakorea/upfiles/tb_kor_study/58/11.pdf4명 발화 분석.wavesurfer로 폐쇄구간과 마찰구간 길이 측정기술통계만 가지고 "평균차이 있으니 집단 간 차이 있다"는 결론. 61%와 65%는 "거의 동일한 발음 양상"[sic] 심지어 기술통계도 평균값만 보고함 (분산조차 보고안함).  한국어 음운론 연구자 치고 성문자질(laryngeal features)에 대한 의견 하나 없는 사람 드물테고, 나 역시 내용면에서 할말이 있지만 접어두고, 형식면에서도, 어중 격음/경음이 어떤 특징이 나타난다고 말하려면 당연히 baseline으로 평음을 비교해야 하는것 아닌가? 만약 성문자질 전공이 아니더라도, 논문 쓰면서 선행연구를 한 ..

생각나는대로 2024.07.30

친족명사 의미 내부 구조 있나?

0. 요약"아빠, 엄마, 누나, 언니, 오빠" 같은 친족명사들 가운데 어떤 것들은 사실 등급성 형용사이거나 혹은 명사내부구조가 있는 것 같습니다. 목차 1. "내가 너무 누나"갑자기 어디서 접한 데이터인데 이런 대화쌍이 있었다. A: "누나, 오늘 너무 고마웠습니다."B: "누나라기엔 내가 너무 누나인데?" "너무 누나"라는 표현의 의미는, 내 직관 상, "내가 너보다 나이가 너무 많다"인 듯하다. 혹은 대화맥락 상으로는, 누나-동생과 같은 호칭은 나이 터울이 일정정도 나는 한도내에서 사용되는 게 일반적인데, A가 나이많은 나에게 누나라고 부르니 놀랍다 정도를 의도했을 수도 있다. 비슷한 용례가 또 있다.2020년 예능 '놀면뭐하니'에 나온 장면인데, 김종민이 엄정화를 좋아했지만 "너무 누나라서" 좋아한..

용언 사귀다의 어휘상(lexical aspect)이 변했나?

0. 요약아래 웹툰에서 나온 "사귀다"의 용례에 대한 글입니다. 위 용례에서 '사귀다'는 행위의 완성 지점(도착점)이 존재하는 [+telic] 자질을 가지는 듯한데, 이것은 저의 직관 상 어색합니다. 언어변화의 일부일 수도 있고, 아니면 제 직관이 오염된 것일 수도 있습니다.     목차 1. 어휘상 (lexical aspects)용언의 의미론에서 어휘상 (Aktionsarten 혹은 lexical aspects)은 흔히 동사가 지칭하는 행동의 시간적 특징을 분류한 것이다. 통상적으로 4+1가지로 분류하고, 양극값을 가지는 자질(binary features)로는 [telic], [duration]을 이용해 기술할 수 있다.  한국어 용언과 함께 예시하자면 아래와 같다. 명칭자질명세한국어 예시States[..

Gen Z가 바라보는 우리 세대

저는 Millennial인데, 항상 저와 제 친구 입장에서 Gen Z를 바라보면서 이런 저런 인상 (혹은 편견)을 이야기하곤 합니다. 그런데 반대로 Gen Z에 속하는 대학생들에게 우리 세대에 대한 인상을 물어봤습니다. Gen Z가 바라보는 Millennial의 특징이 몇 가지 있는 듯 했습니다. 불안정(insecure)하고, Gen Z의 유행을 따라하려고 과도하게 노력하는 것 같으면서도 이따금씩 옛날얘기를 한답니다. (한국식으로, "라떼는" 정도 되겠네요) 불안정하다는 게 무슨 의미냐고 elaborate해달라고 하니, 예컨대 세대구분에 민감하고 자기보다 윗 세대(Gen X), 아랫 세대(Gen Z)와 사소한 것이라고 자신들을 구분하려고 애쓰는 것이 안쓰러워 보인다고 합니다. 재미있게도 "Millenni..

생각나는대로 2024.07.10

아주 가끔 빼박 규범주의적인 이유: 소통을 위해서

0. 요약"언어학자 너희들도 규범적이야"[링크]에서 이어지는 글입니다. (아마도?)  언어학자 너희들도 규범적이야0. 요약학부생이 수업 중 던진 질문에 우리 teaching team 모두가 깊은 생각에 빠졌던 일을 공유합니다. 때는 개론 수업 중에 규범주의와 기술주의에 대해 설명하는 부분이었습니다. '언어학은 기술linguisting.tistory.com 우리가 소위 '표준' 언어사용을 서로에게 강조할 때가 있는데 소통을 위해서입니다. 그럴 때에도 규범주의는 '글쓰기'에 한정됩니다. 목차 1. 흥미로운 코멘트다음 주에 열리는 큰 학회에서 발표하는 사람들을 위해 우리 과의 P-side 사람들끼리 예행연습을 했다. 학회에서처럼 발표를 하되 아는 사람들끼리 스파링(?)을 해보며 더 수정하거나 보강할 부분을 고..

카테고리 없음 2024.06.22

몸으로부터 자유로운 음운론

목차 1. 몸과 정신의 문제이론언어학의 제분야 중 음운론은 몸에 가장 가깝다. 음운론은 부정할 수 없는 "이미 주어진 환경"이 참 많다. speech chain을 상정하는 게 기본이지만 그렇지 않더라도 소리라는 음성학적(물리적, 음향학적) 실체를 결코 놓을 수 없다. 그러나 음운론의 궁극적 연구대상은 정신에 있다. 한번은 개론수업에서 한번은 음성학과 음운론의 차이를 묻는 질문에 '악보와 연주'의 비유를 든 적이 있다. 음운론은 composition, 음성학은 play라고 했다. 바흐나 비발디 등 바로크시대 작곡된 건반곡들은 합시코드로 연주될 수도 피아노로 연주될 수 있다. 건반곡의 composition은 음운론의 위치이고, 피아노로 연주하냐 합시코드로 연주하냐, 악보에 안 써있는 디테일을 어떻게 다루느냐..

생각나는대로 2024.06.18

transformer model attention weights 비교분석

목차 - 우당탕탕 이론언어학 연구자가 fairseq 입문한다- cross-attention 쉽게 접근하기- 신경망 이용한 음운론 연구 프로그램에서 이어지는 글입니다. 1. heatmap은 보기만 좋을 뿐Attention weights를 다 구하면 일단 아래와 같이 encoder-decoder cross attention weights 전체를, 각 layer와 각 head에 대해 heatmap으로 시각화할 수 있다.   위 그림은 의미가 없는 한국어 단어 "음월장"에 대하여 기계가 L-Tensification (ㄹ경음화)을 적용시켜 발음형을 "[음월짱]"이라고 도출해낸 이유를 설명하기 위한 heatmap이다. Output token 중 ㅉ에 해당하는 cc 부분을 보면, (c가 아니라) cc를 생성할 때 앞..

편견과 인종차별

0. 요약동아시아 출신에 대한 인종차별(Sinophobia)은 실제로 존재합니다. 당연히 수학을 잘할 거라고 전제한다거나 구두쇠일 거라고 전제한다는 등의 소소한 편견부터 직접적인 위협까지 있습니다. 목차   1. 소소한 편견의 사례들저는 박사과정 입시를 하던 당시 캐나다에 이미 체류하고 있었기 때문에 mailing address를 이미 캐나다 주소를 쓰고 있었습니다. 그럼에도 불구하고 처음 입학했던 당시에, 저로부터 특정 코멘트를 기대하는 것을 느낄 수 있었습니다. 예를들어, "와! 캐나다에 와서 컬처쇼크를 겪었어요!"라느니 "캐나다에 오니까 너무 좋아요!"라느니 하는 것들 말입니다. 캐나다도 한국 못지 않게 열등감이 있는지, 국제학생들로부터 (특히 미국에 비교하여) 캐나다가 좋다는 말을 듣고 싶어하나봅..

생각나는대로 2024.06.14

Hangul to IPA 업데이트 중 (완료함)

Hangul to IPA github repo를 팔로우 하는 사람은 눈치챘을지도 모르지만, 주말사이에 Hangul to IPA 에 대한 대대적인 업데이트를 했다. 핵심 기능은 파이썬으로 포팅을 다 마쳤고, 웹앱 인터페이스 구현할 일만 남았다.수정 (2024-06-10): 지금 해치워버리지 않으면 주중에는 도무지 못할 듯해 그냥 무리해서 인터페이스 구현과 deploy까지 끝마쳤다. 도파민 러시 상태에서 이제 자려고 함 (지금 여기 새벽3시)물론 documentation을 다 새로 써야하지만 일단 그건 천천히할 생각이다. 뭐 엄청 어려운 앱도 아니고 그냥 슥 보면 감 잡을 수 없겠나?ㅋㅋㅋ  거두절미하고, 기존 기능 외에 추가된 기능은 음소별로 구분자를 넣을 수 있다는 것이다. 아래 예시는 구분자로 "." ..

반응형