Web Analytics Made Easy - Statcounter

2024/06 5

아주 가끔 빼박 규범주의적인 이유: 소통을 위해서

0. 요약"언어학자 너희들도 규범적이야"[링크]에서 이어지는 글입니다. (아마도?)  언어학자 너희들도 규범적이야0. 요약학부생이 수업 중 던진 질문에 우리 teaching team 모두가 깊은 생각에 빠졌던 일을 공유합니다. 때는 개론 수업 중에 규범주의와 기술주의에 대해 설명하는 부분이었습니다. '언어학은 기술linguisting.tistory.com 우리가 소위 '표준' 언어사용을 서로에게 강조할 때가 있는데 소통을 위해서입니다. 그럴 때에도 규범주의는 '글쓰기'에 한정됩니다. 목차 1. 흥미로운 코멘트다음 주에 열리는 큰 학회에서 발표하는 사람들을 위해 우리 과의 P-side 사람들끼리 예행연습을 했다. 학회에서처럼 발표를 하되 아는 사람들끼리 스파링(?)을 해보며 더 수정하거나 보강할 부분을 고..

카테고리 없음 2024.06.22

몸으로부터 자유로운 음운론

목차 1. 몸과 정신의 문제이론언어학의 제분야 중 음운론은 몸에 가장 가깝다. 음운론은 부정할 수 없는 "이미 주어진 환경"이 참 많다. speech chain을 상정하는 게 기본이지만 그렇지 않더라도 소리라는 음성학적(물리적, 음향학적) 실체를 결코 놓을 수 없다. 그러나 음운론의 궁극적 연구대상은 정신에 있다. 한번은 개론수업에서 한번은 음성학과 음운론의 차이를 묻는 질문에 '악보와 연주'의 비유를 든 적이 있다. 음운론은 composition, 음성학은 play라고 했다. 바흐나 비발디 등 바로크시대 작곡된 건반곡들은 합시코드로 연주될 수도 피아노로 연주될 수 있다. 건반곡의 composition은 음운론의 위치이고, 피아노로 연주하냐 합시코드로 연주하냐, 악보에 안 써있는 디테일을 어떻게 다루느냐..

생각나는대로 2024.06.18

transformer model attention weights 비교분석

목차 - 우당탕탕 이론언어학 연구자가 fairseq 입문한다- cross-attention 쉽게 접근하기- 신경망 이용한 음운론 연구 프로그램에서 이어지는 글입니다. 1. heatmap은 보기만 좋을 뿐Attention weights를 다 구하면 일단 아래와 같이 encoder-decoder cross attention weights 전체를, 각 layer와 각 head에 대해 heatmap으로 시각화할 수 있다.   위 그림은 의미가 없는 한국어 단어 "음월장"에 대하여 기계가 L-Tensification (ㄹ경음화)을 적용시켜 발음형을 "[음월짱]"이라고 도출해낸 이유를 설명하기 위한 heatmap이다. Output token 중 ㅉ에 해당하는 cc 부분을 보면, (c가 아니라) cc를 생성할 때 앞..

편견과 인종차별

0. 요약동아시아 출신에 대한 인종차별(Sinophobia)은 실제로 존재합니다. 당연히 수학을 잘할 거라고 전제한다거나 구두쇠일 거라고 전제한다는 등의 소소한 편견부터 직접적인 위협까지 있습니다. 목차   1. 소소한 편견의 사례들저는 박사과정 입시를 하던 당시 캐나다에 이미 체류하고 있었기 때문에 mailing address를 이미 캐나다 주소를 쓰고 있었습니다. 그럼에도 불구하고 처음 입학했던 당시에, 저로부터 특정 코멘트를 기대하는 것을 느낄 수 있었습니다. 예를들어, "와! 캐나다에 와서 컬처쇼크를 겪었어요!"라느니 "캐나다에 오니까 너무 좋아요!"라느니 하는 것들 말입니다. 캐나다도 한국 못지 않게 열등감이 있는지, 국제학생들로부터 (특히 미국에 비교하여) 캐나다가 좋다는 말을 듣고 싶어하나봅..

생각나는대로 2024.06.14

Hangul to IPA 업데이트 중 (완료함)

Hangul to IPA github repo를 팔로우 하는 사람은 눈치챘을지도 모르지만, 주말사이에 Hangul to IPA 에 대한 대대적인 업데이트를 했다. 핵심 기능은 파이썬으로 포팅을 다 마쳤고, 웹앱 인터페이스 구현할 일만 남았다.수정 (2024-06-10): 지금 해치워버리지 않으면 주중에는 도무지 못할 듯해 그냥 무리해서 인터페이스 구현과 deploy까지 끝마쳤다. 도파민 러시 상태에서 이제 자려고 함 (지금 여기 새벽3시)물론 documentation을 다 새로 써야하지만 일단 그건 천천히할 생각이다. 뭐 엄청 어려운 앱도 아니고 그냥 슥 보면 감 잡을 수 없겠나?ㅋㅋㅋ  거두절미하고, 기존 기능 외에 추가된 기능은 음소별로 구분자를 넣을 수 있다는 것이다. 아래 예시는 구분자로 "." ..