Web Analytics Made Easy - Statcounter
반응형

분류 전체보기 161

수집데이터의 물리적 저장

연구를 위해 수집한 채록 데이터(음성파일 + 응답지 조사 결과)가 계륵이다. 다른 프로젝트에서 정해진 프로토콜에 따라 '수집자'의 자격으로 일만 하고 이후 과정을 신경쓰지 않았을 때에는 몰랐는데, 수집 후가 정말 골치아프다. 수집하는 과정보다 결과물들을 물리적으로 저장하는 방식이 더 골치아프다. 우선 피실험자 개개인별로 본인에게서 나온 데이터의 공개범위를 다르게 지정해놓았기 때문에, 아예 따로 저장해놓아야 한다. 또 이유는 모르겠지만, 수집 데이터가 캐나다 영토 내에 물리적으로 존재하는 서버에 저장되어야 한댄다. 진짜로 인터넷 연결 안된 학교 교내 서버에 박아놓고 옛날 도서관마냥 열람하는 방식을 심각하게 고민하고 있다. 진심으로 날것의 데이터를 사랑해야 하나보다. 근데 졸업하고 내가 학교를 떠나게 되면,..

학부생들과의 의사소통 문제

답답해서 쓰는 포스팅. 당연하지만 Teaching team이 학부생들의 이메일 주소나 전화번호나 연락처를 아는 것은 불가능하다. 이메일 주소 직접 사용을 금지하고 철저히 강의 플랫폼(canvas)을 통해 연락을 하도록 한 것이 거진 5-6년 됐을 것이다. 그러나 궁극적으로 강의 플랫폼도 학생 이메일 주소로 메시지를 전달할 뿐 IG나 왓츠앱 등 메시징 서비스로 전달하지 않는다. 학생들은 이메일을 쓰지 않는데, 학부 수업의 표준 소통방식은 이메일이라는 점은 심각한 문제다. 우리 세대는 당연히 이메일이나 전화번호를 공유하고 연락하였고, .edu 로 끝나는 소위 '학교 이메일'을 사용해서 연구자 간 연락을 주고받는 것이 업계표준이다. 반면 Gen Z들은 전화번호는 물론 이메일 공개도 꺼린다. 심지어 학업 목적으..

음운론 전공의 카멜레온 같은 위치

제가 S-side 전공자들 사이에서는 '기술전문가'(tech-savvy)스럽고 엄청 꼼꼼한 엔지니어 스타일로 인식되지만 음성학자들이랑 대화하면 엉성하고 추상적이고 이론적인 사람으로 인식되는 것 같습니다. 음운론 전공자들 사이 일반적인 특징인지 아니면 그냥 제가 그런건지 잘 모르겠습니다. 🤣🤣 얼마전 S-side (통사론 의미론 화용론) 박사과정생들이랑 포닥 사이에서 밥 먹은 적이 있었는데, 저만 P-side였어요. (S-side 전공자들 사이에서 밥먹는 음운론자 실황) S-side 전공자들 사이에서 밥먹는 음운론자 실황 근데 그분들이 저를 바라보는 느낌이 약간... 제가 음성학자들 바라보는 느낌인가봅니다.ㅋㅋㅋ 구체적이고, 체계화되어있고(organized).. 막 엄청 기계랑 도구를 세련되게 사용하는 엔..

인명 Alasdair의 음절화

0. 요약 저의 지인 중에 이름이 Alasdair인 어른이 계신데, 이름 철자를 처음 보면서 -ter 가 아니라 -dair 이라서 깜짝 놀랐습니다. 왜냐하면 저는 여태껏 그 이름을 부르면서 [æ . lə . stɹ̩] 로 음절화했기 때문입니다. 그런데 철자의 를 충실히 살린다고 전제한다면 sd 연쇄를 음절초성으로 둘 수 없으므로 [æ . ləs . dɹ̩] 로 음절화되는 것이 타당합니다. 이 글에서는 영어에서 /s/뒤 환경에서 폐쇄음(stop)의 후두자질이 중화되는 상황에서 음절화 문제를 생각해봅니다. 목차 1. Alasdair Alasdair는 영어권에서 흔한 이름은 아니지만 남녀 공히 흔하게 쓰이는 이름인 Alex와 유래가 같습니다. 두 이름 모두 그리스어 '알렉산드로스(Ἀλέξανδρος)'에서 유..

Fairseq transformer model에서 attention 뽑아내기

0. 요약 이 포스팅은 Fairseq을 이용해 train한 transformer model에서 attention weights를 뽑아내기 위한 노력의 과정을 기술한다. 목차 1. 이슈 Fairseq이 attention weights를 순순히 내놓지 않는다. 선전포고다! 우선 왜 attention weights를 뽑아내야 하는지에 대한 맥락부터 서술하고 시도해본 해결책 + 과정을 섹션 4부터 설명한다. 3. 맥락 Fairseq model이 꽤나 괜찮은 성능을 보였다. (Fairseq입문) (IPA변환기) 이론가로서 나에게 중요한 건 모델의 성능 그자체는 아니다. 촘스키가 말했듯 언어학은 "engineered solution"이 아니라 "real solution"이 필요하다. 답은 나왔다. 엔지니어는 답을 ..

이론 음운론

0. 들어가는 말 제 블로그에 용어집 카테고리를 두면서, 거기에 (이론) 음운론이 뭐하는 건지가 빠지면 이상하겠죠. 하지만 음운론에 대해 쓰려면 두꺼운 책 한권이 부족할 것입니다. (전상범 교수님의 "음운론"이 1,000페이지 가량 돼요[책링크] ) 고작 블로그 포스팅 하나로 모두 훑는 건 언감생심, 감히 생각도 못할 일이기 때문에, 제 깜냥에 맞게 글을 쓰기로 했습니다. 이 글에서는 수학처럼 딱딱 떨어진다고 알려져있는 음운론에서 전통적으로 관심갖는 언어현상들에 대해 소개합니다. (이론) 음운론이 뭐하는 건가 정도 흐릿하게 감 잡으시면 좋겠어요. 한국어 용어는 전상범 교수님의 용어번역을 대체로 가져와서 썼습니다. 작성중인 글입니다. 목차 1. 현상이 우선 어떠한 학문 분야든 '과학'이라면 그것이 설명하고..

용어집 2024.03.04

segment harmony 와 binding

아래 두 문장에서 it의 reference가 다르다. a.에서 it은 the street 이지만 b. 에서는 the cat이다. a. The cat did not cross the street because it was too busy. b. The cat did not cross the street because it was too tired. 통사론에서의 정확한 용어가 어떤지 모르겠지만, it이 문장 상 앞의 nominal 중 하나에 bound되기 때문에 가볍게 binding이라고 하자. segment harmony는 Consonant Harmony와 Vowel Harmony를 통칭하여 일컫는 말이다. Harmony는 매우 많이 연구되었는데, 서아프리카 언어들의 ATR 조화, 중세한국어의 양성/음성 ..

내가 준 과자를 TA가 안 먹는 이유

0. 요약 TA는 교수와 학생 사이의 중간 역할을 하고 학생들과 직접 대면합니다. TA에게 먹을 걸 주는 학생들이 간혹 있는데, TA들은 절대로 받지 않습니다. 대부분 감사의 의미로 혹은 친해지고 싶어서 선의로 주는 것이겠지만, 악의적으로 이용하는 학생들도 있기 때문입니다. 이 글에서는 TA가 학생들에게 고통받는 경우를 소개합니다. 목차 1. 만만한 화풀이 대상 교육조교(TA)는 학생들과 가까운 위치이지만, 실질적으로 모든 평가를 합니다. 과목에 따라 TA들이 시험문제를 내는 경우도 있습니다. 학생들의 입장에서는 TA들에 대한 내적 친밀감을 쌓는 경우가 많습니다. 아주 전형적인 유사관계(parasocial relationship)에 해당합니다. 왜냐하면, 학생들은 교수보다 TA를 더 자주보고, TA가 교..

'JKDY' 테스트 돌리기 + 배포🎉

0. 들어가는 말 (이 글은 2024.02.19 - 좌충우돌 딥러닝을 이용한 한글IPA변환기 에서 이어지는 글입니다.) 구어체로 느슨하게 전사하는 프로그램을 완성하기는 했는데, 욕심이 나서 UI를 입혔다. 챗GPT 시키니 금세 되니 좋다. 비록 자잘한 오류가 많아서 '내가 못하는 새로운 일'을 시킬 수는 없지만, 할줄 아는데 귀찮은 것은 챗GPT 시켜서 초벌로 해놓고 나온 결과를 직접 수정하니 편리하다. 앱의 이름은 JKDY로 정했다. 이 프로그램이 "좋거든요"를 전사하면 조커등여 [tɕ o kh ʌ t ɯ ŋ jʌ] 라고 나오는데 약자를 따와 JKDY라고 한 것이다. 목차 1. 조커등여 새로 만든 장난감(?) 가지고 놀다가 대체 내가 무슨 괴물을 만든 건가 생각이 들었다.ㅋㅋㅋ 무슨일이냐 하면 바로 이..

반응형