Web Analytics Made Easy - Statcounter
반응형

2024/04 7

언어학의 초심으로 돌아가기

0. 도입 및 요약지난 2024년 3월에는 미국언어학회(Linguistic Society of America)의 학회지 "Language"[링크]의 제 100권(volume)이 발간되었습니다. 1년에 1권(volume)이 나온다는 걸 생각하면 100주년이 된 것입니다. 이를 기념하기 위해 미국 구조주의 언어학의 아버지이자 LSA의 창립멤버였던 Leonard Bloomfield의 1925년 글 "Why a linguistic society?"(왜 언어학회를?)가 코멘터리와 함께 다시 게재되었습니다.[링크] 이번 포스팅에서는 Bloomfield의 "Why a linguistic society?"를 간단하게 번역/소개합니다. "Why a linguistic society?"는 저널 Language에 실린 첫번..

밤에도 불이 꺼지지 않는 랩

0. 요약밤산책을 하다가 불이 꺼지지 않은 건물을 보았습니다. 불현듯 불안해졌습니다. 이유는 무엇일까요? 아마도 일하고있지 않는다는 자각이 불안감으로 작용하는 것 같습니다. 목차 1. 악몽지도교수님과 몇 년동안 지속적으로 미팅을 하고 같이 일을 하게되면, 일 말고도 사적인 이야기를 많이 하게 됩니다. 제 지도교수님은 테뉴어를 받은지 몇년 되지 않으신 분이신데, 한번은 악몽을 꾼 이야기를 해주셨습니다. 꿈속에서 박사과정 시절로 돌아갔었는데, 꿈 속에서 너무 고통스러웠다고 합니다. 그래서 잠에서 깼는데, 순간 "아니 나 분명 졸업한 것 같은데 아니었나? 졸업한 게 꿈이었나?" 했었답니다.   이론언어학은 순수학문으로 분류되고, 박사학위를 따는 게 만렙 찍는 것입니다. 박사학위를 따서 공식적으로 언어학자 타이..

시험을 어렵게 만드는 요소

0. 도입 며칠 전 언어학 교양 수업 기말고사의 채점을 끝냈습니다. 지난 중간고사를 너무 잘 봐서, 아예 작정을 하고 시험을 어렵게 낼 수 있는 기회가 생겼었습니다. 그런데도 잘 보는 사람들은 잘 보네요. 마음대로 시험을 어렵게 내는 과정에서 고려했던 몇 가지 요소들이 있었습니다. 그 중에서 나름 효과가 있어보이는 (즉, 학생들이 실수하게 만드는) 요소들을 이 글에 정리해 놓습니다. 아마도 다음에도 어려운 시험을 낼 일이 생긴다면 이런 요소를 응용할 것 같습니다. 아예 "답을 모르겠다"까지가 아니더라도 "시간이 부족하다"라는 인상을 주어도 시험을 어렵게 만드는 데에는 좋은 것 같습니다. 목차 1. 불필요한 맥락을 너무 많이 넣는다. 문제풀이 자체를 위해서는 필요 없는 사회문화적 맥락을 과도하게 집어넣어서..

'어림짐작'으로 쉽게 말하는 사람들

0. 머리말 계산적(computational) 연구에는 반드시 기계 (컴퓨터) 가 사용됩니다. 컴퓨터의 사용은 대충보면 간편해보이는데 실제로는 간단하지 않습니다. 이 글은 언어학 연구에서 컴퓨팅 자원의 사용에 대한 '아무말대잔치'를 다룹니다. 목차 1. 소위 '좋은 시절' "요즘에는 개인 컴퓨터들 성능이 좋아서 본인 컴퓨터에서 결과 쉽게쉽게 나오니 참 좋겠어. 우리때는 데이터가 있어도 분석하려면 학교 컴퓨터 랩 예약해서 겨우겨우 시간 쫓겨가며 해야했는데.." 라고 선배 세대가 말하는 걸 보면 그냥 웃으며 아무 말 하지 않거나, 내 기분이 좀 좋으면 우쭈쭈해드리곤 한다. 2. 연구하려면 돈내세요 모델 하나를 쓰는데 구글 colab에서 100 compute unit이 소요되었다. 15불이다. 그 모델이 성공..

fairseq translation task cross-attention 접근 쉽게하기

.translate() method에 verbose parameter가 있다는 걸 간과했다. verbose = True 주니까 각 hypothesis 별로 아래와 같은 log가 터미널에 뿌려졌다. 2024-04-10 00:27:55 | INFO | fairseq.hub_utils | H-0.012383962981402874c i m a lZ cc v ngZ 2024-04-10 00:37:22 | INFO | fairseq.hub_utils | P-0.0000 -0.0000 -0.0001 -0.0000 -0.0000 -0.1113 -0.0000 -0.0000 -0.0000 beam = 5 였으므로 5개 후보형을 고려한다. 그래서 각 2줄, 총 10줄의 log가 떴다. 이 데이터는 이해하기 쉽다. 입력값 (..

학부 언어학 개론 수업에서 초청강연을 "또" 했습니다.

5년전에 이런 글을 올렸던 적이 있습니다. 2019.03.26 - [생각나는대로] - 학부 언어학 개론 수업에서 초청강연을 했습니다. 학부 언어학 개론 수업에서 초청강연을 했습니다. 학부에 개설된 Ling101에서 한국어를 소개했습니다. Ling101은 언어학과 이외의 타과생 대상으로 하는 교양 수업인데, 언어학 이론보다는 세계 언어의 여러 모습에 초점을 맞추는 과목입니다. 여기 linguisting.tistory.com 한바퀴 돌아서 5년만에 똑같은 과목인 LING101에서 강연을 했습니다. 이번에는 50분을 꽉 채워서 연구분야에 대해 이야기했네요. 올해는 박사과정생 4명이 각각 1시간씩 자신의 연구주제에 대해 교양수업 수강생들의 눈높이에 맞추어 강연했습니다. 총 2주의 기간 동안 일 주일에 2명 씩 ..

생각나는대로 2024.04.10

Never assume anything

실험데이터를 기계에 넣고 다 돌려버리는 것과 별개로, human touch가 들어가는 것이 필요하다. 예상치도 못한 변수가 있을 수 있기 때문이고 그 부분에서 이름 걸고 연구하는 사람이 확인을 하고 책임을 질 선택을 해야 하기 때문이다. 사람은 다양하다. 사람으로부터 얻는 데이터도 다양하다. 그래서 무엇도 당연히 생각하면 안된다. 상상을 초월하는 경우는 늘 있다. 예전에 토론토에서 운전하다가 교외에서 사고를 낸 적이 있다. 대인사고는 아니었는데, 차가 좀 망가져서 garage에서 견인차를 불러 수리를 맡겼다. 어짜피 garage가 토론토에 있었기 때문에 견인차 옆자리를 얻어타고 돌아가는데, 아저씨 운전석에 대문짝만하게 NEVER ASSUME ANYTHING이라고 써져있는 걸 봤다. "무엇도 당연하게 전제..

반응형