Web Analytics Made Easy - Statcounter

생각나는대로 84

만족할 만한 설명 그리고 전공자가 말하지 않는 이유

0. 요약어떤 게 '설명'으로 인정되는가에 대한 아주 짧은 단상입니다. 결국 설명보다 중요한 것은 어떤 질문을 할 수 있느냐가 아닐까요? 목차 1. 물고기와 불고기출처: https://www.threads.net/@tip_tip_tib/post/C-SY7VAvHn0아카이브: https://archive.is/vXMcO 유사한 기저형에 대하여 음운론적 형태론적 규칙이 선택적으로 적용(어떤건 적용 어떤건 안 적용)되는 경우를 비균일적(non-uniform) 언어규칙이라고 한다. 물고기는 경음화하는데 불고기는 안 한다. 젓가락의 ㅅ받침과 숟가락의 ㄷ받침은 발음이 [t]로 같은데 받침을 다르게 쓴다. 비빔밥은 경음화하는데, 볶음밥은 하지 않는다. 등등. 비균일적 언어규칙에 대한 형식주의적 전통적 설명은 구분자질..

생각나는대로 2024.08.06

폴더를 만드는 것으로부터 시작한다

0. 요약"이불부터 개라"처럼 "폴더부터 만들라"라는 교훈 겸 일상 글입니다.  목차 1. 몰타어 다시 시작몰타어 분석을 다시 시작했다. 몰타어 섹션을 아예 버리는 수준까지 고려했던 걸 생각하면 화려한 부활. Transformer model 학습데이터 추려내는 것이 이번주의 목표였는데 막상 하려니 막연하다. 그래서 폴더부터 만들었다. 모든 일은 폴더를 만들고 이름을 붙이는 것으로부터 시작한다.  - 오늘의 날짜와 뒤이어 Maltese- 그리고 그 안에 몰타어 데이터베이스인 Ġabra 덤프파일을 다시 받았다. 월초마다 그쪽에서 자동 덤핑을 하는데 마침 8월. 이렇게 하고 나니 당장 해야할 일이 명확해졌다. 일단 Mifsud (1995)의 단어목록을 디지털화하는 것이다. 2. 다시 내 질문으로 돌아가기궁극적..

생각나는대로 2024.08.03

한달만에 논문 실적 만들어드립니다

https://korea.inha.ac.kr/sites/inhakorea/upfiles/tb_kor_study/58/11.pdf4명 발화 분석.wavesurfer로 폐쇄구간과 마찰구간 길이 측정기술통계만 가지고 "평균차이 있으니 집단 간 차이 있다"는 결론. 61%와 65%는 "거의 동일한 발음 양상"[sic] 심지어 기술통계도 평균값만 보고함 (분산조차 보고안함).  한국어 음운론 연구자 치고 성문자질(laryngeal features)에 대한 의견 하나 없는 사람 드물테고, 나 역시 내용면에서 할말이 있지만 접어두고, 형식면에서도, 어중 격음/경음이 어떤 특징이 나타난다고 말하려면 당연히 baseline으로 평음을 비교해야 하는것 아닌가? 만약 성문자질 전공이 아니더라도, 논문 쓰면서 선행연구를 한 ..

생각나는대로 2024.07.30

Gen Z가 바라보는 우리 세대

저는 Millennial인데, 항상 저와 제 친구 입장에서 Gen Z를 바라보면서 이런 저런 인상 (혹은 편견)을 이야기하곤 합니다. 그런데 반대로 Gen Z에 속하는 대학생들에게 우리 세대에 대한 인상을 물어봤습니다. Gen Z가 바라보는 Millennial의 특징이 몇 가지 있는 듯 했습니다. 불안정(insecure)하고, Gen Z의 유행을 따라하려고 과도하게 노력하는 것 같으면서도 이따금씩 옛날얘기를 한답니다. (한국식으로, "라떼는" 정도 되겠네요) 불안정하다는 게 무슨 의미냐고 elaborate해달라고 하니, 예컨대 세대구분에 민감하고 자기보다 윗 세대(Gen X), 아랫 세대(Gen Z)와 사소한 것이라고 자신들을 구분하려고 애쓰는 것이 안쓰러워 보인다고 합니다. 재미있게도 "Millenni..

생각나는대로 2024.07.10

몸으로부터 자유로운 음운론

목차 1. 몸과 정신의 문제이론언어학의 제분야 중 음운론은 몸에 가장 가깝다. 음운론은 부정할 수 없는 "이미 주어진 환경"이 참 많다. speech chain을 상정하는 게 기본이지만 그렇지 않더라도 소리라는 음성학적(물리적, 음향학적) 실체를 결코 놓을 수 없다. 그러나 음운론의 궁극적 연구대상은 정신에 있다. 한번은 개론수업에서 한번은 음성학과 음운론의 차이를 묻는 질문에 '악보와 연주'의 비유를 든 적이 있다. 음운론은 composition, 음성학은 play라고 했다. 바흐나 비발디 등 바로크시대 작곡된 건반곡들은 합시코드로 연주될 수도 피아노로 연주될 수 있다. 건반곡의 composition은 음운론의 위치이고, 피아노로 연주하냐 합시코드로 연주하냐, 악보에 안 써있는 디테일을 어떻게 다루느냐..

생각나는대로 2024.06.18

편견과 인종차별

0. 요약동아시아 출신에 대한 인종차별(Sinophobia)은 실제로 존재합니다. 당연히 수학을 잘할 거라고 전제한다거나 구두쇠일 거라고 전제한다는 등의 소소한 편견부터 직접적인 위협까지 있습니다. 목차   1. 소소한 편견의 사례들저는 박사과정 입시를 하던 당시 캐나다에 이미 체류하고 있었기 때문에 mailing address를 이미 캐나다 주소를 쓰고 있었습니다. 그럼에도 불구하고 처음 입학했던 당시에, 저로부터 특정 코멘트를 기대하는 것을 느낄 수 있었습니다. 예를들어, "와! 캐나다에 와서 컬처쇼크를 겪었어요!"라느니 "캐나다에 오니까 너무 좋아요!"라느니 하는 것들 말입니다. 캐나다도 한국 못지 않게 열등감이 있는지, 국제학생들로부터 (특히 미국에 비교하여) 캐나다가 좋다는 말을 듣고 싶어하나봅..

생각나는대로 2024.06.14

R로 비-ASCII 문자처리 답답해 😠

Hangul to IPA 이슈: 북한을 [pukɑn]으로 잘못 전사한다.  디버깅을 하려고 시도하는데 진짜 정신나갈 것 같다. R은 그저 숫자를 통계처리할 때만 쓰기 때문에 RStudio 없이 그냥 통상적인 IDE에서 R plugin 통해 쓰는데, 문자열 처리가 진짜 고통스럽다. 이 기회에 아예 파이썬으로 포팅해버리고 싶다. 솔직히 말해서 디버깅하는 시간보다 새로 파이썬으로 다시 짜는 게 더 빠를 지경이다. 만약 Hangul to IPA 를 파이썬으로 다시 한다면 "둘뚤툴"(실시간으로 한국어 최소대립쌍 산출)처럼 좀더 아동틱(?)하거나 모바일 친화적인 UI를 만들까 하는 생각이 있다. (하지만 귀찮아서 안하겠지)  파이썬처럼 UTF-8 기본으로 딱 정리되어 있으면 세상 편할텐데 R에서 문자열 처리할 때 ..

생각나는대로 2024.05.09

20대 발화에서 인류 일류 구별

0. 요약이것저것 아주 겉핥기 글입니다.👅 수집한 발화 데이터를 보다가, 토픽과는 관련없는데, 비실험단어(filler)에 포함한 '인류,' '일류' 이 두 단어를 20대 실험참가자들이 한 명도 빠짐없이 구별해서 발음하는 것을 발견했습니다. 표준발음에서 이 두 단어는 구분이 안 되고 모두 [일류]로 발음됩니다. 이러한 발음차이는 아주 교과서적인 최적성이론 제약서열(constraint ranking)의 예시인 것처럼 보여서 핥핥하는 글을 씁니다. 최적성이론(OT)적으로 설명하는 걸 스스로 연습하는 글? 정도입니다. 진지한 글 아니에요.  이 글을 다 쓰고 (답안지 찾아보는 기분으로) 선행연구를 찾아보았습니다. 박선우 교수님의 논문 추천합니다. 박선우 (2006) 목차    1. '인류'와 '일류'표준 발음..

생각나는대로 2024.05.08

딥러닝 한국어 음운부를 구경해보세요

0. 들어가는 말 + 결론(이 글은 'JKDY' 테스트 돌리기 + 배포🎉에서 이어집니다.)고기도 먹어본 사람이 찾아먹는다는 속담이 있습니다. 음운론에 딥러닝이 왜 필요한지 실감이 안 될 사람을 한 명이라도 설득하기 위해, 아니 애초에 딥러닝이라면 일단 겁나고 무서운 사람 한 명의 마음을 돌리기 위해 JKDY를 쉽게 사용할 수 있는 방법을 고민해보았습니다. JKDY의 쓸모가 무엇이 되었건, 일단 가지고 놀게 할 수 있는 방법이 있으면 좋을 것 같습니다. 왜냐하면 본인의 입력에 따라 (맞건 틀리건) 즉각적 반응이 나타날 때 인간의 호기심이 가장 동한다고 생각하기 때문입니다.  그 고민의 결과가 구글 Colab을 통한 notebook 배포입니다. 이 링크 를 이용하면 JKDY를 부담없이 쓸 수 있습니다.ht..

생각나는대로 2024.05.07

이젠 하다하다 🤣🤣🤣

https://chat.openai.com/share/b66a80f1-452d-4148-95c1-e89a3c23bea1 ChatGPTA conversational AI system that listens, learns, and challengeschat.openai.com(링크 클릭하기 꺼려지는 사람들을 위해 전체 내용이 포스팅 하단에 있습니다) GPT 괴롭히기 재밌네요. 돈내도 시간당 일정 quota 넘으면 GPT4 못쓰던데, 이렇게 된 바에야 쉴때도 GPT 써야겠어요.ㅋㅋㅋ   질문자왓 더즈 gpt 스탠드 포?ChatGPT GPT는 "Generative Pre-trained Transformer"의 약자로, 트랜스포머(Transformer)라는 딥러닝 아키텍처를 기반으로 한 사전 훈련된 생성 모델을 ..

생각나는대로 2024.05.02