Web Analytics Made Easy - Statcounter

2024/05 12

한국어 수량사 사용의 어종

0. 요약[링크]에 나온 유튜브 공연 실황 중, 진행자가 현재 접속해있는 사람의 수 236을 표현하기 위해 "이백 삼십 육 분"이라고 했다가 어색함을 느끼고 "이백 삼십 육 명"으로 수정했습니다. 이 글에서는 한국어의 어종(고유어 vs 한자어)와 수량사 사용에 대해 포스팅합니다. 목차  1. 두 종류의 숫자 체계한국어에는 일(一), 이(二), 삼(三)... 으로 이어지는 한자어 기반 숫자 체계와 한, 둘, 셋... 으로 이어지는 고유어 숫자 체계가 있다. '분', '시', '명' 과 같은 수량사와 함께 쓸 때에는 두 시스템 중에 무엇을 써야 하는지가 비교적 엄밀하게 지정되어 있다.  예를 들어 나이를 말할 때가 있다. 한국어에서는 숫자에 이어서 '세'와 '살' 이렇게 두 가지 수량사를 쓰는데, 이때 한자..

신경망 이용한 음운론 연구 workflow (feat. Fairseq)

0. 요약그냥 제가 같은 작업 자꾸자꾸 반복하는 거 좀 체계화/단일화 하기 위해서 순서 정리하는 글이에요. "다른 사람은 어떻게 하나"를 알기가 힘들고, 특히 저와 같이 한국에서 명문대를 안 나온 사람일수록 다른 사람 연구 방법론을 귀동냥하기도 힘들어요 (오히려 그런 사람들이 더 많이 귀동냥을 해야 하는데도 말이죠). 그래서 이 글은 그런 사람들한테 도움이 되었으면 하는 바람에서 씁니다.   목차 1. 단계들1단계: 시작하기일단 찬물을 마셔서 정신을 차리고, 모든 걸 담을 수 있는(?) 폴더를 하나 만든다. 사람이 준비 안 되어 있으면 기계는 일하지 않는다. 폴더에는 일단은 raw data만 담아둔다. raw data라고 함은, 입력과 출력 쌍을 말한다. 예를 들어 한국어의 위치동화를 학습하는 모델을 만..