Web Analytics Made Easy - Statcounter
반응형

생각나는대로 71

2025년부터 어떻게 서비스할건가 고민

난 컴퓨터 전공도 아니고 따로 공부를 깊게한 것도 아니다. 나는 연구할 때 귀찮은 것들 해주는 툴들을 그냥 파이썬으로 코딩하고, 그중 일부는 다른사람들도 편하게 쓰라고 Flask 웹앱으로 만들고 Heroku에 올려서 서비스한다. 옛날에 배운 pipeline이다. 최적이 아닌 걸 안다. 근데 Hangul-to-ipa 같은 경우는 트래픽이 좀 나오고 korean-auto-glossing은 쓰는 사람 별로 없어도 리소스 배정을 잘못해서 두 사람이 쓰면 죽어버리거나 살살 잘 사용하면 비용 많이 든다. 땅파면 돈나오는 게 아니기 때문에 청구서가 날라오면 내 주머니에서 (정확히는 계좌에서) 돈이 나간다.  그냥 눈 딱감고 매달 청구서 못본척해왔는데, 이게 1년치 쌓아놓고 보니까, 앞으로도 계속 이렇게 하는 건 지속..

생각나는대로 2024.12.15

커리큘럼 단상: 데이터 읽기 그 자체

학기말이 되고 채점을 하고 있으면 커리큘럼 그 자체에 대한 생각을 많이하게 된다. 우리과는 커리큘럼 상 P-side 과목이 5개나 존재하고 (그것도 사회언어학, acquisition 등 periphery 말고 순수 이론과목만 고려해도), 그걸 음운론이랑 음성학이 2:3 내지는 2.5:2.5로 잘 갈라먹는 상황이다. 이렇게 과목이 많은데 1개 과목 혹은 0.5개 과목은 "데이터 읽는 방법"과 "일반화하고 그걸 글로 쓰는 방법"에만 할애하는 게 어떨까 싶은 생각이다. 모르겠다. 이론은 그냥 배우고 적용하고 하는 것이라 technic인데, 언어데이터를 어떻게 봐야 하는지는 사실 art인 것같다. 둘다 기술이다. 후자의 art 기술은 수업에서 흔히 '전제되는' 듯하고 다루지 않는데 조금 문제인 것같다. 왜냐하면..

생각나는대로 2024.12.11

자괴감들고 괴로워

오블완이니 뭐니 생 지랄을 하더니 고작 이게 끝.심지어 이모티콘 파일명도 성의없이 001, 002, 003, ... 020 라서, 그냥 참여 안해도 https://t1.daumcdn.net/keditor/emoticon/challenge/large/[숫자].png로 쓸수있음. 위에 표도 ChatGPT 시켜서 저 url template에 숫자 자리에 0부터 20까지 넣어서 표 만들라고 해서 만든거임. 티스토리는 정말 자신들이 뭐가 문제인지 전혀 모르고 있구나.수많은 영양가없는 글들과 광고댓글들을 쳐낼 생각은 없고 그냥 연내에 마케팅 예산 소진하기 위해서 뻘짓하는데 여념없네.ㅋㅋㅋ 오블완이니, 짜고치는 경품 돌리기니, 생색내기용 '와 이거 이모티콘 아무나 안주는 건데 참가했으니 드립니다'(팩트 그냥 아무나 ..

생각나는대로 2024.12.09

너 나를 선생대접 하겠느냐

한성우 교수님 경향신문 칼럼을 재밌게 읽었다. 그냥 메모.https://www.khan.co.kr/article/202412042032005 [한성우의 말과 글의 풍경]알면 알수록 어려운 ‘띄어쓰기’…규정보다 소통이 먼저다아버지는 가방에 들어가지 않는다. 고속도로를 달리다 동시에 흥분할 지점을 지날 일도 없다. 서울에 시어머니들로만 구성된 합창단이 있을 리가 없고, 안동 사람들이 시체 육회를 먹을 거라고www.khan.co.kr 1. 띄어쓰기 없어도 문맥만으로 파악이 가능할 수도 있을까? 같은 논리를 말소리에 적용하면, 억양없이 그냥 모든 음절을 같은 속도와 톤으로 읽어도 문맥으로 의미전달이 된다고도 할 것이다. 당연하지만, 음운단위에 따라 높낮이도 다르고 휴지도 둔다. 띄어쓰기도 같은 방향이어야 한다고..

생각나는대로 2024.12.07

한국어 코퍼스에서 '이미'와 '벌써'의 차이

계산을 잘못해서 오블완 마지막날이 어제인지 알았지 뭡니까. 그래서 무안하게 어제 '완결'을 내버렸는데, 사실 글 하나를 더 써야한다고 합니다. 새로 쓸 글은 없고, 다른 채널에 썼던 4년묵은 글을 거의 그래도 올립니다. 아래 그림은 물결21 코퍼스 자료에서 나타난 '이미'와 '벌써'의 공기어 차이다. "이미"랑 많이 쓰이는 단어와 "벌써"랑 많이 쓰이는 단어가 다소 다르다.  명사 "상태"는 거의 독점적으로 "이미"하고만 쓰인다. 예컨대 "이미 ______한 상태" 와 같은 구문으로 사용되는 것이다. 반면, 높은 비중으로 "벌써"하고만 쓰이는 단어는 별로 없는 것같다. 다시 말하자면, 문법성과 무관하게 언어의 사용측면에서 문장 내에서 "벌써"는 많은 경우 "이미"로 바꿔쓸 수 있으나, "이미"는 그렇지 ..

생각나는대로 2024.11.27

학부생의 질문 '직관'은 딱 거기까지만

학부 음운론 수업에서 음절화(syllabification) 수업을 하다가 "내 직관은 안그런데요?" 하는 질문을 받았다. 우선, 맥락을 명확하기 하기 위해 학생들이 가지고 있는 배경지식을 설명하자면 다음과 같다. 전통적으로 음절 나누는 개념을 이해시키기 위해 '박수치기' 혹은 'tapping하기' 등의 수단을 사용한다. 예를 들면 아래와 같다. cal👏  li👏  for👏  nia👏ste👏 reo👏 ty👏 ping👏lin👏 gui👏 sting👏  얼추 중고등학교 때 이런 연습을 하기 때문에 대부분의 학생들은 음절 개념 자체에는 익숙하다. 다만 문제는 박수치기나 tapping이 모국어화자 자신의 직관에서 나온다는 것이다. 직관은 오염될 수 있다. 그래서 연구자가 본인의 직관을 연구대상으..

생각나는대로 2024.11.25

[실험은 어려워] 10. 논의하기

(지난이야기: 한국어 화자들을 대상으로 비단어에 유음화를 적용하는지 안하는지 실험했다. 세대가 내려갈수록 유음화 안한다. ['실험은어려워' 시리즈 보기]) 실험에 대한 분석을 마치면 그걸 글로 풀어내는 일을 한다. 늘 하는 생각이지만, 아마도 실험의 진행과 글 쓰기는 시간상 같이 진행되어야 하는 것같다. 실험디자인하는 과정에서 실험디자인 섹션을 작성하고, 실험을 진행하는 와중에 실험 절차에 대해 기술하고 등등. 하지만 그렇게 하는 건 "일찍자고 일찍일어난다"처럼 지켜지기 힘든 계획 같음.(주로 "일찍 자고.." 부분을 못함) 어쨌든 실험결과를 논의하는 것은, 내가 했던 실험을 맥락화하는 과정이다. 단순한 실험이었고, 확실한 가설(세대별로 차이있음)과 어느정도 예상되는 결론(젊은 세대가 유음화 안함)이 있..

생각나는대로 2024.11.23

[실험은 어려워] 9. 통계분석

(지난이야기: 한국어 화자들이 비단어에서 유음화를 적용하는지 안하는지 발음 녹음한 데이터를 수집하였다. 이제 통계분석을 해야 함 ['실험은어려워' 시리즈 보기]) 1화에서 8화까지의 내용을 다시 정리하자면, - 한국어에서 유음화가 적용될수도 안 적용될수도 있다. "전략"을 [절략]으로 발음하는 게 표준발음이지만, [전냑], [전략]도 발견된다.- 세대에 따라 유음화의 적용이 다르다는 선행연구가 있다.- 비단어를 이용해서 세대별로 유음화가 다른지 실험했다. 비단어는 "갈농" "골눕" "널넥" "흘닙" "돈량" "논룽" 등 유음화 적용 가능한 ㄴㄹ 혹은 ㄹㄴ연쇄를 가지지만 한국어에 없는 단어들. - 각 녹음마다 '비음의 정도'를 수치로 환산한 Nasality Score를 추출했다. Nasality Score..

생각나는대로 2024.11.22

한국에서 찍은 안내문들

목차1. 쓰례기 절때 갇다놓치 마세요  ㄹ경음화는 표기에 반영되었는데, (갖다) 에서 적용되는 장애음뒤경음화는 표기에 반영되어있지 않다. 어쩌면 ㄹ경음화는 생산적 작용으로 존재한다기 보다 화석화된 것일지도 모르겠다. 이외에도 "쓰례기", "놓치" 도 흥미로운 사례다. 2. 방 넓은 방어쩌면 한국어 단어 "방"은 중의적이지 않을까? 월세로 빌려주는 집도 방이라고 하고, 크기를 비교할 수 있는 집의 공간도 방이라고 하는 것 같다. 후자는 "방이 크다 방이 작다" 등으로 사용될 경우에 해당."방1 넓은 방2" 에서 방1은 공간의 동의어로 사용된 것 같고 방2는 월세로 빌려주는 집을 의미하는 듯하다. 3. 빈집이 아님을 눈치채서는 안 됨장기간 외출할 때 거실등을 켜놓으면 "빈집이 아님을 눈치채지 못한다" 부정문..

생각나는대로 2024.11.20

학부 음운론의 무의미한 평가요소들

0. 요약 나중에 가서는 그닥 중요하지 않으나 음운론 개론수업에서 까다롭게 평가하는 '평가를 위한 평가' 요소들이 있는 것 같습니다. 바로 몇몇 IPA 기호의 사용입니다.  물론 계속 이 체계를 잘 지키기를 바라는 마음에서 '버릇'을 들이기 위한 것이지만, 크게 의미가 있는지는 잘 모르겠습니다.  목차 1. 사례들1.1 [g]는 IPA에 없는 기호IPA에 [g]가 없습니다. 만약 폰트때문에 잘 안보인다면 폰트를 바꿔서 써보겠습니다. IPA에는 [g]가 없습니다. IPA에는 오직 [ɡ]가 있을 따름입니다. 그래서 음운론 개론 수업에서는 강의자에 따라 잘못된 기호를 썼다고 감점을 하거나, 감점을 하지는 않더라도 꼭꼭 코멘트를 적어주기도 합니다. 그런데 사실 제 개인적인 생각으로는  [g]  [ɡ] 구별하는 ..

생각나는대로 2024.11.19
반응형