Web Analytics Made Easy - Statcounter

Bouncing ideas 생각 작업실/exp sharing 경험.실험 나누기

2020년대 말뭉치에서 졸리다 의 품사

sleepy_wug 2025. 5. 11. 00:05

0. 요약 

한국어 어휘 '졸리다'는 규범문법에서 동사 형용사 다의어로 제시하고 있습니다.

 

그러나 이전 글에서 설명한 바와 같이, 제 직관 상 (그리고 다른 여러분들의 직관 상) '졸리다'를 동사로 활용하는 '졸린다'는 다소 어색합니다.

2020년 구어말뭉치에서 용례를 보았습니다. 학부 학위논문 주제 찾으시는 분들, 이런걸로 해보세요!

 

목차

     

     

    1. 복습

     

    이전 글에서, 유미의 세포들 347화에 나온 "아... 졸린다"라는 표현이 어색한 이유에 대해 '갑자기 분위기 언어학'했습니다.

    잠시 복습하고 갑시다.

    https://linguisting.tistory.com/265

     

    졸린다 인가 아니면 졸리다 인가

    0. 요약 한 웹툰에서 '졸린다'라는 표현이 사용되었는데, 제 직관 상 다소 어색했습니다. '졸리다'는 동사와 형용사 다의어인데, 제 직관 상 형용사 의미만 있는 것 같습니다. 이 계기를 통해 한국

    linguisting.tistory.com

     

     

    The item included is used under the principles of "fair use" as outlined in Section 107 of the Copyright Act of 1976. It is provided solely for educational purposes to facilitate learning, research, and the advancement of knowledge. 여기 포함된 자료는 미국 1976년 저작권법 제107조에 명시된 "공정 이용" 원칙에 따라 사용됩니다. 학습, 연구 및 지식 증진을 촉진하기 위해 오직 교육 목적으로 제공됩니다.

     

     

    ⬇︎

     

    엥? "졸린다"가 아니라 "졸리다" 아닌가? 

     

    ⬇︎

     

    사전 찾아보니 '졸리다'(형용사일 때) 와 '졸린다' (동사일 때) 둘다 가능하네?

     

    ⬇︎

     

    아마도 동사로서의 활용이 사라지고 있는 언어변화과정이 아닐까?

     

    (끝)

     

    2. 데이터

    데이터는 국립국어원 '모두의 말뭉치(https://corpus.korean.go.kr)'에서 구할 수 있는 자료 중 2020년대 구어형을 수록하고 있는 것입니다.

     

    정확하게 어떤 데이터를 사용했는지는 라이선스 상 공개를 하지 못합니다.ㅠㅠ 왜냐면 '졸린다' 연구하는 목적으로 얻은 데이터가 아니거든요. 그니까 이 포스팅 보고 누구든 바통 이어받아서 정식으로 데이터 (더 좋은 데이터) 구해가지고 연구해주세요. 아래 파이썬 코드 맘대로 써주세요. 

     

    3. 어떻게 했는가

    3.1 시놉시스

    해당 데이터는 대화가 철자형으로 전사되어 있습니다. 그래서 그냥 단순하게 '졸리', '졸려', '졸린', '졸렸' '졸립' 의 어간으로 검색했습니다. 형태소분석을 한 다음 '졸리-' 라는 어근을 찾는 방법도 있겠으나, 형태소 분석의 과정에서 어떻게 처리될지가 불확실해서 그냥 무식하더라도 철자형 어간으로 검색했습니다.

     

    언어변화가 아닐까? 했으므로, 사회언어학적 요소들 (직업, 성별, 나이)도 수집했습니다.

     

    3.2 파이썬 코드

    챗GPT의 도래 이전에 수작업으로 쓴 코드입니다. 몇년 전 해당 코퍼스를 다른 연구 목적으로 분석했는데, 그 목적으로 썼던 코드를 target 부분만 수정해서 재활용했습니다.

    코드 전체를 여기에 붙여넣는 건 무의미할 듯하여 파일로 첨부합니다.

    main.py
    0.00MB

     

    4. 결과

    결과 정리한 엑셀 파일이 여기 있습니다.

    forms.xlsx
    0.01MB

     

    일단 '졸리', '졸려', '졸린', '졸렸' '졸립' 이렇게 키워드 검색을 했으니 각 키워드별로 몇 건 출현했는지 보면 (아 그리고 안젤리나 졸리가 7건 나왔네요)

    키워드 출현횟수
    졸리 17
    졸려 5
    졸린 8
    졸렸 0
    졸립 0
    안젤리나 (졸리) 7
    합계 37

     

    그런데, '졸린'이 출현한 경우 8건 모두 '-ㄴ'이 동사 활용으로 사용된 것이라고 보기 어렵습니다.

     

    ... 졸린 거 빼고 ...
    ... 졸린 거랑 ...
    ... 졸린데도 막 ...
    ... 졸린 거예요 ...
    ... 졸린 데 잠을 ...
    ... 졸린 목소리가 ...
    ... 졸린 거 같아 ...
    ... 졸린 거야 ...

     

    저는 통사론 의미론 하는 사람이 아니니까 결과 자료에서 뭘 더 뽑아내야할지 잘 모르겠네요. 그래서 궁금하신 분들이 직접 결과 자료를 보실 수 있도록 Header 설명만 달아놓겠습니다.

    Header 설명
    target 찾은 키워드
    topic 이 문장이 어느 대화 주제에서 나왔냐
    title 이 문장이 나온 담화문의 제목이 뭐냐
    pre_2 실제 출현 단어보다 2단어 전에 나온 단어
    pre_1 실제 출현 단어 직전에 나온 단어
    occ 실제 출현 단어
    seq_1 실제 출현 단어 직후에 나온 단어
    seq_2 실제 출현 단어 2단어 후에 나온 단어
    speaker_id 이 말을 한 사람의 일련번호
    speaker_age 이 말을 한 사람의 연령대
    speaker_occupation 이 말을 한 사람의 직업군
    speaker_sex 이 말을 한 사람의 성별
    speaker_birth 이 말을 한 사람의 출생 지역
    speaker_mainRegion 이 말을 한 사람이 오랫동안 생활한 지역
    speaker_currentRegion 이 말을 한 사람이 지금 사는 지역
    speaker_education 이 말을 한 사람의 교육 수준

     

     

     

     


    이어서 어떤 글을 읽을 건가요?

     

     

    졸린다 인가 아니면 졸리다 인가

    0. 요약 한 웹툰에서 '졸린다'라는 표현이 사용되었는데, 제 직관 상 다소 어색했습니다. '졸리다'는 동사와 형용사 다의어인데, 제 직관 상 형용사 의미만 있는 것 같습니다. 이 계기를 통해 한국

    linguisting.tistory.com

     


    • 글이 유익했다면 후원해주세요 (최소100원). 투네이션 || BuyMeACoffee (해외카드필요)
    • 아래 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
    • 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
    • 반박이나 오류 수정을 특히 환영합니다.
    • 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.