Web Analytics Made Easy - Statcounter

생각나는대로

한글을 음성기호 IPA나 예일 Yale 로 자동 전사하기

sleepy_wug 2022. 7. 25. 18:31

 

0. 요약

저 자신의 편의를 위해서, 또한 아마도 다른 분들 중에도 필요하실 사람이 있을 것 같아서,

한글을 쓰면 IPA로 바꾸어주는 웹앱을 만들었습니다. "감기"를 넣으면 "[kɑŋɡi]"를 출력해요. 그리고 "분가" 넣으면 "[puŋɡɑ]"를 출력하죠. 저희 [puŋɡɑ]하겠습니다

링크는 아래와 같습니다. 

https://linguisting.tistory.com/84

 


더보기

2022-12-07 수정: 현재 heroku에서 무료 호스팅을 더 이상 제공하지 않아서 웹앱이 내려간 상태입니다. 대안은 아래와 같습니다.

1. 부산대 AI Lab에서 만든 '표준발음 변환기'를 이용해주세요.

2. 본 웹앱의 소스코드는 공개되어있으니 그것을 이용해주세요. https://github.com/stannam/hangul_to_ipa 아래 이미 설명했지만 본 웹앱은 R로 짰고 프론트엔드만dash로  구성했습니다. 핵심부분은 ./src/worker.r 이므로 이 파일을 로컬 환경에서 R로 그냥 돌리시면 됩니다. 웹 인터페이스를 원하신다면 root에 있는 app.py를 돌리면 될 것입니다. 혹시 이부분에서 막히는 게 있으시다면 댓글남겨주세요.


 

2022-12-10 수정: 1달 $5씩 지불하는 유료 플랜에 가입했습니다. 이에 따라 한글toIPA는 다시 살아났습니다. 그러나 땅파면 5달러씩 나오는 게 아니므로 조만간 광고를 추가할 생각입니다.


 

목차

     

    1. 사용법: 기초

    Hangul to IPA의 인터페이스

     

    왼쪽 빨간 네모 텍스트 상자에 한글을 입력하면,

    오른쪽 파랑색 동그라미와 같이 결과가 나옵니다. 끝!

     

    기본기능 이외의 설정은 아래 옵션들에서 원하는 값을 조정하면 됩니다.

     

    2. 사용법: 심화

    2.1 IPA전사/예일표기법 선택: What do you want to do? 섹션

    여기에서 "IPA Transcription" (기본값) 선택하면 IPA로 표현된 발음형을 표현합니다.

    "Yale Romanization" 선택하면 언어학에서 표준으로 사용하는 한국어의 로마자 표기방식인 Yale 방식으로 한국어를 전사할 수 있습니다. 예컨대 Yale 방식으로 "부수다"를 쓰면 아래와 같이  "puswuta"가 됩니다.

     

    "부수다"를 예일 로마자 표기법으로 puswuta

     

    2.2 적용할 음운규칙 선택: Phonological rules 섹션

    IPA로 한국어 발음을 표현하고자 하신다면, 여기에서 한국어에 존재하는 다양한 음운규칙을 선택할 수 있습니다. Yale은 한글로 표현된 한국어 기저형을 로마자로 일대일 대응시키는 시스템이기 때문에 음운규칙 적용이 적합하지 않습니다.

    한국어의 필수음운규칙은 모두 구현했으며, 거기에 추가적으로 2가지 수의적 음운규칙과 2가지 음성규칙을 포함했습니다. 

    음운규칙 목록

    반응형

     

    빨간색 박스 표시된 부분이 한국어 표준문법에서 말하는 소위 '필수 적용 음운 규칙'들입니다. 즉, 어떠한 경우에도 모두 적용되는 음운 규칙들입니다.

     

    파란색 박스 표시된 부분은 수의적으로 적용되는 규칙입니다. '공명음사이 ㅎ 삭제'[각주:1] 그리고 수의적 조음위치동화입니다.

    공명음 사이에서 ㅎ 탈락하기는, 예를들어 "도합"을 "도압"이라고 발음하는 등 모음 사이에서 ㅎ를 발음하지 않거나 "선호"를 "선오"로 발음하는 것을 말합니다. 사실상 거의 모든사람이 하는 것이라 기본값은 체크가 되어 있는 것이지만, 체크를 해제할 수 있습니다. 만약 체크를 해제하면 "선호"를 [sʌnho]라고 하겠죠. 

    • 이 파라미터를 체크하시면 (기본값): "선호"를 [sʌno] 로 전사합니다.
    • 이 파라미터를 체크 안하지만: "선호"를 [sʌnho] 로 전사합니다.

     

    수의적 조음위치동화는 "한글" "항글"이라고 발음하고 "감기"를 "강기"로 발음하는 등의 위치동화를 말합니다. 학교문법에서는 인정되지 않지만, 현실적으로 많은 화자들이 적용하는 음운규칙입니다.

    • 이 파라미터를 체크하시면 (기본값): "한강"을 [hɑŋɡɑŋ] 으로 전사합니다.
    • 이 파라미터를 체크 안하지만: "한강"을 [hɑnɡɑŋ] 으로 전사합니다.

     

    마지막으로 박스가 쳐져있지 않은 규칙이 2가지 있는데, 이것들은 음성-음운론적인 규칙들입니다. 규칙 적용의 여부는 어떠한 이음이 출력형에 나오는가만 결정할 뿐 음소적인 차이를 야기하지 않습니다.

    장애음 유성음화는, 한국어의 장애음이 공명음 사이에서 유성음으로 나는 음성현상입니다. 한국어는 음운론적으로 유무성 구분을 하지 않으므로 이것은 철저히 음성현상입니다. 

    • 이 파라미터를 체크하시면 (기본값): "지각"을 [tɕiɡɑk] 으로 전사합니다.
    • 이 파라미터를 체크 안하지만: "지각"을 [tɕikɑk] 으로 전사합니다.

    유음(liquid)의 이음 선택은, 한국어의 음소 /ㄹ/이 환경에 따라 이음(allophone) [l], [ɾ]를 선택하는 작용입니다. 각각은 한국어 자음 음소를 구성하지 않으므로 이것 역시 철저히 음성현상입니다.

    • 이 파라미터를 체크하시면 (기본값): "이름"을 [iɾɯm] 으로 전사합니다.
    • 이 파라미터를 체크 안하지만: "이름"을 [ilɯm] 으로 전사합니다.

     

     

     

    2.3 단어목록 올려서 한꺼번에 전사하기

    Hangul-to-IPA에는 단어목록을 올려서 한꺼번에 전사할 수도 있습니다. 텍스트박스 밑에 보면 단어목록을 올릴 수 있는 부분이 있습니다. 단, 파일을 올리기 전에 1.11.2 부분의 설정을 먼저 하신 다음에 올려주세요.

    빨간 화살표 부분에 파일 업로드

     

    빨간색 화살표로 표시된 공간에 파일을 드래그해 오시거나, 그 공간을 클릭하시면 파일업로드를 할 수 있습니다. 

    파일 목록은 csv 형식으로 되어있어야 합니다. 아래 예시파일이 있습니다. 두 파일 모두 동일한 한국어 단어 25개로 구성되어 있습니다. 이것들은 철자형 그대로 발음되지 않고 음운규칙 적용을 받는 단어들입니다. '가로형'과 '세로형'의 차이는, 이 프로그램이 두 가지 형식의 텍스트파일을 처리할 수 있다는 것을 보여주기 위한 것입니다. '가로형'은 단어들이 한 열로 나열되어 있고, '세로형'은 대부분의 양적방법론에서 사용하는 일련번호-단어 형식의 2개열로 구성된 파일입니다.

     

    가로예시.txt
    0.00MB
    세로예시.txt
    0.00MB

     

    '가로예시' 파일이나 '세로예시' 파일을 Hangul to IPA에 업로드하면 약간의 처리시간이 걸린 후 다음과 같이 우측에 결과가 나옵니다.

    잘 나온듯

     

    3. 자모음 인벤토리 

    제가 쓴 이전 글인 "2021.02.04 - [Bouncing ideas 생각 작업실] - 한국어 IPA로 어떻게 전사할 것인가" 에서도 언급한 바 있습니다만, 음운론 연구자들마다 전제하는 자모음 음소 목록 (인벤토리) 가 조금씩 다르고, 인벤토리 기호 각각에 완전히 엄밀한 것만이 능사가 아니라는 생각합니다. 다만 중요한 것은 자신이 어떤 인벤토리, 음운자질 목록를 전제하는지 명확하게 제시하는 것입니다.

    저의 경우는 다음과 같은 자음과 모음을 전제하고, Hangul-to-IPA 는 제가 만든 웹앱이기 때문에 그것 역시도 동일한 인벤토리를 전제합니다.

     

    [자음]

        양순 (bilabial) 치경 (alveolar) 경구개 (palatal) 연구개 (velar) 성문 (glottal)
    파열(plosive) 평(plain) ㅂ /p/ ㄷ /t/   ㄱ /k/  
    격(aspirated) ㅍ /pʰ/ ㅌ /tʰ/ ㅋ /kʰ/
    경(tense) ㅃ /p*/ ㄸ /t*/ ㄲ /k*/
    마찰(fricative) 격(aspirated)   ㅅ /s/     ㅎ /h/
    경(tense) ㅆ /s*/
    파찰(affricate) 평(plain)     ㅈ /tɕ/    
    격(aspirated) ㅊ /tɕʰ/
    경(tense) ㅉ /tɕ*/
    비음 (nasal) ㅁ /m/ ㄴ /n/   받침ㅇ /ŋ/  
    설측접근음 (lateral approximant)   ㄹ /l/      

     

    [단모음]

      전설 (front vowel) 후설 (back vowel)
    비원순 (unrounded) 원순 (rounded)
    고 (high vowel) ㅣ/i/ ㅡ /ɯ/ ㅜ /u/
    중 (mid vowel) ㅐㅔ /ɛ/ ㅓ /ʌ/ ㅗ /o/
    저 (low vowel) ㅏ /ɑ/

     

    [이중모음]

    한글 IPA 한글 IPA
    /ju/ /wi/
    /jʌ/ /wʌ/
    /jo/ ㅚ ㅞ ㅙ /wɛ/
    ㅖㅒ /jɛ/ /wa/
    /ja/ /ɰi/

     

     

    4. Reference grammar 

    이 웹앱을 만들때 자모음 인벤토리와 음운규칙의 상당부분은 Shin, Kiaer, and Cha (2012) [ebook 링크][각주:2] 를 참고하였습니다. 상당히 좋은 책입니다.

     

    다만, 이 책에서 소개되는 음운규칙 가운데 수의적 규칙들은 아직 구현하지 않았습니다. 이 책의 8장과 9장에서 한국어의 음운규칙들이 소개되는데, 이번에는 8장에 소개된 규칙 중 필수규칙 전부와 Non-coronalization, /h/-deletion을 구현한 것입니다. 8장의 규칙 중 이 프로그램에서 구현되지 않은 음운규칙은 Similar-place obstruent deletion과 /j/ deletion입니다. 차차 (시간이 있으면) 구현해나갈 생각입니다.

    아래는 Shin et al (2012) 197페이지에 나오는 표입니다. 빨간색 박스로 표시된 두 규칙을 제외한 모든 규칙이  hangul to IPA에 구현되었습니다.

     

     

    참고로 9장에서는 형태론적/어원적 제약에 따라 적용되는 규칙들이 소개되어 있는데, 이부분을 구현하기 위해서는 형태론적 정보가 필요하고 이 부분은 엄밀히 말하면 Hangul to IPA 앱의 목적과는 동떨어져있습니다.

     

    좋아할 것 같아서 다른 글도 준비했어요


    2022.09.22 - [언어학으로 박사유학/언어학 박사 생활하기] - 선을 넘어 괴물이 되어버리는 경우

    2022.07.31 - [생각나는대로] - IPA 자동 전사 프로그램 후일담

    2021.02.04 - [Bouncing ideas 생각 작업실/선행연구 보다가 갑자기] - 한국어 IPA로 어떻게 전사할 것인가

     

     

     


    • 아래에 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
    • 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
    • 반박이나 오류 수정을 특히 환영합니다.
    • 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.

     

    1. 알아요, '모음사이'라고 쓴거. 실수지만 그냥 냅둘려고요 [본문으로]
    2. Shin, Jiyoung, Kiaer, Jieun, & Cha, Jaeeun. (2012). The Sounds of Korean. Cambridge: Cambridge University Press. doi:10.1017/CBO9781139342858 [본문으로]
    반응형