Web Analytics Made Easy - Statcounter

프로그램 12

경량 LLM 로컬로 또 올리기

언제부턴가 ollama가 무척 무거워져버렸다. 그래서 llama.cpp로 갈아탔다. 나빼고 모두 갈아탄 듯하다.ㅋㅋㅋ 모델은 Gemma 3 (40억 파라미터). 미리 말하는데 얘 영어뿐만 아니라 다른 언어도 구사한다 (한국어와 중국어 해봄)https://huggingface.co/ggml-org/gemma-3-4b-it-qat-GGUF ggml-org/gemma-3-4b-it-qat-GGUF · Hugging FaceWe’re on a journey to advance and democratize artificial intelligence through open source and open science.huggingface.co ChatGPT 비상계엄 대응 연습 시나리오를 했는데, 나 얘 맘에 드는 ..

생각나는대로 2026.01.17

개강직전 '방학숙제' 완료

1월 5일 (월요일) 개강입니다.지난 학기동안 포모도로 앱과 IPA 입력 앱 쓰면서 불편했던 점을 메모해뒀었는데 시간나면 다 고쳐야지 생각했던 '숙제'였습니다.이 방학숙제를 개강 직전에 겨우 끝냈습니다. 특히 [jaɪks]를 쓸만하게 다시 만든 건 보람있습니다. (지금 이 모든 /aɪ pi eɪ/ 기호를 수정된 [jaɪks]를 이용해서 쓰고있는데 너무 편리하고 좋네욬ㅋㅋㅋㅋ 진정한 자화자찬) 애초에 이 앱을 고안했을 때 생각했던 "IPA입력기의 3원칙" 그대로입니다. 첫째: 마우스 사용 없이, 둘째: 키보드 추가 없이, 셋째: 가볍고 단순하게. 이름도 그대로입니다. just another ɪPA keyboard - simplified 이렇게 두문자(?)를 따서 [jaɪks]. 소리내서 읽으면 Yikesǃ..

생각나는대로 2026.01.05

나 까먹지 말라고 쓰는 fairseq 버전 이슈 해결법

0. Replication crisis의 아주 작은 주범 중 하나는 dependency issue일 것이다. 이건 진짜 단언할 수 있다. 어떤 연구자가 데이터와 코드베이스까지 친절하게 공개를 해 놨더라도, 다른 연구자는 환경 구성하다가 암걸려서 사망하면 replicate를 못하게 되고, 그래서 이 사단이 나는 것이다. 진짜 주말 내내 과거 내가 돌렸던 fairseq script 돌리겠다고 붙잡고 있느라 한 글자도 진전을 못 보았다. 나같은 사람 세상에 또 있을런가 모르겠는데 일단 독자 1명 (나자신) 상정하고 메모한다. 목차 1. 문제와 해결오리지날 fairseq(-py)는 더 이상 개발되지 않는다. 버전은 0.12.2가 최신이다. Name: fairseqVersion: 0.12.2Summary: F..

생각나는대로 2025.10.27

GenAI 시대에 과제내기: hallucination 유도하기

2학년 음운론 개론 과목에는 전사(transcription) 과제가 반드시 한번 들어간다. 단순한 단어 전사하기는 사전에 발음표기가 나오니까 당연히 옛날부터 베껴서 제출할 수 있다고 전제되었기에 대체로 complex word나 짧은 문장을 broad transcription시킨다. GenAI의 도래 이후 문제가 생겼다. 정직하게 직접 한땀 한땀 전사해서 제출한 학생보다 그냥 ChatGPT한테 '해죠' 해서 제출한 학생이 점수를 더 잘 받게 된 것이다. 나는 한땀한땀 전사하는 학생들이 더 혜택을 보았으면 좋겠다고 생각한다. 그 과정에서 더 많이 배우고 노력을 하기 때문에 성적 상의 보상을 주고 싶은 마음이고, 이런 식으로 보상을 받게 되면, 음운론에 흥미를 가질 동기부여가 될 것이기 때문이다. 그래서 고민..

생각나는대로 2025.10.14

Yale → 한글

0. 요약로마자를 사용하여 한국어를 표기하는 방법은 여러가지지만 언어학에서 표준으로 사용하는 것은 Yale 표기법이라고 합니다. 이 포스팅에서는 Yale 방식으로 표기된 한국어를 입력받아 한글로 바꿔주는 프로그램을 배포합니다.예를 들어 Yale 방식으로 "mwelako ssun ke.ya" 라고 되어있는 한국어 문장을 이 프로그램으로 변환하면 아래와 같습니다.  목차 1. 동기예전에 한 연구자님께서, "논문에서 Yale 방식으로 표기된 한국어를 더욱 쉽게 읽기 위해서, Yale 방식으로 된 한국어 문장을 한글로 자동 변환할 수 있으면 편리할 것 같다"라고 문의하신 적이 있었다. 기존 hangul-to-ipa에는 한글을 Yale로 변환하는 로직이 있다. 그걸 이용하면 쉽게 만들 수 있다 (해체는 조립의 역..

깡통 노트북에 가벼운 LLM 올려서 계엄사태 대비하기

0. 요약구형에다가 경량으로 디자인된 노트북에 대규모언어모델(LLM)을 올려보았습니다. ChatGPT같은 챗봇으로 소통하는 언어모델입니다. 이 글에서는 그 경험을 공유합니다. (2026년에 '다시 올려본' 경험담은 여기)그 과정에서 LLM 경량화가 무엇인지를 NLP 비전공자 (그럼 니 전공은 뭔데?) 수준에서 소개합니다. 또한 누구든 하찮은 기계에 LLM을 따라 올려볼 수 있도록 각 단계를 소개합니다.또한 여담으로 인공지능에 의한 불법적 계엄사태에 저항하는 연습도 해봅니다. 목차 1. 가벼운 기계나한테는 2017년에 구입해서 한 3년 정도 사용했던 경량 노트북이 있다. 모델명은 삼성 nt900x5y, 흔히 "노트북 9 Always"라는 상품명으로 알려진 제품이다. 이 노트북은 광고가 인상적이었다. 경량..

[jaɪks]: Just Another IPA Keyboard - Simplified

0. 요약macOS에서 쓸만한 IPA 키보드 깍는 노인 연구자 이야기입니다. 실제 macOS 앱은 섹션 5에서 받을 수 있고, 나머지는 만들었던 동기와 과정에 대해 설명합니다. 목차 1. 좀이 쑤셔서며칠 전 이런 글을 올렸다. macOS에서 사용하기 적절한 IPA 입력수단을 못찾아서 직접 만들어 쓴다는 내용. https://linguisting.tistory.com/233 macOS에서 음성기호 IPA 사용하기0. 요약 macOS에서 인터넷 연결 없이 IPA 쓰는 방법 소개합니다.  목차  1. IPA picker모든 학부 음성음운론 개론수업에서 가장 먼저 소개하는 것이 "컴퓨터로 IPA입력하기", "컴퓨터에서 IPA 안 깨지linguisting.tistory.com  막상 블로그에 글을 올려놓으니 좀이..

2페이지씩 스캔한 이미지 여러 개 단번에 반갈죽

0. 요약Aquilina (1965)가 디지타이징 되어있지 않아서 실제 책을 빌려 필요한 부분을 스캔했습니다. 책은 펼치면 2페이지가 펼쳐지니까 이미지도 2페이지씩 스캔되었습니다. 이번 포스팅에서는 이렇게 2페이지씩 된 이미지 여러개 있을 때 간단한 파이썬 스크립트를 이용해서 단번에 다 자른 경험을 공유합니다. 오랜만에 "경험.실험 나누기" 카테고리에 맞는 글이네요.   목차 1. 왜 Acrobat으로 못하는데?펼친 페이지들을 엄청 많이 스캔했다. 스캔한 이미지들, Adobe Acrobat으로 반갈죽해서 PDF로 만들 수 있을 줄 알았다. 그런데 놀랍게도 인공지능이 인간이랑 농담따먹기 하는 이 시대에 돈을 내고 쓰는 Adobe Acrobat에 그 기능이 없다!더보기ChatGPT 4o model이 한국어로..

'JKDY' 테스트 돌리기 + 배포🎉

0. 들어가는 말(이 글은 2024.02.19 - 좌충우돌 딥러닝을 이용한 한글IPA변환기 에서 이어지는 글입니다.) 구어체로 느슨하게 전사하는 프로그램을 완성하기는 했는데, 욕심이 나서 UI를 입혔다. 챗GPT 시키니 금세 되니 좋다. 비록 자잘한 오류가 많아서 '내가 못하는 새로운 일'을 시킬 수는 없지만, 할줄 아는데 귀찮은 것은 챗GPT 시켜서 초벌로 해놓고 나온 결과를 직접 수정하니 편리하다. 앱의 이름은 JKDY로 정했다. 이 프로그램이 "좋거든요"를 전사하면 조커등여 [tɕ o kh ʌ t ɯ ŋ jʌ] 라고 나오는데 약자를 따와 JKDY라고 한 것이다.    목차 1. 조커등여새로 만든 장난감(?) 가지고 놀다가 대체 내가 무슨 괴물을 만든 건가 생각이 들었다.ㅋㅋㅋ 무슨일이냐 하면 바로 ..

지겨운 한국어 행간주석(interlinear gloss) 컴퓨터 시키기

0. 요약한국어 행간주석을 자동으로 생성하려면 Korean auto-glossing 툴을 이용하세요.[Github repo 링크] 본 포스팅에서는 Korean auto-glossing을 로컬로 설치해서 사용하는 방법을 주로 소개합니다. 설치 어려워서 못하시는 분을 위한 web ui 체험(아주느림)도 있습니다. 목차 1. 행간주석이 뭐야?행간주석(interlinear glossing)은 통사론/의미론 논문을 쓸 때 언어 예문을 제시하는 방식입니다. 사실상 표준으로 사용되는 방식은 아래와 같은 Leipzig Glossing Rules [specifications 링크]입니다. (고양이 사진 출처)통상적으로 행간주석 interlinear glossing 은 4줄로 구성됩니다. 고양이 사진은 있으면 좋지..