Web Analytics Made Easy - Statcounter

언어학으로 박사유학/언어학 박사 생활하기

'어림짐작'으로 쉽게 말하는 사람들

sleepy_wug 2024. 4. 15. 11:39
반응형

0. 머리말

계산적(computational) 연구에는 반드시 기계 (컴퓨터) 가 사용됩니다. 컴퓨터의 사용은 대충보면 간편해보이는데 실제로는 간단하지 않습니다. 이 글은 언어학 연구에서 컴퓨팅 자원의 사용에 대한 '아무말대잔치'를 다룹니다.

 

목차

     

    1. 소위 '좋은 시절'

    "요즘에는 개인 컴퓨터들 성능이 좋아서 본인 컴퓨터에서 결과 쉽게쉽게 나오니 참 좋겠어. 우리때는 데이터가 있어도 분석하려면 학교 컴퓨터 랩 예약해서 겨우겨우 시간 쫓겨가며 해야했는데.."

     

    라고 선배 세대가 말하는 걸 보면 그냥 웃으며 아무 말 하지 않거나, 내 기분이 좀 좋으면 우쭈쭈해드리곤 한다.

     

     

    2. 연구하려면 돈내세요


     

    모델 하나를 쓰는데 구글 colab에서 100 compute unit이 소요되었다. 15불이다. 그 모델이 성공한다면 좋지만 아니면 15불을 그냥 날리는 것이다. 또 15불을 공으로 날렸다.

     

    그래서 나도 어림짐작으로 이렇게 말하고 싶은 심정이다.ㅋㅋㅋ

     

    "옛날엔 시절이 좋아서 학교 컴퓨터랩 쉽게쉽게 쓰고 결과 공짜로 나왔으니 참 좋았겠어. 우리때는 데이터도 있어도 분석하려면 돈 내야 하는데..."

     

     

    3. 정말로 '쉽게쉽게'가 되려면


     

    컴퓨터과학사를 보면 미국 대학교들에 처음 컴퓨팅 랩이 설치되기 시작했을 때에는 컴퓨팅 자원을 '공공자산'으로 인식하고 타임슬롯을 배정했다고 한다. 즉, 교수나 대학원생이나 줄서서 공평하게 사용하도록 한 것이다. 연구중심 대학교 컴퓨팅 랩 사이에 알파넷이 구축된 것도, 이대학 저대학 할거 없이 컴퓨팅 자원을 예약해서 쓸수있게 하기 위함이었다고 알려져 있다. 

     

    거기에 처음 반기를 들고 망을 끊은 곳은 MIT였다. MIT 관리자들은 컴퓨터 접근 시 패스워드를 걸기 시작했고, 물리적으로 컴퓨팅 랩의 문을 잠그기도 했다. 그러나 이러한 정책과 달리 MIT대학원생들은 "컴퓨팅 랩의 문은 항상 열려있어야한다"며 학교가 잠근 방을 뚫었다(hacked the room). 해킹과 해커가 여기에서 시작되었다.

     

    GNU프로젝트로 유명한 Richard Smallman이 당시 "방 문을 뜯던"(hacking) MIT대학원생이었다. 그가 했던 말이 유명하다.

     

    Anyone who dared to lock a terminal in his office, say because he was a professor and thought he was more important than other people, would likely find his door left open the next morning. I would just climb over the ceiling or under the floor, move the terminal out, or leave the door open with a note saying what a big inconvenience it is to have to go under the floor . . . “so please do not inconvenience people by locking the door any longer.” Even now, there is a big wrench at the AI lab which is entitled “the 7th floor master key” to be used in case anyone dares to lock up one of the more fancy terminals.

    자신이 교수랍시고 혹은 다른 이들보다 더 중요하다는 생각으로 감히 자기 사무실 안 터미널을 잠가두었던 사람은 다음날 아침에 사무실 문이 열려있는 걸 보게될 것이었다. 나는 그저 천장을 넘어 올라가거나 바닥을 기어 들어간 다음 터미널을 빼내거나 사무실문을 열어놓고는 이런 쪽지를 붙였다. "바닥을 기어 들어가려니 번거로웠습니다. 그러니까 앞으론 문을 잠가서 사람들을 불편하게 하지 마십시오." 지금까지도 AI랩에는 커다란 렌치가 있는데 거기에는 "7층 마스터 키"라고 이름붙여져있다. 더 잘나가는 터미널 가진 사람이 감히 방문을 잠가놓으면 쓰라고 놓은 것이다.
    https://www.mondo2000.com/2018/01/11/richard-stallman-last-true-hackers-mondo-2000-flashback-1989/

     

    나도 어림짐작으로 옛날 시절이 더 좋았다고 말하고 싶네.


    AWS를 쓰든 Colab을 쓰든 Azure를 쓰든 컴퓨팅 자원도 돈을 내야 하고, 

    드롭박스를 쓰든 Google Drive를 쓰든 OneDrive를 쓰든 클라우드 저장공간도 돈을 내야 하는 세상이다.

     

    촘스키 말처럼 "딥러닝을 위한 컴퓨팅 파워는 환경을 파괴하고 따라서 사회적으로 규제되어야 한다"라고 하더라도, 그 규제의 주체가 아마존 구글 등의 사설 기업이어도 좋다는 데 동의할 언어학 연구자는 없을 것이다. 

     

     

     

    4. 컴퓨터 접근성에 따른 격차

     


    세계가 인터넷으로 연결되고, 교과서와 논문을 세계 어디서나 볼 수 있게 되었다. 그래서 이전 세대 연구자들은 "와 이제 우리 때랑 달리 유학 안가도 되겠다." 혹은 "좋은 학교 아니더라도 의지만 있으면 연구성과 낼 수 있겠다" 란다.

     

    하지만 컴퓨팅 파워를 갖춘 학교(혹은 사설기업 리소스 사용하는 데 지원을 아끼지 않는 학교)와 그렇지 않은 학교 사이의 연구 성과 편차는 갈수록 커져가고 있고, 패러다임이 바뀌지 않으면 앞으로 더더욱 커져갈 것이다.

     

     

     


    • 아래에 댓글창이 열려있습니다. 로그인 없이도 댓글 다실 수 있습니다.
    • 글과 관련된 것, 혹은 글을 읽고 궁금한 것이라면 무엇이든 댓글을 달아주세요.
    • 반박이나 오류 수정을 특히 환영합니다.
    • 로그인 없이 비밀글을 다시면, 거기에 답변이 달려도 보실 수 없습니다. 답변을 받기 원하시는 이메일 주소 등을 비밀글로 남겨주시면 이메일로 답변드리겠습니다.

     

    반응형