실험데이터를 기계에 넣고 다 돌려버리는 것과 별개로, human touch가 들어가는 것이 필요하다.
예상치도 못한 변수가 있을 수 있기 때문이고 그 부분에서 이름 걸고 연구하는 사람이 확인을 하고 책임을 질 선택을 해야 하기 때문이다.
사람은 다양하다. 사람으로부터 얻는 데이터도 다양하다. 그래서 무엇도 당연히 생각하면 안된다. 상상을 초월하는 경우는 늘 있다.
예전에 토론토에서 운전하다가 교외에서 사고를 낸 적이 있다. 대인사고는 아니었는데, 차가 좀 망가져서 garage에서 견인차를 불러 수리를 맡겼다. 어짜피 garage가 토론토에 있었기 때문에 견인차 옆자리를 얻어타고 돌아가는데, 아저씨 운전석에 대문짝만하게 NEVER ASSUME ANYTHING이라고 써져있는 걸 봤다. "무엇도 당연하게 전제하지 말라"
연구자들은 이상한 사람들이다. 비정상적인 사람들이 대학원을 가고 수업을 구성하고 실험을 한다. 수업이나 실험이나 '정상적인 사람'을 대상으로 하기 때문에 연구자들이 생각하는 가능성의 범위는 좁을 수밖에 없다.
예를 들어, 언어학 개념을 이해하고 적용할 줄 아는 사람들이 대학원을 간다. 그래서 기본적인 개념을 알려주면 그것을 이해하고 적용할 수 있다고 "당연하게 전제한다." 아주 기초적인 개념도 어려울 수 있다는 걸 쉽게 이해할 수 없다. 실험의 경우도, 당연히 20년 넘게 한국어만 써온 사람들은 처음보는 한글 표기도 소리내서 읽을 줄 알 것이라고 "당연하게 전제한다." 책상을 두드리면 녹음기에 퉁퉁 소리가 들어갈 걸 알 것이라고 "당연하게 전제한다." 그러나 당연하게 전제할 수 있는 건 없다. 사람들은 늘 상상을 초월하고, 비정상인 쪽은 우리 연구자들이다.
그래도 실험을 몇 번 하면서 경험치가 쌓인 면도 있는 것같다. 석사때는 사람들을 믿었고 "자연발화는 연구자가 자리를 비워야 한다"라는 생각에 빈 방에 피실험자를 혼자 남겨두는 '순진한' 선택을 했다. (빈 방에서 진짜 별 짓을 다한다. 책상을 두드리는 건 예시) 이제는 사람들은 내가 보지 않으면 실험에 진지하게 참여하지 않는다는 걸 알고, "자연발화"를 뽑아내는 건 애초에 달성할 수 없다는 걸 안다.
한글을 읽을 줄 모르는 사람들도 많다. 자모가 조합되어 있는대로 읽는 게 아니라, 마치 한자를 읽듯, 단어 단위로 생긴 모양새를 보고 비슷한 아무말이나 발음하는 사람들도 많다. 분석 안하는 연습 세션에선 훌륭했다가, 본 세션에서는 180도 바뀌어버리는 지킬박사같은 사람들도 있다. 1
당연하게 전제할 수 있는 건 그 무엇도 없다.
하지만 한가지 이해할 수 없는 것은, "실험에 참여할 권리"가 그 무슨 대단한 것이라고 연구자가 침해할 수 없다고 정해놨냐는 것이다. 연구자는 피실험자가 실험에 참여하는 걸 거부할 수 없게 되어있다. 비록 그 피실험자가 ADHD 환자에다가 참가비 받을 생각에 실험은 어찌되든 그냥 개소리만 마이크에 쏟아넣는다고 하여도, 사전에 정한 합당한 배제기준이 아니라면 사후에 배제할 수가 없다.
문제는 그런 배제기준은 실험데이터를 까보기 전까지는 생각조차 할 수 없다는 것. 다 양보해서 그 경험을 바탕으로 '다음실험'에서 그런 배제기준을 계획서에 쓴다고 해도, 윤리위원회에서는 너무 광범위한/무관한 배제기준이라고 할 게 뻔하다는 것이다. 2
- '실수'를 말하는 게 아니다. 한 단어 3회반복하는 실험에서 여러개 단어들을 3회 전체 똑같이 잘못 발음하는 정도면 충분히 체계적으로 '그렇게 알고' 발음하는 것이라고 할 수 있을 것이다. [본문으로]
- 그리고 배제기준을 동의서와 실험공고에 분명히 명시했는데 무시하고 실험에 참여하는 사람들도 있다. 이건 내 입장에서는 돈은 돈대로 나가고 데이터는 못 쓰게 되는 것이기 때문에 짜증이 좀 나긴 하지만, 조금 짜증나고 그만이다. 큰 돈도 아닌데 그렇게 욕심부리는 사람이면 그냥 '먹고 떨어져라'라는 생각으로 적선했다고 생각하면 될 일이다. [본문으로]
'Bouncing ideas 생각 작업실 > exp sharing 경험.실험 나누기' 카테고리의 다른 글
신경망 이용한 음운론 연구 workflow (feat. Fairseq) (0) | 2024.05.01 |
---|---|
fairseq translation task cross-attention 접근 쉽게하기 (0) | 2024.04.10 |
Python으로 textgrid 생성했는데 왜 먹지를 못하니 (0) | 2024.03.22 |
Fairseq transformer model에서 attention 뽑아내기 (2) | 2024.03.08 |
'JKDY' 테스트 돌리기 + 배포🎉 (2) | 2024.02.23 |