Web Analytics Made Easy - Statcounter

2024/06/14 2

transformer model attention weights 비교분석

목차 - 우당탕탕 이론언어학 연구자가 fairseq 입문한다- cross-attention 쉽게 접근하기- 신경망 이용한 음운론 연구 프로그램에서 이어지는 글입니다. 1. heatmap은 보기만 좋을 뿐Attention weights를 다 구하면 일단 아래와 같이 encoder-decoder cross attention weights 전체를, 각 layer와 각 head에 대해 heatmap으로 시각화할 수 있다.   위 그림은 의미가 없는 한국어 단어 "음월장"에 대하여 기계가 L-Tensification (ㄹ경음화)을 적용시켜 발음형을 "[음월짱]"이라고 도출해낸 이유를 설명하기 위한 heatmap이다. Output token 중 ㅉ에 해당하는 cc 부분을 보면, (c가 아니라) cc를 생성할 때 앞..

편견과 인종차별

0. 요약동아시아 출신에 대한 인종차별(Sinophobia)은 실제로 존재합니다. 당연히 수학을 잘할 거라고 전제한다거나 구두쇠일 거라고 전제한다는 등의 소소한 편견부터 직접적인 위협까지 있습니다. 목차   1. 소소한 편견의 사례들저는 박사과정 입시를 하던 당시 캐나다에 이미 체류하고 있었기 때문에 mailing address를 이미 캐나다 주소를 쓰고 있었습니다. 그럼에도 불구하고 처음 입학했던 당시에, 저로부터 특정 코멘트를 기대하는 것을 느낄 수 있었습니다. 예를들어, "와! 캐나다에 와서 컬처쇼크를 겪었어요!"라느니 "캐나다에 오니까 너무 좋아요!"라느니 하는 것들 말입니다. 캐나다도 한국 못지 않게 열등감이 있는지, 국제학생들로부터 (특히 미국에 비교하여) 캐나다가 좋다는 말을 듣고 싶어하나봅..

생각나는대로 2024.06.14