최근 chatgpt가 나오며 떠들썩하던데 그런 chatgpt의 model architecture인 transformer에 대해 알아봅시다. 먼저 andrew ng님의 연구 논문 읽는 법에 대해 알아보고 갑시다. 한 글자 한 글자 다 읽는 것은 최악의 전략이다. 제목, 초록, 도표를 읽어라. 특히 딥러닝 분야에선 대부분 도표에 논문이 요약되어 있는 경우가 많다. 그다음 서론과 결론 도표를 다시 봐라. 그다음 논문을 위부터 아래로 쭉 읽어라 하지만 수식은 패스, 또 중요하지 않은 것 같은 부분도 패스 저자가 뭘 하려는지 생각해라 해당 논문의 접근법의 핵심이 뭔지 생각해라 너가 해당 논문에 나온 걸 어떻게 사용할 수 있는지 생각해라 다른 어떤 논문을 더 읽어볼지 생각해라 이제 본격적으로 논문을 읽어봅시다. t..