트랜스포머(Transformer) | AI 용어 | NJOY-AI

트랜스포머란 무엇인가요?

트랜스포머(Transformer)는 2017년 구글에서 발표한 "Attention Is All You Need" 논문에서 소개된 신경망 아키텍처입니다. 기존의 순환 신경망(RNN)이나 합성곱 신경망(CNN)과 달리, 오직 어텐션 메커니즘만을 사용해 텍스트를 처리합니다.

가장 큰 특징은 '셀프 어텐션(Self-Attention)' 구조입니다. 문장 속 각 단어가 다른 모든 단어들과 직접 연결되어, 문맥상 중요한 관계를 파악할 수 있습니다. 마치 책을 읽을 때 앞뒤 문맥을 동시에 고려하는 것처럼, 전체 문장을 한 번에 이해하는 방식입니다.

왜 혁신적인가요?

기존 RNN은 단어를 순서대로 하나씩 처리했기 때문에 속도가 느리고, 긴 문장에서는 앞부분 정보를 잊어버리는 문제가 있었습니다. 반면 트랜스포머는 모든 단어를 병렬로 처리하여 학습 속도가 훨씬 빠르고, 장거리 의존성도 잘 포착합니다.

예를 들어 "그는 공원에서 산책하다가 오래된 친구를 만났다"라는 문장에서, '그는'과 '만났다'가 멀리 떨어져 있어도 트랜스포머는 이들의 관계를 정확히 파악할 수 있습니다.

현재 어디에 사용되나요?

트랜스포머는 현재 거의 모든 대화형 AI의 기반이 되었습니다. GPT 시리즈, BERT, T5 등 주요 언어 모델들이 모두 트랜스포머 구조를 사용합니다. 번역, 요약, 질의응답은 물론 최근에는 이미지 생성, 음성 인식 등 다양한 분야로 확장되고 있어 AI 발전의 핵심 동력이 되고 있습니다.