할루시네이션 (Hallucination) | AI 용어 | NJOY-AI

할루시네이션이란 무엇인가

할루시네이션(Hallucination)은 AI 모델, 특히 대화형 AI나 생성형 AI가 실제로는 존재하지 않거나 부정확한 정보를 마치 사실인 것처럼 자신 있게 생성하는 현상을 말합니다. 인간의 환각과 비슷한 개념으로, AI가 "보지 못한 것을 본다"고 표현할 수 있죠.

예를 들어, ChatGPT에게 존재하지 않는 논문에 대해 질문했을 때 가상의 저자명과 발표 연도를 포함해 그럴듯한 답변을 하거나, 이미지 생성 AI가 요청하지 않은 객체를 추가로 그려내는 경우가 할루시네이션에 해당합니다.

할루시네이션이 발생하는 이유

할루시네이션은 AI 모델의 학습 방식과 밀접한 관련이 있습니다. 대부분의 생성형 AI는 확률적 방법으로 다음에 올 단어나 픽셀을 예측하는데, 이 과정에서 학습 데이터에 없던 패턴을 조합해 새로운 정보를 만들어낼 수 있습니다.

특히 모델이 확신이 낮은 상황에서도 무언가 답변을 해야 한다는 압박 때문에, 불확실한 정보라도 그럴듯하게 포장해서 제시하게 됩니다. 이는 모델이 "모른다"고 답하는 것보다 추측에라도 기반한 답변을 선호하도록 훈련되었기 때문이기도 합니다.

할루시네이션 대응 방안

할루시네이션 문제를 완전히 해결하기는 어렵지만, 여러 방법으로 완화할 수 있습니다. 개발자 측면에서는 RLHF(인간 피드백 강화학습)를 통해 모델이 불확실할 때 솔직하게 "모른다"고 답하도록 훈련시키거나, RAG(검색 증강 생성) 방식으로 외부 데이터베이스에서 정보를 확인한 후 답변하게 할 수 있습니다.

사용자 입장에서는 AI의 답변을 항상 비판적으로 검토하고, 중요한 정보는 반드시 별도로 검증해야 합니다. AI가 제공하는 정보는 참고용으로만 활용하고, 의사결정에는 신뢰할 수 있는 출처를 통해 확인된 정보를 사용하는 것이 바람직합니다.