전체 글은 날짜순(최신순)입니다. 검색어와 태그로 좁힐 수 있습니다.
AI 정렬(alignment) 연구는 인공지능이 인간의 가치와 의도에 맞게 행동하도록 하는 핵심 과제입니다. 최근 대규모 언어모델의 발전과 함께 정렬 기법도 빠르게 진화하고 있으며, 이는 AI 안전성의 미래를 좌우할 중요한 연구 분야로 주목받고 있습니다. 인간 피드백 기반 강화학습부터 구성적 AI까지, 다양한 접근법들이 시도되고 있습니다.