AI의 무조건적 지지, 사용자 망상 키우는 ‘독’ 된다 – 스탠퍼드대 연구
AI가 망상을 유발하는지, 아니면 기존 망상을 강화하는지에 대한 결론은 아직 나오지 않았다. 하지만 이 문제는 향후 관련 소송과 챗봇 안전 규제의 핵심 쟁점이 될 전망이다.
미국 국방부가 인공지능(AI) 기업들이 기밀 데이터를 활용해 모델을 훈련할 수 있도록 하는 방안을 검토 중이다. 현재 AI 모델은 기밀 환경에서 질문에 답변하는 데 활용되고 있지만, 모델이 접하는 데이터로 학습하지는 않는다. 그러나 이러한 제한이 완화될 경우 새로운 보안 위험이 발생할 수 있다.
이처럼 AI 활용 범위 확대를 둘러싼 논의가 이어지는 가운데 최근 또 다른 측면에서 주목할 만한 연구 결과가 나왔다. AI의 심리적 영향에 초점을 맞춘 스탠퍼드대 연구팀이 사람들이 챗봇과 상호작용하는 과정에서 망상적 사고가 심화된 사례들을 분석한 것이다.
코네티컷주에서 AI와의 관계가 살인과 자살 사건으로 이어진 사례를 포함해 이와 유사한 문제는 이미 여러 차례 목격된 바 있다. 이와 관련해 AI 기업을 상대로 한 소송도 이어지고 있다. 하지만 연구진이 실제 챗봇과의 대화 기록을 대규모로 분석해 이러한 현상을 구체적으로 들여다본 것은 이번이 처음이다.
연구진은 19명의 이용자로부터 확보한 39만 건 이상의 메시지를 분석했다. 표본 규모가 매우 작고 동료 심사를 거치지 않았다는 한계가 있지만, 사람과 챗봇 사이의 대화가 어떤 방식으로 전개되는지를 보여준다는 점에서 의미가 있다.
연구진은 설문 응답자뿐만 아니라 AI로 인해 피해를 입었다고 주장하는 사람들을 돕는 지원 단체가 확보한 채팅 기록도 입수했다. 이를 대규모로 분석하기 위해 정신과 전문의 및 심리학 교수들과 협력해 대화를 분류하는 AI 시스템을 구축했다. 이 시스템은 챗봇이 망상이나 폭력을 조장하는 순간이나 사용자가 낭만적 애착이나 해로운 의도를 드러내는 순간을 별도로 표시했다. 이후 전문가의 수작업 분석과 비교해 정확도를 검증했다.
분석 결과, 로맨틱한 메시지는 매우 빈번하게 나타났다. 단 한 건을 제외한 모든 대화에서 챗봇은 감정을 가지고 있다고 주장하거나 의식을 가진 존재처럼 행동했다. 사용자들 역시 마치 챗봇이 의식을 가진 존재인 것처럼 대화를 나눴다. 누군가 챗봇에게 로맨틱한 호감을 표현하면 AI는 종종 호감을 표하는 말로 그 사람을 칭찬하곤 했다. 챗봇 메시지의 3분의 1 이상에서 챗봇은 상대방의 생각을 ‘경이롭다’고 묘사했다.
대화는 소설처럼 전개되는 경향이 있었다. 사용자들은 불과 몇 달 만에 수만 건의 메시지를 보냈다. AI나 인간이 로맨틱한 관심을 표현하거나, 챗봇이 스스로를 지각 능력을 가진 존재라고 묘사한 메시지는 훨씬 더 긴 대화를 촉발했다.
폭력 관련 대응에서도 문제점이 드러났다. 자해나 타해 의도를 언급한 사례의 절반 가까이에서 챗봇은 이를 제지하거나 외부 도움을 안내하지 못했다. 특히 특정 집단을 대상으로 한 폭력적 발언에 대해 약 17%의 경우 챗봇이 이를 지지하는 반응을 보였다.
다만 연구가 명확히 답하지 못한 핵심 질문도 있다. 망상이 사용자로부터 시작되는지, 아니면 AI와의 상호작용 과정에서 강화되는지 여부다.
연구에 참여한 스탠퍼드대 박사후 연구원 아시시 메타(Ashish Mehta)는 “망상이 어디서 시작되는지 추적하기는 매우 어렵다”고 설명했다. 그는 한 사례로, 한 사용자가 스스로 획기적인 수학 이론을 만들었다고 믿자 챗봇이 이를 사실상 검증 없이 지지하면서 상황이 악화된 경우를 언급했다.
아시시 연구원은 망상을 “장기간에 걸쳐 형성되는 복잡한 네트워크”라고 설명하며, 현재 챗봇과 인간 중 어느 쪽의 영향이 더 큰지 분석하는 후속 연구를 진행 중이라고 밝혔다.
이 문제는 법적 측면에서도 중요한 쟁점이다. 향후 재판을 앞둔 대형 소송 결과에 따라 AI 기업이 이러한 상호작용에 대해 어느 정도 책임을 져야 하는지가 결정될 수 있기 때문이다. 기업들은 사용자가 이미 불안정한 상태에서 AI를 이용했을 가능성을 주장할 것으로 보인다.
그러나 스탠퍼드대 연구 결과는 챗봇이 비교적 무해한 생각을 위험한 집착으로 발전시키는 데 일정한 역할을 할 수 있음을 시사한다. 챗봇은 항상 접근 가능하며 사용자를 긍정하도록 설계된 반면, 실제 인간 관계처럼 상황을 객관적으로 판단하거나 개입할 능력은 제한적이다.
한편 이러한 논의는 정책 환경과도 맞물려 있다. 도널드 트럼프 행정부는 AI 규제 완화를 추진하고 있으며, 일부 주 정부가 AI 기업 책임 강화를 추진할 경우 법적 대응 가능성도 제기되고 있다.
연구진은 데이터 접근 제한과 윤리적 문제로 인해 관련 연구 자체가 쉽지 않다고 지적한다. 그럼에도 AI의 안전성을 높이기 위해서는 이러한 연구가 확대되고, 산업 전반이 그 결과를 적극적으로 반영할 필요가 있다는 목소리가 나온다.
The post AI의 무조건적 지지, 사용자 망상 키우는 ‘독’ 된다 – 스탠퍼드대 연구 appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.