인공지능 테스트의 진화

연구원 팀이 최근 수행한 연구에서, 전통적인 튜링 테스트를 재정의하기 위해 참가자들을 사람, 1960년대 ELIZA AI 프로그램, GPT-3.5, 그리고 GPT-4와의 대화에 참여시켜 이들과 상호작용했습니다. 이 대화는 5분 동안 이어졌으며, 참가자들은 인간과 인공지능 대응체 사이를 구별하는 것을 도전했습니다.

결과는 참가자들이 경우의 54%에서 GPT-4를 사람으로 오인하는 것을 드러냈으며, 이는 AI 능력이 인간과 유사한 응답 같이 이치할 수 있게 발전했음을 보여줍니다. 대조적으로 미리 프로그래밍된 ELIZA 시스템은 시간당 22%로만 인간으로 인식되었으며, AI 모델에서 신경망 구조의 중요성을 강조했습니다. GPT-3.5는 50%의 인식률로 작동했고, 인간 참가자는 67%의 정확도로 뛰어났습니다.

유명한 AI 연구원인 넬 왓슨은 AI의 진화되는 본성을 강조하며, 기계들이 이제는 인간과 같이 타당한 사후 정당화를 구축하는 능력을 가졌다고 언급했습니다. 이로 인해 인공지능과 인간의 사고 사이의 선이 흐려지기 시작했습니다. 이 변화는 AI 시스템이 인간의 약점과 특이성을 전시하고, 이를 통해 미덕과 인간과 같은 특성을 보여주기 때문에 오게 되었습니다.

더 나아가, 과학자들은 튜링 테스트의 한계를 지적하며, 테스트 성공을 결정하는데 있어서 스타일과 사회적-정서적 요소가 발휘하는 중요한 역할에 주목했습니다. 이것은 지능에 대한 전통적인 시각과는 달리 현대 시대에서의 인간-기계 상호작용의 복잡성을 포괄적으로 평가하기 위해 지속적인 AI 테스트 방법론의 진화와 세련로운 정제의 필요성을 강조합니다.

Privacy policy
Contact