한국 특화 안전성 평가체계 마련…글로벌 AI 검증 경쟁 본격화
[KT 제공. 재판매 및 DB 금지]
(서울=연합뉴스) 박형빈 기자 = KT[030200]가 고려대와 공동으로 한국형 멀티모달 대형언어모델(MLLM) 안전성 평가 벤치마크 'KSAFE-MM'을 공개했다고 16일 밝혔다.
'KSAFE-MM'은 글로벌 공통 리스크를 한국 문화 맥락으로 변환한 'KSAFE-MM-G'와 전세 사기, 독도 분쟁과 같은 한국 사회 고유의 이슈를 반영한 'KSAFE-MM-C'로 구성된다.
총 1만4천135개의 평가 샘플로 구성된 국내 최대 규모 한국어 멀티모달 안전성 평가 데이터셋으로, 젬마와 하이퍼클로바 X 등 12개 MLLM을 검증했다.
특히 민감 주제 수집부터 질의 생성, 합성 이미지 제작, 탈옥 질의 생성까지 전 과정을 자동화한 4단계 파이프라인을 구현한 것이 특징이다.
KT와 고려대 연구진은 동일한 방식을 일본어에 적용한 실험을 통해 다른 문화권으로의 확장 가능성도 확인했다고 설명했다.
업계에서는 AI 서비스 확산과 함께 안전성 검증의 필요성도 커져 국가·문화별 특성을 반영한 AI 평가 체계 구축 경쟁을 중요한 지점으로 보고 있다.
이번 연구 결과와 벤치마크는 아카이브와 허깅페이스에 공개돼 AI 서비스 안전성 검증과 레드팀 테스트 등에 활용될 전망이다.
이원희 보도본부/ 편집국장
기자
헤드라인 뉴스
한국매일뉴스 © 한국매일뉴스 All rights reserved.
한국매일뉴스의 모든 콘텐츠(기사 등)는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
RSS