페이지 안내

연구

연구성과

연구성과

전기정보공학부 윤성로 교수 연구팀

한글을 더 바르게 구사하는 인공지능 학습용 데이터셋 발표

2021.10.12

- 한국어 언어 모델의 사회적 편향 진단을 위한 데이터셋
- 바른 한글을 구사하는 인공지능 개발을 위한 의미 있는 첫걸음 기대

▲ 본 연구를 진행한 서울대학교 윤성로 교수 연구팀 (이미지 출처: 서울대학교)
▲ 본 연구를 진행한 서울대학교 윤성로 교수 연구팀 (이미지 출처: 서울대학교)

서울대학교 공과대학(학장 이병호)은 전기정보공학부 윤성로 교수팀이 한글날을 맞아 9일(토) 한국어 언어 모델의 사회적 편향(social bias) 진단을 위한 데이터셋 K-StereoSet을 공개한다고 8일 밝혔다.

인공지능의 사회적 편향은 미래 인공지능 연구에서 전 세계적으로 중요한 키워드로 대두되고 있다.

국내의 경우, 올해 초 인공지능 기반 한국어 챗봇인 ‘이루다’로부터 성소수자, 인종, 장애인 등에 대한 차별 및 혐오성 표현이 발견되어 화제가 된 바 있다. (하단 그림 참조) 이러한 문맥에서, 최근 대통령직속 4차산업혁명위원회와 과학기술정보통신부가 인간성(humanity)을 위한 인공지능(artificial intelligence, AI)의 3대 원칙 중 하나로 ‘인간의 존엄성 원칙’을, 10대 핵심요건 중 하나로 ‘다양성 존중’을 제시하였을 만큼 윤리적인 인공지능에 대한 중요성이 커지고 있다.

▲인공지능 기반 한국어 챗봇 ‘이루다’에서 포착된 성소수자 혐오 발언 (이미지 출처: 온라인 커뮤니티)
▲ 인공지능 기반 한국어 챗봇 ‘이루다’에서 포착된 성소수자 혐오 발언 (이미지 출처: 온라인 커뮤니티)

그럼에도 최근까지도 자연어 처리(natural language processing) 분야의 근간이 되는 인공지능 기반 한국어 언어 모델에 대한 연구가 활발히 이루어지고 있으나, 이들의 사회적 편향을 진단할 수 있는 수단은 여전히 부족한 실태이다.

이런 문제의식 하에 윤성로 교수팀이 이번에 공개하는 K-StereoSet은 영어 언어 모델의 사회적 편향을 진단하기 위해 MIT에서 공개한 ‘StereoSet’의 개발셋(development set)을 기반으로 한국적 현실에 맞추어 보완 개발한 것으로 향후 지속적으로 확장될 예정이다. 약 4,000개의 샘플로 구성된 원본 데이터셋은 먼저 네이버 파파고 API를 통해 1차적으로 번역한 후 다수의 연구원이 독립적으로 번역 내용을 검수하였고, 원래의 샘플 양식과 취지를 보존하도록 후처리(post-processing)를 진행하여 구축되었다.

▲ 문장 내(intrasentence) 편향 진단 테스트와 문장 간(intersentence) 편향 진단 테스트 샘플 (이미지 출처: 서울대학교 윤성로 교수 연구팀)
▲ 문장 내(intrasentence) 편향 진단 테스트와 문장 간(intersentence) 편향 진단 테스트 샘플 (이미지 출처: 서울대학교 윤성로 교수 연구팀)

데이터 내 사회적 편향의 분야는 성별, 종교, 직업, 인종 총 네 가지 항목으로 구성되어 있으며 편향성 진단을 위한 샘플 양식은 두 개의 카테고리로 분류되어 있다.

첫 번째는 문장 내 편향 진단 테스트를 위한 ‘intrasentence’ 양식이다. (위 이미지 왼쪽 예시 참조)

빈칸 처리된 문장이 주어졌을 때 빈칸에 채워질 내용으로서 세 개의 보기 중 어느 것에 높은 점수를 부여하는지를 이용하여 진단한다. 예를 들어, 위의 왼쪽 예시처럼 한 문장 안에서 ‘심리학자’라는 직업의 사람이 ‘독선적’이라는 편향을 가지고 있는지를 확인할 수 있다.

두 번째는 문장 간 편향 진단 테스트를 위한 ‘intersentence’ 양식이다. (위 이미지 오른쪽 예시 참조) 앞 문장(context)이 주어졌을 때 다음 문장으로서 세 개의 선택지가 주어지며 이들 중 어떤 문장에 높은 점수를 부여하는지를 이용하여 진단한다. 예를 들어, 위의 오른쪽 예시처럼 사람이 ‘히스패닉’이라는 문맥이 주어졌을 때, 다음 문장에서 그 사람이 ‘불법적인 시민’이라는 편향을 가지고 있는지 확인할 수 있다.

연구를 주도한 송종윤 연구원은 “문장 내 편향 진단 샘플 중 ‘unrelated’ 라벨에 해당하는 문장은 문맥과 전혀 관계없는 단어가 빈칸에 들어가기 때문에 자동 번역 시 원문의 의미를 벗어나기 쉽다. 또한 문장 간 편향 진단 샘플의 보기 문장들은 context 문장을 고려하지 않는 경우가 발생하는 등의 특수한 상황들에 유의하며 변환을 진행했다”라고 덧붙였다.

연구 책임자인 윤성로 교수는 “인공지능 기반의 한국어 언어 모델이 고도화되고 사업화될수록 윤리성 확보 및 편향성 제거를 위한 노력이 핵심적이며, 한글날을 맞이하여 보다 바른 한글을 구사하는 인공지능 기술 개발을 위해 K-StereoSet이 작지만 의미 있는 첫걸음이 되기를 기대한다”라고 전하였다.

[문의사항]
서울대학교 공과대학 전기정보공학부 윤성로 교수 / 02-880-1406 / sryoon@snu.ac.kr