고려대 NLP&AI 연구팀 (사진 왼쪽부터)이승윤, 이정섭, 강명훈

과학기술정보통신부가 정보통신기획평가원(주관), SK텔레콤(후원)과 함께 개최한 「ICT 챌린지 2023」에서 고려대 임희석 교수의 NLP&AI 연구실(이정섭, 강명훈, 이승윤)이 ‘KoCheckGPT:사내 보안강화를 위한 생성형 AI 탐지 기술’ 이라는 주제로 과학기술부장관상을 수상했다.

ICT 챌린지 2023 행사는 대학ICT연구센터지역지능화혁신인재양성  디지털 고급인재양성사업관련 연구기관의 연구 성과를 제고하고·박사생들  경쟁협업을 통해 실전 역량을 강화하기 위한  아이디어 경연대회로올해는 「디지털로 펼쳐갈 미래로의 도전」이라는 주제로 전국 28 대학 79 (263) 참여했다 가운데 고려대 NLP&AI 연구실은 작년에 이어 2년 연속 과학기술부장관상을 수상하는 쾌거를 이뤘다. 

고려대 연구팀은 기업 내에서 ChatGPT와 같은 초거대 언어모델의 활용으로 인해 발생하는 사내 민감정보의 유출을 방지하기위해 작성자료에 대한 생성모델의 개입여부를 판별할 수 있는 한국어 특화모델 KoCheckGPT를 제안하여 LLM의 시대에 걸맞은 실용적인 솔루션을 제공했다는 측면에서 우수성을 인정받았다.

최근 초거대 언어모델의 출현에 따라 기업 기밀정보 유출사례가 증가하면서 다수의 기업에서는 ChatGPT와 같은 상용 API의 활용을 금지하는 정책을 펼쳐왔으나, 현실적으로 이를 탐지하거나 억제하기위한 대응책은 전무한 실정이다.

연구진은 기업 문서에 특화된 판별기의 학습을 위해 AI허브에서 제공하는 행정문서, 요약문 및 레포트 등의 7가지 데이터셋을 기반으로 ChatGPT를 활용해 데이터셋을 구축했다. KoCheckGPT는 이를 기반으로 문장, 문서, 토큰 단위로 사전학습 모델을 미세조정하여 주어진 글의 생성여부를 탐지하도록 학습됐다. 

그 결과 KoCheckGPT는 한국어 하에서 시중에 알려진 탐지모델인 ‘제로지피티(ZeroGPT)’의 성능을 큰 폭으로 능가하는 것으로 확인됐다. 연구진은 동일한 검증 데이터셋을 기반으로 ChatGPT의 개입여부를 평가한 결과, 제로지피티는 54%의 정확도에 그친 반면 KoCheckGPT는 84%의 높은 정확도를 달성했다고 밝혔다. 이를 통해 연구진은 “KoCheckGPT의 기업 내 문서작성 시스템에 도입은 초거대 언어모델의 시대에 기업의 비밀 유출을 방지하고 경각심을 강화함으로써 사내 보안성을 강화하는 효과적인 수단이 될 것” 이라고 말했다.

임희석 고려대 NLP&AI 연구실 및 HIAI 연구소장(컴퓨터학과 교수)은 “기업관점에서 생성형 AI의 무분별한 사용은 사내 보안성 저해와 저작권 침해의 우려가 높다”며 “민감정보의 유출과 표절을 방지하기위한 실질적 대응책이 필요한 시점”이라고 말했다.


※관련기사: https://www.dailysmart.co.kr/news/articleView.html?idxno=77978