티사이언티픽, 개인정보 익명화 한계 분석 논문 ACL 2026 채택…“AI 보안 사업 확대”

입력 2026-05-19 08:59

김우람 기자

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

기사 듣기

00:00 /

가장작게
작게
기본
크게
가장크게

생성형 인공지능(AI) 확산과 함께 개인정보 보호 중요성이 커지는 가운데 기존 익명화 기술 한계를 지적한 국내 연구 성과가 세계 최고 권위 자연어처리 학회에서 공식 인정받았다. 티사이언티픽은 이번 연구 성과를 기반으로 AI 보안 전문기업 전환에 속도를 낸다는 전략이다.

AI 기반 정보기술(IT) 보안·프라이버시 전문기업 티사이언티픽은 자사 AI랩 연구진 논문이 자연어처리(NLP) 분야 최고 권위 학회인 ‘ACL 2026(Annual Meeting of the Association for Computational Linguistics)’ 메인 컨퍼런스에 채택됐다고 19일 밝혔다.

이번 성과는 전 세계 약 1만2000편 논문 가운데 약 19%만 통과한 심사를 거쳐 이뤄졌다. 연구는 연세대학교 김한샘 교수 연구팀과의 산학 협력으로 진행됐다.

채택 논문인 ‘현실적 텍스트 익명화 평가를 위한 주체 수준 추론(Subject-level Inference for Realistic Text Anonymization Evaluation)’은 기존 개인정보 익명화 기술 구조적 한계를 실증적으로 분석한 연구다.

연구진은 텍스트의 90% 이상을 비식별화 처리하더라도 개인정보 주체 보호율은 약 33% 수준에 불과하다는 결과를 도출했다. 이는 공격자 관점에서 개인정보 약 65% 이상이 여전히 추론 가능하다는 의미로, 유럽 일반개인정보보호법(GDPR)과 국내 개인정보보호법 강화 흐름, 생성형 AI·거대언어모델(LLM) 학습 데이터 안전성 논의에도 중요한 시사점을 제공한다고 회사 측은 설명했다.

연구진은 이를 해결하기 위한 새로운 평가 체계인 ‘주체 수준 개인정보 추론 평가(SPIA)’ 벤치마크도 제안했다. 기존 단어·문구 중심 익명화 평가와 달리 문서에 등장하는 개인정보 주체 단위로 재식별 위험을 평가하는 방식이다.

단순히 개인정보 표현이 가려졌는지 여부를 넘어, 익명화 이후에도 문맥 기반으로 특정 인물 정보를 얼마나 추론할 수 있는지를 평가하는 것이 특징이다. 이를 위해 연구진은 법률·온라인 분야 675개 문서와 1712명 개인정보 주체 정보를 포함한 데이터셋도 구축했다.

티사이언티픽은 이번 연구 성과를 기반으로 기존 보안 사업을 넘어 AI 보안 전문기업 전환을 가속화할 계획이다. 회사는 AI 기반 비정형 개인정보 탐지 솔루션 ‘P3R-프라이버시 파인더 AI(P3R-Privacy Finder AI)’에 SPIA 프레임워크와 개인정보 재식별 관련 지표를 단계적으로 통합할 예정이다. 또 올해 하반기에는 한국어 특화 LLM 기반 탐지 기능을 이미지·음성·영상까지 확장한 차세대 멀티모달 버전도 출시할 계획이다.

이와 함께 개인정보보호위원회·한국인터넷진흥원(KISA) 주관 ‘2025년 신뢰기반 AI 개인정보 보호 활용 연구개발(R&D) 사업’에도 참여 중이다. 티사이언티픽은 월드버텍·연세대학교 산학협력단과 컨소시엄을 구성해 멀티모달 AI 기반 개인정보 탐지·추적·비식별화 기술 개발 과제를 수행하고 있다.

오명석 티사이언티픽 AI랩 전임연구원은 “이번 연구는 데이터가 아닌 사람 중심으로 개인정보 보호를 재정의한 결과물”이라며 “생성형 AI 및 LLM 학습 데이터를 다루는 기업들의 재식별 위험 관리 중요성이 더욱 커질 것”이라고 말했다.

이어 “SPIA 프레임워크를 기존 제품에 통합하고 이미지·음성·영상까지 대응 가능한 멀티모달 개인정보 보호 기술 상용화를 추진해 AI 보안 전문기업으로 도약할 계획”이라고 덧붙였다.

한편 티사이언티픽은 AI·빅데이터 기반 IT 모니터링 및 정보보안 솔루션을 제공하는 코스닥 상장사다. AI 기반 개인정보 탐지·비식별화 솔루션과 네트워크 위협 탐지 및 대응(NDR), 통합관제 솔루션 등을 보유하고 있다.