법에 막힌 AI 데이터 활용..."개인정보 보호법 등 법·제도 손질 시급"

입력 2025-11-26 15:50

  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

▲방성현 김앤장 법률사무소 변호사가 26일 국회에서 열린 'AI 대전환의 동력, 데이터 활용 입법 개선 과제'를 주제로 토론회에서 주제 발표를 하고 있다.
▲방성현 김앤장 법률사무소 변호사가 26일 국회에서 열린 'AI 대전환의 동력, 데이터 활용 입법 개선 과제'를 주제로 토론회에서 주제 발표를 하고 있다.

인공지능(AI) 경쟁력을 강화하기 위해 대규모 데이터의 활용을 확대할 수 있도록 법·제도를 손질해야 한다는 목소리가 커지고 있다. AI 학습에 투입되는 대규모 데이터가 전 세계 AI 패권 경쟁을 좌우하는 핵심 요소로 꼽히지만 동의 중심 구조의 개인정보보호법 등에 가로막혀 산업 발전을 저해한다는 지적이 제기된다.

스타트업얼라이언스는 26일 국회에서 'AI 대전환의 동력, 데이터 활용 입법 개선 과제'를 주제로 토론회를 개최했다. 'AI 대전환, 선언에서 실행으로' 정책 토론회 시리즈 중 첫 번째 행사다.

그간 AI 벤처·스타트업계에선 개인정보보호법과 저작권을 AI 비즈니스 성장을 가로막는 가장 큰 법·제도적 장애물로 지목해 왔다. AI 기술의 경쟁력이 그래픽처리장치(GPU) 확보보다 '어떤 데이터를, 얼마나 자유롭게 활용할 수 있는가'에 달려있는데도 데이터를 확보하기조차 어렵다는 게 공통적인 지적이다. 실제 스타트업얼라이언스가 9월 국내 AI 스타트업 101개 사를 대상으로 한 데이터 활용(확보·가공·학습) 과정의 어려움에 대한 조사에서 48.5%가 '개인정보보호법'을 AI 비즈니스 성장에 가장 제약이 되는 법·제도로 꼽았다. 이어 △AI 기본법(22.8%) △정보통신망법(14.9%) △저작권법(12.9%) 순으로 나타났다. 특히 개인정보 보호법상 가장 제약이 되는 부분은 '동의 기반 수집 원칙'이 꼽힌다.

이날 토론에 참석한 거대언어모델(LLM)을 개발하는 트릴리온랩스의 신재민 대표는 "개인정보보호법을 직접 적용받는 회사는 아니지만, 테라바이트 단위로 대규모의 웹 데이터를 수집하고 있다. 하지만 개인정보를 동의를 일일이 받을 수 없어 이를 필터링하는 작업을 거친다"라며 "자동 필터링을 통해 많은 정보가 삭제되면 약 절반의 데이터만 남는데, (법·제도적으로) 예외 조항이 있다면 사용할 수 있는 데이터의 양이 두 배로 늘어날 수 있을 것으로 본다"고 말했다. 신 대표는 "데이터를 필터링 작업 없이 치환하는 방식도 존재하지만 LLM 학습에 얼마나 악영향을 끼칠지는 확인되지 않고 있다"라며 "LLM의 학습은 본질적으로 인간이 생성한 자연스러운 데이터를 기반으로 학습돼야 한다"고 설명했다. 신 대표는 "수억, 수십억 건의 데이터에 대해 일일이 동의를 받는 건 불가능하다"고 재차 강조했다.

채용관리 솔루션을 제공하는 두들린 정일권 CPO는 "해외 스타트업의 경우 공개 데이터 등을 자유롭게 쓰지만, 우리는 활용할 수 없다"라며 "자체적으로 구축할까 했지만 GPU 8000장이 필요하다고 한다. 금액으로는 수십억~100억 원의 비용이 필요하다. 작은 기업이 감당하긴 어려운 규모"라고 토로했다. 이어 "상용 AI 서비스를 활용하는 방안을 추진했지만, 대부분이 외국 제품이어서 데이터의 국외로 이전돼야 하는 문제가 있다"고 부연했다.

개인정보 규제 체계를 AI 학습 단계에 적용하는 게 맞지 않는다는 지적도 제기됐다. 김현경 교수는 "학습 데이터 사용은 '인풋 단계'"라며 "개인정보보호법이 만들어진 이유는 기업이 개인을 식별하는 것을 규제하기 위해 만들어진 것인데, 인풋인 학습 단계에서는 식별을 위해 처리하는 게 아니다"라고 지적했다. 특히 김 교수는 유럽연합(EU)의 디지털 옵니버스 패키지 법안을 언급하며 "통과까지는 상당한 기간이 걸리겠지만, 민감정보 데이터셋에 대해 어느 정도 쓸 수 있도록 하고 있다. 또 비식별 데이터의 정의에 대해 그동안 엄격한 기준을 적용하던 것과 달리 '정보 주체가 재식별 수단을 보유하지 않으면 아예 개인 정보로 보지 않겠다'는, 굉장히 파격적인 개정안"이라고 설명했다. 그러면서"EU조차 이런 변화를 모색하고 있는 것을 볼 때 우리도 인풋 단계에서는 적어도 특정인을 식별하기 위한 목적으로 쓰는 게 아니면 개인정보보호법을 어느 정도 배제해야 하는 차원으로 고민해볼 필요가 있다"고 제언했다.

방성현 김앤장 법률사무소 변호사는 "국내에선 '정당한 이익이 정보 주체 권리보다 명백하게 우선해야 한다고 적고 있다"고 지적하며 법적 개선 방향에 대해 제언했다. 구체적으로는 공개된 개인정보에 대해선 별도의 법적 근거를 둬 활용도를 높이는 방식과 사업 개선 등을 목적하는 정보에 대한 예외 규정, 정당한 이익 요건 완화 등이다.

양청삼 개인정보보호위원회 개인정보정책국장은 "개인정보보호법의 목적은 보호뿐 아니라 적법한 처리를 전제로 한 법안"이라며 "다양한 처리 근거를 확충하는 방향으로 개인 정보 위원회에서 지속해서 개선을 검토하고 있다. 이어 AI 특례법과 관련해 "현재 심사 중"이라며 "'정당한 이익'과 관련한 부분도 법 개정이 필요하다고 본다. 관련 규정이 손질이 되면 웹에서 접근 가능한 다양한 정보 데이터들을 수집해 사용할 수 있게 될 것"이라고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • 쯔양·닥터프렌즈·닥터딩요와 함께하는 국내 최초 계란 축제 '에그테크코리아 2025' 개최
  • 달러가 움직이면 닭이 화내는 이유?…계란값이 알려준 진실 [에그리씽]
  • 정국ㆍ윈터, 열애설 정황 급속 확산 중⋯소속사는 '침묵'
  • ‘위례선 트램’ 개통 예정에 분양 시장 ‘들썩’...신규 철도 수혜지 어디?
  • 이재명 대통령 직무 긍정평가 62%…취임 6개월 차 역대 세 번째[한국갤럽]
  • 겨울 연금송 올해도…첫눈·크리스마스니까·미리 메리 크리스마스 [해시태그]
  • 대통령실 "정부·ARM MOU 체결…반도체 설계 인력 1400명 양성" [종합]
  • ‘불수능’서 만점 받은 왕정건 군 “요령 없이 매일 공부했어요”
  • 오늘의 상승종목

  • 12.05 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 136,239,000
    • -1.78%
    • 이더리움
    • 4,654,000
    • -1.94%
    • 비트코인 캐시
    • 846,500
    • -2.31%
    • 리플
    • 3,076
    • -4.53%
    • 솔라나
    • 203,900
    • -4.41%
    • 에이다
    • 644
    • -3.45%
    • 트론
    • 427
    • +2.4%
    • 스텔라루멘
    • 372
    • -1.85%
    • 비트코인에스브이
    • 30,600
    • -2.02%
    • 체인링크
    • 21,010
    • -3.45%
    • 샌드박스
    • 217
    • -4.82%
* 24시간 변동률 기준