정부, 3340만 건 ‘공공데이터 관문’ 연다...AI 경쟁의 승부처는 ‘속도’

입력 2026-01-28 16:07

기사 듣기
00:00 /
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

▲배경훈 부총리 겸 과학기술정보통신부 장관이 28일 오전 서울 종로구 정부서울청사 본관 영상회의실에서'제4회 과학기술관계장관회의' 를 주재하고 있다. (사진제공=과기정통부)
▲배경훈 부총리 겸 과학기술정보통신부 장관이 28일 오전 서울 종로구 정부서울청사 본관 영상회의실에서'제4회 과학기술관계장관회의' 를 주재하고 있다. (사진제공=과기정통부)

정부가 공공저작물 활용 규제를 대폭 완화하면서 ‘인공지능(AI) 속도전’에 본격적으로 나섰다. 3300만 건이 넘는 공공데이터를 AI 학습용으로 개방해 ‘데이터 병목’을 해소한다는 취지다. 대규모 공공데이터가 AI 학습에 자유롭게 활용되면서 국가 AI 경쟁력 강화에도 기여할 것으로 기대된다.

28일 과학기술정보통신부와 문화체육관광부는 ‘제4차 과학기술관계장관회의’에서 ‘공공저작물 인공지능(AI) 학습 활용 확대 방안’을 발표했다. 이날 문체부는 국가와 지자체, 공공기관이 보유한 공공저작물을 AI 학습용 데이터로 활발히 활용할 수 있도록 ‘공공저작물 자유이용 허락표시 기준(공공누리)’을 개정했다.

먼저, 공공저작물을 아무런 조건 없이 자유롭게 활용할 수 있는 공공누리 ‘제0유형’을 새롭게 도입했다. 제0유형은 공공저작물의 상업적 이용과 변경 이용이 모두 가능하다. 출처를 명시해야 하는 의무도 없어 대규모의 정보 처리가 필요한 AI 학습 환경에서 공공저작물을 더욱 원활하게 활용할 수 있을 것으로 기대된다.

AI 학습 목적으로 공공저작물을 자유롭게 활용할 수 있는 ‘인공지능(AI)유형’도 새롭게 마련했다. 공공저작물은 출처 표시, 상업적 이용금지, 변경 금지 등 3가지 기준에 따라 4개 유형으로 나뉜다. 상업적 이용이나 변경 이용이 허용되지 않던 공공저작물이라도 AI유형을 기존 공공누리 유형과 함께 표시하면 AI 학습에는 자유롭게 활용할 수 있다.

문체부는 '저작권법' 개정으로 공공저작물의 공공누리 표시를 의무화해 더 많은 공공저작물이 AI 산업 등 다양한 분야에 개방될 수 있도록 제도를 개선할 계획이다.

과기정통부에 따르면 지난해 12월 기준 공공데이터는 3340만 건에 달한다. 고품질의 데이터 확보가 쉽지 않은 AI 스타트업 등에게 특히 유용하다. 하지만 개별 저작물마다 출처를 명시해야 하는 등 기존 공공누리 이용 조건은 AI 학습에 적극적으로 활용하기 어려운 측면이 있었다. 이에 정부가 나서서 AI 성능 고도화의 핵심인 ‘데이터 관문’을 연 것이다.

국가대표 AI 정예팀은 지난해 9월 규제유예제도(규제샌드박스) 실증특례로 공공누리 제1·3유형 공공저작물 중 약 1100만 건을 AI 학습에 활용한 바 있다. 방대한 규모의 신뢰할 수 있는 데이터는 AI 성능과 직결된다. 글로벌 AI 모델 성능을 종합 평가하는 아티피셜 애널리시스(AA)는 최근 “한국이 AI 분야에서 명확한 세계 3고위 국가”라며 “정부 주도 AI 이니셔티브를 토대로 여러 기업들이 AI 프론티어 기술을 보유하고 있다”고 했다.

정부 또한 글로벌 AI 경쟁이 모델 성능과 GPU 확보를 넘어 ‘데이터 경쟁’으로 이동하고 있다는 것을 인식하고 있다. 이날 배경훈 부총리 겸 과학기술정보통신부 장관은 “AI 기술의 완성도뿐 아니라 변화의 속도 측면에서도 글로벌 경쟁이 본격화되고 있다”며 “AI 3강, 과학기술 5강 달성을 위해서는 지금보다 훨씬 더 속도감 있는 대응이 필요하다”고 말했다.

AI 업계에선 공공누리 유형 신설로 ‘AI 속도전 병목’을 풀 수 있을 것이란 기대감이 나온다. 봉강호 소프트웨어정책연구소 선임연구원은 “민간에서 수집할 수 있는 데이터 범위의 한계가 있으며 제공 속도도 기업마다 차이가 있다”며 “방대한 양의 공공데이터 활용이 가능해지면서 국내 AI 산업 발전과 연관 산업의 인공지능 전환(AX)이 촉진될 것”이라고 전망했다.

다만 공공데이터로 학습한 AI가 공공데이터와 매우 흡사하거나 동일한 산출물을 생성하는 경우의 저작권 문제가 생길 수 있어 사전 대비가 이뤄져야 한다는 지적도 제기된다. 한 AI 업계 관계자는 “원본과 유사한 산출물이 생성되지 않도록 하는 기술적 조치를 이행했지만 유사성에 대한 문제 제기가 나오면 어떻게 대응할 것인지가 모호하다”고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • ‘샤넬백 수수’ 김건희 징역 1년8개월…주가조작·여론조사 모두 무죄
  • 한파 언제까지…한국·일본·미국·러시아 '극단 날씨' 이유는? [해시태그]
  • 민희진 측, '뉴진스 탬퍼링' 의혹에 녹취록 꺼냈다⋯"대국민 사기극"
  • "내 건강 좌우하는 건 '돈'"…얼마 투자하나 보니 [데이터클립]
  • '검은 머리 미국기업'의 역설…쿠팡, 국내 규제 피하려다 외교 문제 키우나 [이슈크래커]
  • 체감 영하 20도 한파에 산업현장 '벌벌'…노동자 노리는 보이지 않는 위험 [냉동고 한파, 무너지는 산업현장]
  • 트럼프, 또 ‘TACO’ 전략?…관세 인상 발표 하루 만에 협상 시사
  • 성수품 '역대 최대' 27만t 공급…최대 50% 할인 [설 민생대책]
  • 오늘의 상승종목

  • 01.28 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 129,224,000
    • +0.34%
    • 이더리움
    • 4,369,000
    • +2.49%
    • 비트코인 캐시
    • 860,500
    • -0.86%
    • 리플
    • 2,788
    • +0.87%
    • 솔라나
    • 184,400
    • +1.65%
    • 에이다
    • 522
    • +1.95%
    • 트론
    • 424
    • -1.4%
    • 스텔라루멘
    • 305
    • +1.33%
    • 비트코인에스브이
    • 25,900
    • +0.08%
    • 체인링크
    • 17,290
    • -0.86%
    • 샌드박스
    • 182
    • -5.21%
* 24시간 변동률 기준