오늘날의 AI는 데이터 없이는 존재할 수 없습니다. 챗GPT 같은 언어 모델, 이미지 생성 AI, 자율주행 차량, 헬스케어 AI까지 모든 시스템이 방대한 데이터를 기반으로 훈련되고 동작합니다. 데이터가 곧 경쟁력이자 자산인 시대입니다.
하지만 우리는 점점 중요한 질문과 마주하고 있습니다.
“AI가 학습한 데이터를 삭제할 수 있는가?”
“사용자가 원하지 않는 데이터가 모델에 남아 있다면 어떻게 할 것인가?”
“AI는 인간의 잊힐 권리를 침해하는가?”
이러한 질문은 AI 시대의 ‘데이터 폐기’라는 개념을 본격적으로 조명하게 만듭니다.
1. 데이터 폐기의 개념과 필요성
📌 데이터 폐기란 무엇인가?
- 단순 삭제(Delete): 사용자의 요청에 따라 데이터베이스에서 제거.
- 완전 삭제(Wipe/Destroy): 복구 불가능하도록 물리적 또는 논리적으로 파괴.
- 익명화(Anonymization): 개인 식별 요소를 제거해 데이터 활용은 가능하게 함.
❗ AI 모델의 학습 데이터는 삭제 가능한가?
기존 데이터베이스와 달리 AI는 데이터를 "학습해 내부화"합니다. 이는 삭제 요청 시 단순한 제거가 아닌, 모델의 재훈련이나 Selective Unlearning 같은 기술이 필요함을 의미합니다.
⚖️ 법적·윤리적 고려사항
- GDPR(유럽 일반 개인정보보호법): ‘잊힐 권리(Right to be forgotten)’ 명시
- 한국 개인정보보호법 개정안: 자동화된 의사결정에 대한 설명 및 정정·삭제 권리 강조
- 윤리적 이슈: 차별적 데이터의 지속 학습, 알고리즘 공정성 침해 등
2. 기술적 구현과 한계
🧩 AI 모델에서의 삭제 기술
- Unlearning: 특정 데이터가 모델에 미친 영향을 제거하는 과정
- Selective Forgetting: 특정 범위의 지식만 지워 AI 성능에 최소한의 영향을 주도록 설계
⚙️ 한계점
- 완벽한 제거가 어려워 불완전한 삭제 가능성 존재
- 삭제로 인한 성능 저하, 지식 왜곡 등 부작용
- 대규모 모델의 경우, 재학습 비용과 시간이 막대
3. 주요 사례 및 정책 변화
🌍 글로벌 빅테크 기업의 대응
- Google: 사용자 기록 삭제 기능 강화, 일부 AI 학습에서 데이터 제외 옵션 제공
- Meta (Facebook): 개인정보 보호 기준 강화, 모델 재학습 기능 연구
- OpenAI: 사용자의 요청 시 대화 기록 미보관 설정 제공
- Microsoft: Azure 기반 기업 AI 서비스에서 삭제·익명화 기능 제공
📜 주요 정책 및 규제
지역/국가 | 주요 정책 |
🇪🇺 EU | AI Act (2024년 초안), 설명가능성과 삭제권 강조 |
🇺🇸 미국 | FTC, AI 데이터 오용에 대한 제재 강화 |
🇰🇷 한국 | AI 윤리 기준 가이드라인, 자동화된 처리에 대한 통제권 강화 추진 |
⚖️ 주요 사례
- EU 법원: “검색 엔진이 사용자 정보 삭제 요청을 수용할 의무 있다” 판결
- 한국 법원: AI 챗봇의 부적절한 학습 데이터로 인해 정보 삭제 및 배상 판례
4. 수혜 기업 및 투자 전망
🔍 데이터 폐기 및 보안 관련 수혜 기업
유형 | 기업명 | 주요 기술 및 서비스 | AI 데이터 폐기 시장 수혜 요인 |
🔐 데이터 보안 및 삭제 솔루션 | 데이터텍 (DATATEK) |
- 국가정보원 인증 ‘EDE’ 완전삭제 솔루션- 하드웨어·소프트웨어 기반 삭제 장비 | - AI 운영 및 학습 데이터의 완전한 삭제 필요- 공공기관 및 민간 기업 레퍼런스 확보 |
지란지교데이터 | - 개인정보 비식별화/마스킹 솔루션- 데이터 보호·활용 기술 | - AI 학습용 데이터의 개인정보 보호 강화- AI 규제 대응 위한 기술 수요 증가 | |
제이슨, 라온시큐어 등 | - DRM, DLP, 접근제어, 제로트러스트 보안 | - AI 인프라 보안 강화 수요- AI 폐기 포함한 통합 보안 전략의 필요성 | |
☁️ 데이터센터 및 클라우드 인프라 | SK 그룹 (SKT, SK C&C, SK렌터카) | - AI 데이터센터 및 클라우드 운영- 이너버스 인수 통한 ITAD 사업 진출 | - 대규모 AI 인프라 운영으로 인한 폐기 수요 급증- 그룹차원 ESG·데이터 라이프사이클 관리 전략 |
KT, KT Cloud | - IDC·코로케이션 운영- AI 전용 클라우드 서비스 | - AI 확산과 함께 클라우드 내 불필요 데이터 폐기 수요 증가 | |
LG유플러스 | - 기업용 클라우드 및 IDC 서비스 | - AI 솔루션 확장에 따른 데이터 폐기 인프라 구축 필요 | |
네이버클라우드 | - AI 개발 플랫폼 (CLOVA 등)- 클라우드 컴퓨팅 (NBP) | - AI 학습 및 운영 중 생성되는 데이터 정리·폐기 기술 중요성 확대 | |
카카오클라우드 | - 클라우드 기반 AI 서비스 인프라 | - AI 서비스와 데이터 보안·폐기 솔루션 통합 수요 증가 | |
🧠 AI 데이터 가공 및 학습 데이터 관리 | 크라우드웍스 | - AI 학습용 데이터셋 가공 플랫폼- 프로젝트형 라벨링 | - 모델 폐기 또는 데이터셋 업데이트 시, 과거 데이터 정리 수요 증가 |
셀렉트스타 | - AI 학습용 데이터 수집·가공- 데이터 정제 및 평가 서비스 | - 데이터 라이프사이클 후반기(폐기 단계)의 보안/정화 수요 대응 |
💸 벤처 캐피탈 및 투자 동향
- 앤드리센 호로위츠(a16z), 세쿼이아, 소프트뱅크 등
AI 데이터 관리 및 프라이버시테크(PrivacyTech) 분야에 활발히 투자 중. - 최근 Sims Recycling, Blancco 등 폐기 전문기업 M&A 및 PE 투자 증가
📌 결론: 앞으로의 과제와 제언
🛠️ AI 기업의 필수 전략: 데이터 생애주기 관리
- 획득 → 저장 → 처리 → 보관 → 폐기까지 전 주기 관리 체계 마련 필수
- AI 학습 시, ‘삭제 가능한 데이터’ 기반 모델 훈련 필요
🙋 사용자 중심의 데이터 주권 보장
- 설명 가능한 AI(XAI)와 함께, 데이터 삭제·정정권 보장이 핵심
- 데이터 제공자는 관리 권한자로 인식되어야 함
- 정책적 준비: AI법 내 데이터 폐기 기준 명시
- 기술적 준비: AI Unlearning 기술 R&D 강화
- 산업적 준비: 데이터 폐기·보안 시장의 성장에 따른 전략적 투자 고려
”모든 투자의 책임은 자기 자신에게 있는 것을 명심하시고, 우리 함께 공부합시다.”
반응형