[Data Privacy] 차등 프라이버시 (ε-Differential Privacy): Neighboring dataset, DP의 수학적 정의와 의미

2025. 3. 28. 10:00· Computer Science/Data Privacy
목차
  1. ✅ Neighboring dataset
  2. ✅ DP의 수식적 정의
  3. ✅ O는 "출력값의 집합"
반응형

🌏 차등 프라이버시 (ε-Differential Privacy)

데이터셋 D=(x1,x2,…,xn) 이 있고, 이로부터 어떤 통계값 f(D)를 공개하고 싶다고 가정합니다. 그런데 직접 f(D)f(D)를 공개하면 개인정보가 유출될 수 있기 때문에, 노이즈를 섞는 방법(무작위화, randomization)을 사용합니다.

✅ Neighboring dataset

  • D와 D′는 단 한 사람의 데이터만 다른 데이터셋이라고 가정합니다. 아래와 같이 n번 데이터 하나만 다르고 1~n-1 의 데이터는 모두 같습니다.

  • 이 둘을 neighboring datasets라고 부릅니다.

✅ DP의 수식적 정의

어떤 메커니즘 M이 다음을 만족하면, 이를 ε-차등 프라이버시라고 부릅니다.

 

  • ε은 프라이버시 손실 허용 정도를 의미하는 파라미터입니다.
    • 작을수록 더 높은 프라이버시 보장
  • M(D)은 노이즈를 섞은 통계값을 의미합니다. (예: f(D)+Z)

✅ O는 "출력값의 집합"

여기서 O는 무작위 메커니즘 MM의 출력값 중 어떤 특정한 "결과 집합"을 의미해요.

"메커니즘 M의 출력이 이 집합 O에 속할 확률"을 나타냅니다.

예를 들어서, M(D)는 "평균 키"를 출력하는 메커니즘이고, 그 값에 라플라스 노이즈가 섞여 있다고 해봅시다.

 

"노이즈가 섞였을 때, 결과가 168cm~172cm 사이에 나올 확률은 얼마일까?"

 

이런 경우, O=[168,172] 라고 두고,

 

 

이렇게 생각하면 됩니다.

 

차등 프라이버시의 핵심은 "어떤 결과 집합이든, 그 안에 결과가 들어갈 확률이 두 이웃 데이터셋 D, D'에서 크게 다르지 않아야 한다"는 것입니다.

  • 즉, 누군가의 데이터가 바뀌었다고 해서 어떤 특정한 결과 집합에 포함될 확률이 급격히 달라지면 안 됩니다.
  • 그래서 모든 가능한 출력 집합 O에 대해 이 확률 비율을 제한합니다

 

도움이 되었다면, 공감/댓글을 달아주면 깃짱에게 큰 힘이 됩니다!🌟
비밀댓글과 메일을 통해 오는 개인적인 질문은 받지 않고 있습니다. 꼭 공개댓글로 남겨주세요!

 

반응형
저작자표시 비영리 변경금지

'Computer Science > Data Privacy' 카테고리의 다른 글

[Data Privacy] Reconstruction Attack: 재구성 공격이란? 랜덤을 사용해 가장 쉽게 막는 방법  (0) 2025.03.27
  1. ✅ Neighboring dataset
  2. ✅ DP의 수식적 정의
  3. ✅ O는 "출력값의 집합"
'Computer Science/Data Privacy' 카테고리의 다른 글
  • [Data Privacy] Reconstruction Attack: 재구성 공격이란? 랜덤을 사용해 가장 쉽게 막는 방법
깃짱
깃짱
연새데학교 컴퓨터과학과 & 우아한테크코스 5기 백엔드 스타라이토 깃짱
깃짱코딩연새데학교 컴퓨터과학과 & 우아한테크코스 5기 백엔드 스타라이토 깃짱
반응형
깃짱
깃짱코딩
깃짱
전체
오늘
어제
  • 분류 전체보기
    • About. 깃짱
    • Weekly Momentum
      • 2024
    • PROJECT
      • AIGOYA LABS
      • Stamp Crush
      • Sunny Braille
    • 우아한테크코스5기
    • 회고+후기
    • Computer Science
      • Operating System
      • Computer Architecture
      • Network
      • Data Structure
      • Database
      • Algorithm
      • Automata
      • Data Privacy
      • ETC
    • WEB
      • HTTP
      • Application
    • C, C++
    • JAVA
    • Spring
      • JPA
      • MVC
    • AI
    • MySQL
    • PostgreSQL
    • DevOps
      • AWS
      • 대규모 시스템 설계
    • frontend
      • HTML+CSS
    • NextJS
    • TEST
    • Industrial Engineering
    • Soft Skill
    • TIL
      • 2023
      • 2024
    • Linux
    • Git
    • IntelliJ
    • ETC
      • 日本語

블로그 메뉴

  • 홈
  • 깃허브

인기 글

최근 글

태그

  • 우테코
  • 컴포지션
  • 스트림
  • 우아한테크코스
  • 람다
  • 예외
  • lamda
  • 우아한테크코스5기
  • Composition
  • 우테코5기
  • 함수형프로그래밍
  • TDD
  • 람다와스트림
  • Stream
  • 레벨로그
  • OOP
  • 상속
  • 상속과조합
  • Java
  • 조합
hELLO · Designed By 정상우.v4.2.0
깃짱
[Data Privacy] 차등 프라이버시 (ε-Differential Privacy): Neighboring dataset, DP의 수학적 정의와 의미
상단으로

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.