🌏 차등 프라이버시 (ε-Differential Privacy)데이터셋 D=(x1,x2,…,xn) 이 있고, 이로부터 어떤 통계값 f(D)를 공개하고 싶다고 가정합니다. 그런데 직접 f(D)f(D)를 공개하면 개인정보가 유출될 수 있기 때문에, 노이즈를 섞는 방법(무작위화, randomization)을 사용합니다.✅ Neighboring datasetD와 D′는 단 한 사람의 데이터만 다른 데이터셋이라고 가정합니다. 아래와 같이 n번 데이터 하나만 다르고 1~n-1 의 데이터는 모두 같습니다.이 둘을 neighboring datasets라고 부릅니다.✅ DP의 수식적 정의어떤 메커니즘 M이 다음을 만족하면, 이를 ε-차등 프라이버시라고 부릅니다. ε은 프라이버시 손실 허용 정도를 의미하는 파라미터입니다..
Computer Science/Data Privacy

🌏 Reconstruction Attack데이터 프라이버시의 보장은 오늘날 데이터 기반 시스템에서 가장 중요한 이슈 중 하나입니다. 그중에서도 재구성 공격(Reconstruction Attack)은 개인 데이터를 보호하는 데 있어 심각한 위협이 됩니다.이번 글에서는 이러한 재구성 공격이 어떻게 이루어지는지, 그리고 이를 막기 위해 랜덤성을 활용한 기법이 어떻게 작동하는지를 수학적으로 자세히 살펴보겠습니다.✅ Reconstruction Attack(재구성 공격)이란?개인 정보가 담긴 데이터를 그대로 공개하면 심각한 문제가 생길 수 있습니다. 각각의 정보를 직접 공개하지 않는다고 하더라도 통계만 가지고도 특정 데이터가 어떠한 데이터인지 알아낼 수 있다는 것이 문제입니다. 예를 들어서 2명의 몸무게 평균을 ..