본문 바로가기

문돌이 존버/데이터사이언스 윤리학

데이터 소유권, feat.코세라 데이터 사이언스 윤리학

반응형

데이터 소유

나에 관한 데이터는 내 것인가? 내가 당신 사진을 찍으면 당신이 나온 사진은 당신의 소유가 아니라 내 소유이다. 물론, 사진을 찍는 데에는 제한이 있다. 사적 공간, 즉 개인의 집이나 화장실에서 찍는 것은 허용되지 않는다. 찍은 사진을 사용하는 것도 제한이 있다. 은연중에 정치적 후보자를 지지하거나 명예를 훼손시키면 안 된다. 명예 훼손은 쉽게 말해 실제 본인이 하지 않았음에도 사진을 수정하여 마치 진짜 한 것처럼 만드는 과정에서 발생하는 것이다. 고의로 웃기게, 못생기게 나온 순간을 포착하여 찍는 사진도 명예 훼손에 해당된다.

상대방에 대한 기록도 남길 수 있는데 이 기록은 내 소유이고 사용할 권한을 가진다. 물론 사진과 같은 비슷한 제한을 가진다. 추천서나 gossip 같은 경우가 기록에 해당된다. 이때 해당 사람은 실험 대상자가 된다. 추천서와 gossip의 내용에 영향을 받기 때문이다. 

디지털화된 데이터는 문화를 보존할 수 있다. 종이 프린트로 된 자료들은 잃어버리면 끝이다. 고대 문자나 문화적 유물을 디지털화하려는 노력이 최근 많이 벌어지고 있다. 디지털화된 데이터는 문화를 전파할 수도 있다. 지역 도서관은 여러 권의 책이 존재하고 지역 사람들이 공유하며 지식을 습득하는 공간이다. 이제는 지역에 국한되지 않고 모든 사람들이 가상의 디지털 도서관을 이용하며 각종 도서를 읽으면 문화가 더욱 쉽게 전 세계로 퍼져 나갈 수 있다.

위키피디아나 트립 어드바이져와 같은 무료 서비스는 데이터를 소유할 권리가 없다. 모두 개개인의 의견이 모아져서 하나의 사이트를 이룬 것이기 때문이다. 사실 데이터를 반드시 소유할 필요는 없다. 모든 사람들의 지식이나 피드백이 모인 사이트를 운영한다면 사실상 수많은 데이터를 거의 공짜로 받고 있는 셈이다. 

상점에 CCTV가 있는데 사실 이는 우리가 동의하지 않은 것이다. 하지만 확실히 모두의 안전과 쾌적한 환경을 위해 사용된다. CCTV 영상을 대중에 공개하지 않도록 주의해야 한다.

얼마나 나에 대한 자료를 가져갈 수 있는지, 그것을 가지고 무엇을 할지를 주의 깊게 살펴야 한다. 우리는 사용 자체를 금지할 것이 아니라 어떻게 이용해야 할지를 규제하는 방안을 마련해야 한다. 우리의 데이터가 정부 감시에 쓰일 것이라는 의심도 해결할 수 있다. 하지만 정부 입장에서 보안과 관련해서 무슨 데이터가 필요하다고 딱 집어서 말할 수 없다. 따라서 모든 데이터를 수집해놓고 구체적 요구가 있거나 해결 방안을 강구할 때 일부 데이터를 활용하는 것이지 그 이외에는 보지 않는다. 이렇게 기록과 사용 규제를 구분하자는 논의가 진행 중이다. 

만약 다수의 개인 데이터를 보유하고 있는 회사가 파산하게 된다면? 그 데이터는 다른 회사에 팔아야 하나, 정부에게 넘겨주어야 하나, 아니면 파기시켜야 하나? 데이터가 남용될 소지가 많기 때문에 회사가 파산하면 반드시 데이터도 없애야 한다. 

케이스 스터디: ratemyprofessor.com

<출처: ratemyprofessor 홈페이지>

ratemyprofessor은 학생들이 교수의 수업을 듣고 평가하는 웹사이트이다. 학생들이 쓴 내용은 분명 교수와 관련된 것이지만 교수는 소유권이 없다. 주인은 바로 그 웹사이트의 개발자이다. 학생들이 악의를 품고 거짓된 정보를 올려 교수의 평판을 떨어뜨린다고 해도 교수는 사이트에 연락을 해 불만을 토로할 수 있어도 데이터를 없애진 못한다. 교수 입장에서는 나에 관해 학생이 쓴 정보를 제3자가 소유하는 상황이다. 제3자는 이 데이터를 팔거나 빌려줄 권한을 가진다. 

토론주제 : 아마존 Echo 데이터

<출처: 프라임데이딜>

이는 실제 일어난 사건으로 살인이 일어나던 현장에 아마존 Echo가 작동을 하고 있었다. 유일한 증거는 그 안에 담긴 용의자와 피해자의 음성 녹음이다. Echo가 계속 켜져 있었던 것으로 보아 그들이 말하는 것들이 아마존 시스템을 통해 저장되었을 것으로 예상된다. 이에 검찰은 아마존 회사에 그 데이터를 넘길 것을 요구했으나 아마존은 현행법에 따라 거부했다. 데이터 소유권은 누구에게 있는가? 아마존? 아마존 Echo를 구입한 사람? 영장을 청구하는 검찰?

또 생각해볼 것은 아마존 Echo 주인 말고도 당시 제3자의 대화가 담겨 있는데 이 데이터를 주인이 마음대로 사용해도 될까? 그 데이터의 주인은 제3자가 될 수 있는가?

 

728x90
반응형