Anonimleştirme bireye ulaşılmasını sağlayan tüm tanımlayıcı bağlantıların veriden kaldırılması anlamına gelir [1]. Bununla birlikte tüm tanımlama yöntemlerinde olduğu gibi dolaylı tanımlayıcılar ve/veya ilgili veri kümelerine bağlantılar yoluyla bireyleri tanımlamak hala mümkün olabilir. Bu sebeple verilerin anonimleştirilmesi konusu tüm dünyada çeşitli tartışmalara konu olmaktadır [2, 3]. Buna rağmen araştırma verilerinin yönetimi süreçlerinde verilerin anonimleştirilmesi (anonymization) veya takma adlı hale getirilmesi (pseudonymization) büyük önem taşımaktadır. Anonimleştirme ile takma adlı hale getirme arasındaki temel fark Tablo 1’de gösterildiği gibidir.

Tablo 1. Anonimleştirme ve takma isim kullanarak revize etme örnekleri

İsim Anonimleştirme Takma isim kullanma
Yılmaz, E anonim P31Y7
Şahin, D n/a Z41G9
Turan, H anonymous C98K9
Yetkin, S xxx H45B7


Anonimleştirme sürecinde yazara ilişkin hiçbir bilgi tutulmazken, takma isim kullanımında adlandırma araştırmacı tarafından üretilen takma isimlerle yapılır. Bu sayede bireyin gizliliği korunarak birden fazla veri kümesinde tanımlanmış verilerin aynı kişiye bağlanması olanaklı hale gelir [4].

Araştırma katılımcılarının kimliklerinin korunabilmesi için verilerin anonimleştirilmesi sürecinde;

  • Anonimleştirmenin kombinasyon halinde bir bireyi tanımlayabilen doğrudan ve dolaylı tanımlayıcıları veriden kaldırmak anlamına geldiği,
  • Araştırmanın henüz tasarım aşamasında anonimleştirme sürecinin planlanması gerektiği,
  • Gerektiğinde otomatik anonimleştirme araçlarının (Cornell Anonymization Toolkit veya ARX gibi) kullanılabileceği,
  • Anonim veri paylaşmanın dahi sorun yaratabileceği durumlarda kontrollü erişim ortamları veya sınırlayıcı lisansların kullanılabileceği gibi konuların büyük titizlikle değerlendirilmesi ve uygulanması gereklidir [5].

Anonimleştirilmesi gereken bilgileri iki gruba ayırmak mümkündür: doğrudan ve dolaylı tanımlayıcılar. Bu tanımlayıcılara ilişkin örnekler Tablo 2’de sunulmaktadır.

Tablo 2. Verilerin anonimleştirilmesi sürecinde doğrudan veya dolaylı kişisel veriler [6]

Doğrudan tanımlayıcılar Dolaylı tanımlayıcılar
İsimler
İsim baş harfleri
Posta adresleri
Telefon numaraları
e-posta adresleri
Sosyal güvenlik numarası veya ehliyet numarası gibi tekil numaralar
Araç numaraları (şasi numarası gibi)
Tıbbi cihaz tanımlayıcıları
Web veya IP adresleri
Biyometrik veriler
Kişi fotoğrafları
Ses kayıtları
Akraba isimleri
Bireye özgü tarihler (doğum tarihi, evlilik tarihi gibi)
Tıbbi tedavi yeri veya doktor adı
Cinsiyet
Nadir hastalıklar veya tedavileri
Yasa dışı uyuşturucu kullanımı veya diğer riskli davranışlar gibi hassas veriler
Doğum yeri
İş yeri, meslek, yıllık gelir, eğitim gibi sosyo-ekonomik veriler
Posta kodu gibi genel coğrafi göstergeler
Etnik köken
Doğum yılı veya yaşı
Sözlü cevaplar veya transkriptler


Farklı tipteki tanımlayıcılar için anonimleştirme süreçlerinde uygulanması gereken adımlar ise Tablo 3’te sunulmaktadır.

Tablo 3. Farklı tipte tanımlayıcılar için anonimleştirme uygulamaları [7]

Kaynakça

[1] The University of British Columbia. (2018). Data anonymization. Erişim adresi: https://researchdata.library.ubc.ca/share/anonymize-and-de-identify/data-anonymization/

[2] Roy, M. Data anonymization techniques less reliable in era of big data. Erişim adresi: https://searchcompliance.techtarget.com/feature/High-dimensional-info-complicates-data-anonymization-techniques

[3] Leetaru, K. (2016). The big data era of mosaicked deidentification: Can we anonymize data anymore? Forbes. Erişim adresi: https://www.forbes.com/sites/kalevleetaru/2016/08/24/the-big-data-era-of-mosaicked-deidentification-can-we-anonymize-data-anymore/#2cfb556c3f1e

[4] The University of British Columbia. (2018). Data pseudonymization. Erişim adresi: https://researchdata.library.ubc.ca/share/anonymize-and-de-identify/data-pseudonymization/

[5] LSE. Anonymisation and data protection. Erişim adresi: http://www.lse.ac.uk/library/research-support/research-data-management/anonymisation-and-data-protection

[6] Stanford Libraries. Sharing sensitive data. Erişim adresi: https://library.stanford.edu/research/data-management-services/share-and-preserve-research-data/sharing-sensitive-data

[7] Data Management Guidelines. (2018). Anonymisation and personal data. Erişim adresi: https://www.fsd.uta.fi/aineistonhallinta/en/anonymisation-and-identifiers.html

*Bu sayfa Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü öğretim üyesi Zehra Taşkın tarafından 2019 yılında hazırlanmıştır