Veriyi koruma için hazırlama
Aperta’ya (veya herhangi bir veri ambarına) yüklenecek verinin, yüklenmeden önce belli işlemlerden geçmesi ile ancak FAIR prensipleri işler olabilecektir [1]. Hattâ veriler daha toplanmaya başlanmadan bazı konuların dikkate alınması gerekmektedir. Bu bölüm, veri kürasyonu konusunda dikkat edilmesi gereken konuları açıklamaktadır [2, 3].
Dosyaların hazırlanması
Veriler konusundaki en temel prensip tutarlılıktır. Dosya adları tutarlı ve anlamlı olmalı, tercihen içeriğini yansıtmalı ve özel karakterler kullanılmamalıdır. Benzer şekilde değişken isimleri, kodlar ve kısaltmalar da anlamlı ve tutarlı olmalıdır. Tüm değişken ve değerlerin etiketlerinin de doğru ve tutarlı olduğundan emin olunmalıdır. Kontrol, test vs. için üretilmiş geçici veya göstermelik değişkenlerin silinmelidir. Tekrarlar ayıklanmalıdır.
Veri yüklenmeden önce ilgili lisans antlaşmasının ve Aperta’nın şartlarını sağlayıp sağlamadığı kontrol edilmelidir. Örneğin bazı verilerin anonimize edilmesi gerekiyor olabilir. Veri formatları da kontrol edilmelidir, bölüm 1.2’deki veri formatlarını kontrol edebilirsiniz. Veri formatını dönüştürmeniz gerekiyorsa, veri ve/veya üstveri kaybı olmadığından emin olmanız gerekir. Son olarak da, veriyi yüklemeden önce verinin tamam olduğundan emin olun ve tekrar kontrol edin.
Hassas ve gizli veriler
Hassas ve gizli veriler gerekli özen gösterildiğinde paylaşılabilir ve bilimsel camianın faydalanması sağlanabilir. Bunun için örneğin etik kuruldan çalışmanın başında buna uygun izin almanız gerekmektedir. Katılımcıların da verinin arşivleneceğinden ve paylaşılabileceğinden haber edilmesi gerekmektedir. Veriyi anonimize etmek araştırmacının sorumluluğundadır. Veri erişimini belli şartlarda sınırlamak da bir çözüm olabilir.
Dokümantasyon
Başka araştırmacıların veri setlerini kullanabilmesini için veri dokümantasyonunun verileri anlamak ve tekrar kullanabilmek için gerekli bilgiyi sağlaması gerekmektedir. Verinin ne anlama gelebileceğini açıklayan, nasıl toplandığını veya üretildiğini anlatan arkaplân bilgileri tekrarlanabilir bilimsel çalışmaların olmazsa olmazıdır.
Veri dokümantasyonu içinde:
- Değişken listesi
- Değişkenler ve anket formu arasındaki bağlar
- Kod kitabı veya veri sözlüğü
- Değişkenlerin açık ve net tanımları
- Ve diğer gerekli bilgiler olmalıdır.
Nitel Veri
- Nitel veriler için konu kılavuzu
- Veri listesi (mülakat numarası, yaş, cinsiyet, meslek, mülakat tarihi, mülakat yeri vb.) Ancak bu bilgiler verilirken anonimizasyon gerekliliklerine dikkat edilmelidir.
Anket dokümantasyonu
- Örneklem tanımlanmalı, katılımcıların nasıl bulunduğu ile detaylar eklenmelidir.
- Anket soruları (katılımcılara gösterilen kart, fotoğraf, video vb. gibi dosyalar varsa eklenmelidir)
- Rıza formları
- Mülakat kılavuzu
- Kodlama kılavuzu
- Anket değişkenleri ile ilgili bilgiler
Verileri hazırlama işi zaman alacaktır. Veri kalitesindeki düşüklük veya yüklemedeki hatalar ciddi sorunlara sebep olabilir. O yüzden projenin veya çalışmanın veri yöneticisi bu iş için gerekli zamanı ayırmalıdır.
Kaynaklar
[1] Wilkinson, M.D., Dumontier, M, Aalbersberg, I.J.J. et al. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3, p. 160018.
[2] UK Data Service. (2019). Preparing Data for Deposit.
[3] Wellcome Open Research. (2019). How to Publish: Data Guidelines. Wellcome Open Research.
* Bu sayfa Orta Doğu Teknik Üniversitesi Bilim ve Teknoloji Politikaları Bölümü öğretim üyesi Arsev Umur Aydınoğlu tarafından 2019 yılında hazırlanmıştır.