Araştırma verilerinin paylaşılması
Bir çalışmada kullanılan veriler çalışma tamamlandıktan sonra da varlığını sürdürebilir. Bunu mümkün kılan ise verilerin uygun bir biçimde paylaşımının sağlanmasıdır. Veri paylaşımının en önemli faydası, bu verinin toplanması için harcanan çabanın ve maliyetin tekrarlanmamasıdır. Veri paylaşımı konusu aynı zamanda verinin keşfi, veriye erişim, uzun dönemli koruma, lisanslama ve verinin tekrar kullanımı konularını da beraberinde getirir [1].
Araştırmacılar veriyi paylaşan (veriyi üreten) ya da paylaşılan veriyi kullanan (verinin tekrar kullanımını gerçekleştiren ikinci veri kullanıcısı) pozisyonunda olabilir [1, 2]. Veri paylaşımındaki paydaşlar veriyi üreten, veriyi ikincil veri olarak kullanan ve veri arşivleridir. Veri arşivleri verinin keşfini ve yeniden kullanılmasını sağlar. Bunun yanı sıra veriye atıf yapılmasına olanak verir [2].
Araştırma verilerinin paylaşılması kararı her zaman araştırmacının inisiyatifinde değildir. Fon sağlayıcı ya da yayıncı sözleşme gereği verilerin paylaşılmasını talep edebilir [3]. OECD’nin öncülüğü ile Araştırma verileri birçok fon sağlayıcı tarafından kamu malı olarak görülmekte ve dolayısıyla erişime açık olması ve gelecekte yeniden kullanımının mümkün kılınması gerektiği düşünülmektedir [1, 4]. Fon sağlayıcılar tarafından geliştirilen veri yönetim politikalarının bir çoğunda bu açık olarak ifade edilmektedir. Birleşik Krallık’taki araştırma fonlayıcıların, üniversitelerin, yayıncıların ve diğer paydaşların ortaklığında 2016 yılında oluşturulan Concordat on Open Research Data [5], UK Research and Innovation (önceki adıyla RCUK – Research Councils UK) tarafından geliştirilen Common Principles on Data Policy [6], BBSRC Veri Paylaşım Politikası [7], ESRC Araştırma Verileri Politikası [8], MRC Veri Paylaşım Politikası [9], NERC Veri Politikası [10], Wellcome Trust Veri, Yazılım ve Materyal Yönetimi ve Paylaşımı Politikası [11] incelendiğinde “araştırma verilerinin kamu malı olduğu” vurgusunun açık ve net bir biçimde yapıldığı görülmektedir. Fon sağlayıcıların veri paylaşımına verdikleri önem birçok önemli fon sağlayıcının ilgili politikalarını “veri yönetim politikasından” ziyade “veri paylaşım politikası” olarak isimlendirmesinden de anlaşılabilir. Hatta, NIH (National Institutes of Health) örneğinde, hibe başvurusu yapacak araştırmacılardan veri yönetim planının yanı sıra veri paylaşım planı da talep edildiği görülmektedir [12].
Araştırma verileri nasıl paylaşılır?
Verileri paylaşıma açmanın çeşitli yolları vardır. Bunlardan en ideal olanı veri merkezi ya da veri bankası olarak da bilinen veri arşivleridir (örneğin, UK Data Archive), ancak kurumsal arşivlerin arşivlerin de bu amaçla yaygın kullanımı söz konusudur. Öte yandan bir makaleye konu olan veriler makale ek dosyası olarak dergi web sitelerinde yayınlanabilmektedir (örneğin, Nature). Bir başka veri paylaşım yöntemi ise verilerin araştırmacılar arasında gayri resmi olarak karşılıklı kullanımıdır [13].
Araştırma verileri neden paylaşılmalı?
Araştırma verilerini paylaşmanın tüm paydaşlar açısından birçok faydası bulunmaktadır [1, 2, 3, 13, 14, 15]:
- Bilimsel araştırmayı ve tartışmayı teşvik eder. Verilerin paylaşımı araştırma sonuçlarının doğrulanmasına olanak sağlar. Doğrulama, araştırma yöntemlerinin iyileştirilmesi için bir fırsat sunar. Öte yandan verilerin yeniden toplanması için harcanacak çaba ve zaman bilimde ilerlemeye ve kalitenin artırılmasına kaydırılabilir.
- Fon sağlayıcı gereksinimleri karşılanmış olur. Yurt dışındaki birçok fon sağlayıcı (örneğin, Avrupa Komisyonu) politikaları gereği araştırma verilerinin paylaşımını zorunlu kılmaktadır.
- Fon sağlayıcı yatırım getirisini en üst düzeye çıkarır.
- Bilimsel etkiyi artırır. Bir çalışma kapsamında üretilmiş verilerin yeniden kullanımı ile söz konusu verileri üreten kişiye ve bu veriler üretilerek yapılan önceki çalışmalara atıf yapılır. Böylece söz konusu araştırmacının ve yaptığı çalışmaların görünürlüğü, kullanımı ve alanındaki etkisi artar.
- Bilimsel işbirliği fırsatları yaratır. Veriyi üretenler ve ikincil veri olarak kullananların birlikte yeni çalışmalar yapmasına olanak sağlayabilir.
- Veriyi üreten kişinin gelecekteki potansiyel kullanımları için verinin korunmasını sağlar. Veriyi üreten kişi veriyi bir başkasının kullanabileceği şekilde paylaşmak için hazırlarken veri ile ilgili tüm ayrıntılı bilgilere yer verecektir. Bu da yıllar sonra kendi verisini tekrar kullanmak istediğinde veriyi kolaylıkla anlamasını sağlar.
- Paylaşılan veriler eğitim/öğrenme amaçlı kullanılabilir. Aynı ya da benzer türde verilerele çalışacak kişiler (öğrenciler veya genç araştırmacılar) veri türü, formatı, veri toplama ve analiz yöntemleri ile ilgili ön bilgi elde edebilirler. Öte yandan mevcut verileri kullanarak yayınlanmış sonuçları yeniden üretmeye çalışmak etkin bir öğrenme yöntemi olarak kullanılabilir. Böylelikle belli bir analiz yönteminin gerçek veriler üzerinden öğretimi/öğrenimi sağlanabilir.
- Şeffaflığı ve hesap verebilirliği artırır.
- Fabrikasyon ve sahte veri üretimi gibi suistimallere karşı koruma sağlar.
Araştırmacıların verilerini paylaşmama/paylaşmak istememe nedenleri
Veri paylaşmanın yaygınlaştırılmasının önündeki en büyük engel veriyi üreten araştırmacıların bu konuda gösterdikleri direnci kırmanın zorluğudur. Bu dürencin temel sebepleri ise veri paylaşımı konusundaki bilgi eksikliği, korku, güvensizlik ve veri sahipliği konusunun anlaşılamamasıdır. Bunun yanı sıra bazen araştırmacıların verileri ile ilgili gösterdiği tevazu da paylaşmak istememe nedeni olabilmektedir [15]. Araştırmacıların verilerini paylaşmama nedeni olarak öne sürdükleri nedenler genellikle aşağıdaki gibi olmaktadır [14, 15]:
- Veri paylaşmanın zaman alması ve bunun için zaman ayıramamak,
- Veri paylaşmanın ek maliyetinin olması,
- Veri paylaşmanın bir faydasının olmaması,
- Verinin kontrolünü kaybetmek ve bunun bir risk olması,
- Başka bir araştırmacının veride hata bulma olasılığı,
- Başka bir araştırmacının verileri kullanarak çelişkili sonuçlara ulaşabilecek olması,
- Verilerin kötüye kullanılabilecek olması, veriden haksız fayda sağlayabileceği endişesi,
- Verinin gizli ya da hassas bilgi içermesi (örneğin, insanlardan toplanan sağlık bilgileri, kimlik bilgilerinin yer aldığı veriler), anonimleştirme işleminin zaman alıcı ve emek yoğun bir işlem olması,
- Verilerin araştırma sonunda paylaşılacağı bilgisinin katılımcıların araştırmaya dahil olma kararını etkilemesi,
- Veriyi üreten kişinin verilerinin kötü olduğunu, ilginç ve başkasının dikkatini çekecek bir yanının olmadığını düşünmesi,
- Verinin sahibinin kim olduğunun belirlenememesi (örneğin, ortak projeler, özel kuruluşlar tarafından finanse edilen araştırmalar),
- Veri paylaşımının teşvik edilmesi konusundaki eksiklik (veri paylaşan araştırmacıların uygun şekilde ödüllendirilmesi; makale, kitap vb. yayın türlerinde olduğu gibi akademik ilerlemede bir etkisinin olmaması.
Aklında bu gibi soru işaretleri olan araştırmacılar için bazı hatırlatmalar yapmakta fayda vardır. Bunlardan ilki bilimin iyileştirme ve düzeltmeler ile ilerlediğidir. Hata bulunabilmesi gibi sebeplerle verilerin paylaşılmaması ve saklanması bu ilerlemeyi sekteye uğratır ve yavaşlatır. Veriyi paylaşmanın çoğunlukla ek bir maliyeti yoktur ve zaman kaybına yol açmaz. Ek maliyet gerekiyorsa ve bunu sebebiyle birlikte belirtmeniz halinde, fon sağlayıcılar bu maliyeti karşılabileceklerini belirten maddelere politikalarında yer vermektedir. İyi bir araştırma ancak iyi yönetilmiş verilerle gerçekleştirilebilir. Dolayısıyla, paylaşım aşamasına gelindiğinde veri yönetim döngüsünün halihazırda büyük ölçüde tamamlanmış olması gerekir ki, bu da paylaşımın araştırmacının önemli bir zaman kaybına yol açmaz. Paylaşılan verilerin paylaşım sonrasında nasıl kullanıldığından paylaşan kişi sorumlu değildir. Veriler, lisansa rağmen ticari kazanç elde etmek amaçlı kullanıldıysa ticari amaçlı kullanım maddeleri uygulanabilir. Öte yandan, verilerin atıf yapılmadan kullanılması intihaldir ve bu kapsamda değerlendirilmelidir. Veriler insanlardan toplandıysa katılımcılar veri paylaşımı, kısıtlı erişim, anonimleştirme gibi konularla ilgili bilgilendirilmiş olmalıdır [15].
New York Üniversitesi Sağlık Bilimleri Kütüphanesi tarafından geliştirilmiş aşağıdaki videoda günlük yaşantımızda veri paylaşım yöntemleri ve veri paylaşma, veri isteme konusunda yaşanan sıkıntılar özetlemektedir [16].
Veri paylaşımı ile ilgili yasal süreçler, hak ve sorumluluklar
Verilerin lisanslanması: Veriler paylaşılırken, tekrar kullanımının nasıl gerçekleşmesi isteniyorsa verilerin buna uygun bir “açık lisans” ile lisanslanması gerekir. Açık lisans kullanmak, veri ile yapılabileceklerin ve yapılamayacakların daha net olarak anlaşılmasını sağlar [1]. Açık lisanlardan 6.2. Entellektüel mülkiyet hakları başlığı altında ayrıntılı olarak bahsedilmektedir.
Verilerin paylaşılmaması gereken durumlar: Veri paylaşımının özellikle paylaşan kişi açısından sıkıntı yaratacağı durumlar aşağıda üç madde halinde belirtilmektedir [1, 2, 3].
- Fikri mülkiyet haklarını veya ticari bir sözleşmeyi ihlal etme olasılığı varsa, verilerin finansal bir değerinin olması durumunda,
- Kişisel, hassas ve gizli verilerle ilgili etik sorunlar söz konusu olduğunda anonimleştirmenin yeterince gizlilik sağlayamadığı ya da mümkün olmadığı durumlarda, katılımcılara verilerin paylaşılacağını açık olarak ifade eden ve onaylarının alındığı aydınlatılmış onam imzalatılmamışsa,
- Veri sahibinin net olarak belirlenemediği durumlarda.
Veri sahibi paylaştığı/paylaşacağı verilere erişimi çeşitli şekillerde kısıtlayarak, kontrol altına alabilir. Yukarıda bahsedilen lisanslama bunu yapmanın en pratik yollarından biridir. Lisanslamaya ek olarak veri sahibi veriyi kullanmak isteyenlerden nasıl ve ne amaçla kullanacaklarını belirten yazılı bir açıklama yapmalarını isteyebilir. Ayrıca, yalnızca üst veriler yayınlanarak, verilerin tümüne erişim için e-posta yoluyla bağlantı kurulması istenebilir [3].
Kaynaklar
[1] MANTRA Research Data Management Training. (2018). Sharing, preservartion & licensing. Erişim adresi: https://mantra.edina.ac.uk/
[2] Coursera. (2019). Benefits of sharing, Research data management and sharing [Çevrimiçi ders videosu]. Erişim adresi: https://www.coursera.org/learn/data-management/lecture/IPZ0h/benefits-of-sharing
[3] University of Nottingham. (2019). Research data management, Sharing data. Erişim adresi: https://www.nottingham.ac.uk/fabs/rgs/research-data-management/data-sharing-and-archiving/sharing-data.aspx
[4] OECD. (2007). OECD principles and guidelines for access to research data from public funding. Erişim adresi: http://www.oecd.org/science/inno/38500813.pdf
[5] Concordat on Open Research Data. (2016). Erişim adresi: https://www.ukri.org/files/legacy/documents/concordatonopenresearchdata-pdf/
[6] UK Research and Innovation. (2019). Common principles on data policy. Erişim adresi: https://www.ukri.org/funding/information-for-award-holders/data-policy/common-principles-on-data-policy/
[7] BBSRC. (2017). BBSRC data sharing policy. Erişim adresi: https://bbsrc.ukri.org/documents/data-sharing-policy-pdf/
[8] ESRC. (2014). ESRC research data policy. Erişim adresi: https://esrc.ukri.org/files/about-us/policies-and-standards/esrc-research-data-policy/
[9] MRC. (2016). Data sharing policy. Erişim adresi: https://mrc.ukri.org/documents/pdf/mrc-data-sharing-policy/
[10] NERC. (2019). NERC data policy. Erişim adresi: https://nerc.ukri.org/research/sites/data/policy/data-policy/
[11] Wellcome Trust. (2017). Policy on data, software and materials management and sharing. Erişim adresi: https://wellcome.ac.uk/funding/guidance/policy-data-software-materials-management-and-sharing
[12] NIH. (2003). NIH data sharing policy. Erişim adresi: https://grants.nih.gov/grants/policy/data_sharing/index.htm
[13] van den Eynden, V., Corti, L., Woollard, M., Bishop, L. ve Horton, L. (2011). Sharing your data – Why and how. Managing and sharing data: UK Data Archive (s. 2-4) içinde. Erişim adresi: https://data-archive.ac.uk/media/2894/managingsharing.pdf
[14] Coursera. (2019). Challenges to sharing, Research data management and sharing [Çevrimiçi ders videosu]. Erişim adresi: https://www.coursera.org/learn/data-management/lecture/fEdTK/challenges-to-sharing
[15] Horton, L. (2016). Responses to common objections towards sharing research data. LSE Library Services. Erişim adresi: https://zenodo.org/record/61978#.XHE-n4gzbIU
[16] NYU Health Sciences Library. (2012). Data sharing and management snafu in 3 short acts [Video]. Erişim adresi: https://www.youtube.com/watch?time_continue=18&v=N2zK3sAtr-4
*Bu sayfa Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü araştırma görevlisi Güleda Doğan tarafından 2019 yılında hazırlanmıştır.