Bilimsel çalışmayı, bilimsel çalışma yapan tekrarlanabilir olmasıdır [1, 2]. Sonuçları tekrarlanamayan bir çalışmanın kıymeti olmayacaktır. Diğer taraftan bilimsel çalışmalar oldukça karmaşık süreçlerden oluşmaktadır. Tekrarlanmalarını kolaylaştıracak şey iyi dokümantasyondur. Kısaca dokümantasyon üstveri (veri hakkında veri) ve işlem üstverisinden (veriyi işlemek, manipüle ve analiz etmek için gerekli veri) oluşur. Verinin kökeni, temizlenmesi, ayıklanması, dönüştürülmesi vb. hep bu kapsam altındadır.

 

İş akışları

 

İşlem üstverisinin formel hâle getirilmesine iş akışı denir [3]. Yâni, bir projedeki tüm prosedürlerin açık ve kesin bir şekilde tanımlanmasıdır. İşletme biliminde de de sıklıkla kullanılan iş akışı, araştırma verileri yönetimi bağlamında verinin alınması, dönüştürülmesi ve analizi adımlarını içerir. İş akışının temelde üç bileşeni vardır:

 

  • Girdi, gereken bilgi ve materyaller
  • Çıktı, üretilen bilgi ve materyaller
  • Dönüştürme kuralları ve algoritmaları

 

Sıcaklık ve tuz oranı ile ilgili bir çevre bilimleri çalışması için informel bir iş akışı örneği verecek olursak [3]:

 

İlk girdiler ham sıcaklık ve tuz oranı verileridir. Bu veriler R yazılımına yüklenir. Bu işlemin çıktısı olan veri R formatındadır. Bu çıktı, bir sonraki aşama olan kalite kontrol ve veri temizleme adımları için girdi olacaktır. Bu adımın çıktısı ise “temizlenmiş” sıcaklık ve tuzluluk verisidir, ki analiz için de girdiyi oluşturmaktadır. Analizin çıktısı ise örneğin aylık ortalama ve standart sapma verisidir. Sonraki aşama da görselleştirme olabilir.

 

Şekil 1 – Sıcaklık ve tuz oranı verisi analizi için basit iş akışı

 

İş akışları birbirlerine eklemlenebilir ve böylece çok daha karmaşık bilimsel süreçlerin tanımlanması mümkün olur. Özellikle karmaşık iş akışlarını tanımlamak ve diğer araştırmacılarla paylaşmak için Kepler [4] veya VisTrails [5] gibi iş akışı yazılımlarından destek alınabilir.

 

Sonuç olarak, bilim daha bilgisayımsal hâle gelmektedir. Bu yüzden bilimsel süreçlerin de benzer şekilde dokümente edilmesi gerekmektedir. İş akışları, bilimsel süreçlerin detayları ortaya koyduğu, çıktıların tam olarak meydana geldiğini dokümente ettiği ve tüm karmaşık süreçleri (sensör ağlarından istatistik programlarına, farklı veri setlerinin entegrasyonundan veri görselleştirmeye, algoritmalardan otomazizasyona kadar) tek bir doküman ile ifade ettiği çok faydalıdır. Diğer biliminsanları ile bu süreçlerin bu detayda paylaşılması bilimsel ilerleminin önünü açacaktır.

 

Kaynaklar

 

[1] Baker, M. (2016). 1,500 scientists lift the lid on reproducibility. Nature News 533, 452–454.

 

[2] Goodman, S. N., Fanelli, D. & Ioannidis J. P. A. (2016). What does research reproducibility mean?. Science Translational Medicine, 8, 341ps12.

 

[3] DataONE. (2012). DataONE Education Module: Analysis and Workflows. DataONE, USA.

 

[4] Kepler. (2016). The Kepler Project.

 

[5] VisTraili. (2016). Main Page.

 

*Bu sayfa Orta Doğu Teknik Üniversitesi Bilim ve Teknoloji Politikaları Bölümü öğretim üyesi Arsev Umur Aydınoğlu tarafından 2019 yılında hazırlanmıştır.