A’dan Z’ye BİYOİNFORMATİK

(Bu yazı GENÇ İVEK SAĞLIK BİLİM VE TEKNOLOJİLERİ DERGİSİ’nin 9. sayısında yayımlanmıştır.)

Dr. Öğr. Üyesi GÖKAY VARDAR
İstanbul Sağlık ve Teknoloji Üniversitesi

NIH (The Instutıes Of Health)’a göre biyoinformatik; biyolojik, tıbbi, davranışsal ya da sağlık verilerinin kullanımını genişletmek ve bu verileri elde etmek, depolamak, organize etmek, arşivlemek, analiz etmek ya da görselleştirmek için bilgisayara dayalı araçlar ve yaklaşımların araştırılması, geliştirilmesi ve uygulanmasıdır. Ayrıca biyoinformatik, birbirini etkileyen ve birden fazla kez sinerjik olarak birleşen biyoloji ve bilgisayarlar arasındaki yakın ilişkiyi içerir.

İlk biyolojik dizi veritabanı “Atlas of Protein Sequence and Structure” atlası (1965)

Biyoinformatiğin Gerekliliği ve Uygulama Alanları

Biyolojiden elde edilen verilerin, özellikle DNA, RNA, protein dizileri biçimindeki çeşitliliği, bilgisayar bilimleri ve hesaplamalı biyolojide yoğun talep oluşturmaktadır.  Bu yüzden yaşam ve bilgisayar bilimleri arasında bir köprü kurulmuş denilebilmektedir. Çok sayıda biyolojik bilgilerin varlığı, bu biyolojik bilgilerin karmaşık ve kompleks olması bu bilgilerin organize edilmesini gerekmektedir. Bu organizasyon ve bilgilerin arasındaki uyum insan beyninin kantitatif olarak algılanması için çok hassastır. Bu sebeple daha çok bilgisayar araçlarına ihtiyacımız vardır.

Biyoinformatik, biyolojinin hücresel ve moleküler düzeylerine odaklanır ve yaşam bilimlerinde geniş bir uygulama alanına sahiptir. Biyoinformatik alanındaki güncel araştırmalar şu şekilde sınıflandırılabilir:

  • Genomik – gen ve genom işlevselliğini belirlemek için genomların sekanslanması ve karşılaştırmalı çalışması,
  • Proteomik – proteinle ilgili özelliklerin belirlenmesi ve karakterizasyonu,
  •  Çalışma için hücre görselleştirme ve simülasyon model hücre davranışı
  •  İlaçların ve anti-mikrobiyal ajanların geliştirilmesine uygulama.

Biyoinformatiğin Tarihi

Biyoinformatik tarihi bilgisayar sistemlerinin gelişimine bağlı olarak, bilgisayarların yerel ağ sistemi olarak kullanılması ve biyoteknolojideki gen ve protein verilerinin birikmesiyle başlamıştır. 1960’larda, ilk de novo peptid dizisi birleştirici, ilk protein dizisi veri tabanı ve filogenetik için ilk amino sübstitüsyon modeli geliştirildi. Margaret Dayhoff (1925–1983), hesaplama yöntemlerinin biyokimya alanına uygulanmasına öncülük eden Amerikalı bir fiziko kimyacısıydı. Dayhoff’un bu alana katkısı o kadar önemlidir ki, Ulusal Biyoteknoloji Bilgi Merkezi’nin (NCBI) eski direktörü David J. Lipman, onu “biyoinformatiğin annesi ve babası” olarak adlandırdı. Dayhoff ve Eck 1965 senesinde ilk biyolojik dizi veritabanı olan “Atlas of Protein Sequence and Structure’’ atlasını oluşturdu.

Margaret Dayhoff (1925–1983)

Biyoinformatik Veritabanları

Biyokimya, moleküler biyoloji ve genetik alanında her gün çok sayıda yeni çalışma yayınlanmaktadır. Bu çalışmadaki verilen depolanması, sanal ortamda araştırmacıların bu verilere ulaşabilmesi ve yeni veriler girebilmesi için veritabanlarına ihtiyaç vardır. Yapılan bilimsel çalışmaya göre çeşitli veri tabanları kullanılmaktadır. Aşağıdaki tabloda yapılan çalışmalardaki sık kullanılan bazı veri tabanları verilmiştir.

DNA veritabanları
Uluslararası Nükleotid Dizi Veritabanı (INSD), Japonya DNA Veri Bankası (Ulusal Genetik Enstitüsü), EMBL (Avrupa Biyoinformatik Enstitüsü), GenBank (Ulusal Biyoteknoloji Bilgi Merkezi)
Protein dizisi veritabanları
DisProt, Baskı, Ncbi , Mobidb, Prosite, neXtProt
Sinyal iletim yolu veritabanları
NCI-Nature Pathway Etkileşim Veritabanı, Netpath, Reaktom, WikiPathways
Antimikrobiyal direnç veritabanları
Antimikrobiyal İlaç Veritabanı (AMDD), ARDB, ARGminer, BacMet, Beta-Laktamaz Veritabanı (BLAD), Beta-Laktamaz Veritabanı (BLDB)

Bugün ve Gelecekte Biyoinformatik

20. yüzyılın sonlarında biyolojik bilimlerde bilgisayarların kullanışına tanık olduk. Sürekli gelişen laboratuvar teknolojileriyle birlikte bilgisayarların kullanımı, giderek artan kompleks laboratuvar çalışmalarına imkan sağlamıştır. Tek bir proteinin veya genin sıralanması 1990’ların başına kadar bir doktora tezinin konusu olabilirken, bir doktora öğrencisi artık lisansüstü çalışmaları sırasında birçok mikrobiyal topluluğun kolektif genomunu analiz edebilmektedir. Ayrıca bir proteinin birincil yapısını belirlemek eskilerde çok karmaşıkken, şimdi bir numunenin tüm proteomu tanımlanabilmektedir.

Günümüzde DNA mikroçip çalışmalarında yapılan deneylerden elde edilen verilerin biyoinformatik araçlarla incelenmesi önemli miktarda hastalığa sebep olan çok sayıda genin teşhis edilmesine olanak sağlamıştır

Çeşitli araştırma grupları şimdi, verilerin nükleotid dizileri olarak depolandığı biyolojik hesaplama üzerinde çalışıyor. Bu yaklaşım, genleri bir bilgi depolama ortamı olarak etkili bir şekilde kullanmaktadır. Bu yeni yaklaşım, veri depolama ve bilgi işlem için çok daha verimli ve duyarlı bir yöntem olarak lanse ediliyor.

Geçmişten günümüze kadar uzanan süreçte verilerin büyümesi ve bilgilerin artmasıyla biyoinformatik büyük veriyi kullanma, sonuçların tekrarlanabilirliğini sağlama ve akademik müfredatlara uygun bir entegrasyon sağlama gibi birçok zorlukla karşı karşıyadır. Bunun yanında biyoinformatikçiler için, moleküllerden popülasyonlara simülasyonlar oluşturmayı içeren birçok zorluk devam etmektedir. Gen ağları oluşturmak ve sinyal yollarını modellemek de bir zorluk olmaya devam etmektedir. Önümüzdeki yıllarda ver madenciliği, yapay zeka ve programlama gibi bilgisayar teknolojileri alanlarındaki gelişmeler ile biyokimyasal analiz yöntemleri, modelleme tekniklerindeki gelişmelerle birleşince biyoinformatik önem kazanarak kendisine daha geniş ve yeni uygulama alanı bulacaktır.

Kaynaklar

  1. M.  POLAT And A. G.   KARAHAN, “Multidisipliner yeni bir bilim dalı: biyoinformatik ve tıpta uygulamaları,” SDÜ Tıp Fakültesi Dergisi, 2009     
  2. Jeff Gauthier, Antony T Vincent, Steve J Charette, Nicolas Derome, A brief history of bioinformatics, Briefings in Bioinformatics, Volume 20, Issue 6, November 2019, Pages 1981–1996,
  3. Fulekar M.H. (2009) Bioinformatics in Life and Environmental Sciences. In: Fulekar M.H. (eds) Bioinformatics: Applications in Life and Environmental Sciences. Springer, Dordrecht
  4. Elkin PL. Primer on medical genomics part V: bioinformatics. Mayo Clin Proc. 2003 Jan;78(1):57-64.
  5.  http://www.21yyte.org/assets/uploads/files/127-139%20Rengul.pdf
  6.  https://istanbulseo.net/wiki/List_of_biological_databases