Geçtiğimiz günlerde Google AI şubesi DeepMind tarafından geliştirilen AlphaFold isimli yapay zeka (AI) ağı bilim dünyasının en büyük soru işaretlerinden birini daha çözüme kavuşturma yolunda büyük bir adım attı. Bu büyük soru işaretiyse amino asit dizisinden yola çıkarak canlı yaşamının temelini oluşturan protein moleküllerinin 3 boyutlu yapısının hesaplanıp hesaplanamayacağıydı.
Deepmind-AlphaFold , Critical Assessment of Structure Prediction (Yapı Tahmininin Kritik Değerlendirmesi) yani kısaca CASP olarak adlandırılan iki yılda bir yapılan protein yapısı tahmin yarışmasında yaklaşık 100 rakip takımı geride bırakarak mükemmele yakın bir başarı gösterdi. Proteinlerin yapısını bir atomun genişliği içinde tahmin edebilen bir derin öğrenme sistemi olan AlphaFold’un en son sürümü, biyolojinin en büyük zorluklarından birini aşmış bulunuyor.
Proteinler nasıl katlanır? Yaklaşık 50 yıldır bu soruya takılıp kaldık. DeepMind ‘ın bunun için bir çözüm ürettiğini görmek, uzun süre bu problem üzerinde kişisel olarak çalışmış ve acaba cevaba varabilir miyiz diye merak eden biri için çok değerli.
PROFESÖR JOHN MOULT
CASP KURUCU KURUCU VE BAŞKANI
CASP’yi yürüten ekibin başındaki isim olan Maryland Üniversitesi’nden biyolog John Moult, elde edilen bu başarıyı “Ciddi bir sorunu çözmek için yapay zekanın ilk kullanımı” sözleriyle özetleyerek yapay zeka ve biyoloji dünyasının buluştuğu bu ortak noktanın önemini belirtti.
Peki yazının başından beri övgüyle bahsedilen AlphaFold’un bu başarısı neden bu kadar önemli? Evet, proteinler önemli moleküller; peki protein katlanmaları ve bu katlanmaların hesaplanması neden bu kadar önemli? Şimdi biraz bunlara değinerek AlphaFold’u daha iyi tanımaya çalışalım.
Kısaca Protein Nedir ?
Sözlük tanımına bakacak olursak eğer proteinler kendi yapıtaşları olan amino asitlerin zincir halinde birbirlerine bağlanması sonucu oluşan büyük organik bileşiklerdir.
Proteinler bütün canlıların vücudunda bulunan, neredeyse bütün metabolik olayların gerçekleşmesini sağlayan biyolojik yapılardır. Hücre zarının ve hemen hemen tüm enzimlerin yapısına katılma, birçok hormonda bulunma, temel yapıcı onarıcı aynı zamanda düzenleyici ve enerji verici olarak vücutta yer alma proteinlerin görevlerine verilecek örneklerden sayılabilir.
Protein Katlanması Nedir?
Proteine 3 boyutlu şeklini, yani işlevsel halini veren yapısındaki aminoasit dizilimidir. Doğada bulunan 20 çeşit aminoasit bir zincirdeki gibi dizilerek proteinleri meydana getirir ve her bir protein için hangi çeşit aminoasitin hangi sırayla dizileceği DNA tarafından önceden belirlenmiştir.
Bir proteinin belirli bir vazifeyi yerine getirebilmesi için 3 boyutlu şeklinin de o vazifeye uygun olması, yani proteinin uygun şekilde katlanması gerekmektedir. Bu katlanma işlemi belli seviyelere ayrılarak incelenebilir.
Birincil Protein Yapısı
Bir proteinin birincil yapısı doğrusal amino asit dizisinden oluşur ve proteinin doğal yapısını belirler. Bu amino asit dizisi hücrede bulunan ribozom organeli tarafından sentezlenip düzensiz bir formda bulunmaktadır.
Birincil yapı oluşan ilk form olmasının yanında proteinin “üçüncül yapısı” olarak adlandırılan üç boyutlu yapısını büyük oranda belirlediği için büyük öneme sahiptir. Ancak, protein katlanması o kadar karmaşıktır ki; birincil yapıyı bilmek proteinin tamamlanmış formunu bilmemizi sağlamaz.
İkincil Protein Yapısı
İkincil bir yapının oluşturulması, bir proteinin kendi doğal yapısını alması için katlama işleminin ilk adımıdır. Bu aşamada amino asit zinciri kıvrımlar yapar ve katlanmalara uğrar. Bu katlanma ve kıvrımlara ek olarak amino asitlerin yüzeyinde bulunan belirli kimyasal gruplar arasında kurulan hidrojen bağları bu yeni yapıya sağlamlık ve farklı şekiller kazandırır. Birincil yapıdaki karmaşık ve düzensiz formda bulunan aminoasit zinciri bu aşamada daha düzenli ve organize moleküllere dönüşmüşlerdir.Şu ana kadar çeşitli ikincil yapı türleri belirlenmiştir fakat en yaygın formlar alfa sarmal ve beta yaprak olarak bilinen formlardır.
Üçüncül Protein Yapısı
Sıradaki üçüncül yapı, tek bir protein molekülünün üç boyutlu yapısıdır. İkincil yapının formları olan alfa sarmal ve beta yapraklar kompakt bir yapı oluşturacak şekilde katlanırlar. Bu katlanma hidrofobik etkileşimler (hidrofobik kalıntıların sudan uzaklaştırılması) tarafında yönlendirilir ama yapının stabil olabilmesi için spesifik üçüncül etkileşimlerle (tuz köprüleri, hidrojen bağları, disülfür bağları ve yaz zincirlerin sıkı istiflenmesi gibi) çeşitli kısımlarının yerinin sabitlenmesi gerekir ki moleküler organizasyon daha düzenli bir hale geçebilsin.
Dördüncül Protein Yapısı
Birkaç protein veya uzunlu kısalı amino asit zincirlerinin (bu bağlamda bunlara protein altbirim denir) bir araya gelmesinden meydana gelen büyük bir toplaşmadır. Dördüncül yapı, üçüncül yapıyı stabilize eden, kovalent olmayan bağlar ve disülfür bağları gibi etkileşimler tarafından stabilize edilir. Çoğu proteinin dördüncül yapısı yoktur ve monomer olarak işlev görürler.
Protein Katlanmasının Önemi Nedir?
Bir önceki bölümde proteinlerin işlevsel hale gelme sürecinde geçirdiği yapısal değişimlerden konuştuk. Özetleyecek olursak bir protein, birçok karmaşık bükülme, dönme ve dolanma ile kendisini katlayan bir amino asit şeridinden veya bu şeritlerin birleşmesiyle meydana gelir. Bu yapı ne yapacağını belirler. Proteinlerin ne yaptığını anlamak, yaşamın temel mekanizmalarını, ne zaman işe yarayıp ne zaman yaramadığını anlamanın en önemli adımıdır. Bunu anlayabilmek için de amino asit diziliminin nasıl olacağından katlanma şekillerinin belirlenmesine kadar ki sürecin temelini oluşturan DNA büyük önem taşımaktadır.
DNA okumasıyla canlı vücudundaki proteinlerin işleyişinin beklenen şekilde olup olmayacağı hakkında bir ön bilgi edinebiliriz. Aynı zamanda protein katlanmaları yani diğer bir değişle proteinin hangi işleve uygun olduğu hakkında bir tahminde bulunabilmemiz mümkün olabilir.
Bu öngörü sayesinde şu an küresel sağlık sorunu olarak görülen Alzheimer gibi protein birikmesi sonucu beyni tahrip eden hastalıkların altında yatan nedenleri ve bu nedenler doğrultusunda uygun tedavi yöntemleri geliştirilebilir. Bir başka örnek olarak erken tanı koymaya engel olabilecek kadar az semptom gösteren çeşitli kanser türlerini tespit etmek için belirlenen yöntemleri daha da duyarlı hale getirerek ön tanıyı mümkün kılabilir. Ya da canlılığın gezegenimizin üzerinde nasıl başladığına dair yürütülen çalışmaların hızlanmasına ve aydınlatılmasına yardımcı olabilir.
Protein Katlanması Sorunu(AlphaFold)
Proteinin yapısından , katlanmasından ve bu yapıların önceden tahmin edilebilmesinin neden önemli olduğunu konuştuk. Şimdi de protein katlanmasının önceden tahmin edilebilmesinin neden bilim dünyasının uğraştığı en büyük soru işaretlerinden biri olduğuna bakalım.
1972 Nobel Kimya Ödülü’nü kazanan Christian Anfinsen, teorik olarak bir proteinin amino asit dizisinin aynı proteinin yapısını tam olarak belirlemesi gerektiğini öne süren bir hipotez öne sürmüştü. Bu hipotezin ortaya atılmasıyla birlikte yalnızca amino asit dizisine (birincil yapı) dayalı olarak bir proteinin 3 boyutlu tamamlanmış yapısını hesaplamalı olarak tahmin edebilmek için yaklaşık elli yıl sürecek olan bir arayış ateşlenmiş oldu. Bu arayış büyük ilerlemelerle beslenerek devam etti. Kriyo-elektron mikroskobu (2017 yılındaNobel Kimya Ödülüyle ödüllendirilmiştir) , nükleer manyetik rezonans ve x-ışını kristalografisi gibi çözüm yolları bu arayışta öncü olmuşlardır.
Karşı karşıya kalınan problemse hala bilim dünyasını zorlayan bir yerdeydi : bir proteinin tamamlanmış 3 boyutlu yapısına ulaşırken teorik olarak katlanabileceği yolların sayısı astronomik sayılarla tanımlanıyordu. 1969’da Cyrus Levinthal, tipik bir proteinin tüm olası konfigürasyonlarını kaba kuvvet hesaplamasıyla sayma işleminin bilinen evrenin yaşından daha uzun süreceğini belirtti .Levinthal ayrıca tipik bir protein için 10 ^ 300 olası konformasyon olduğunu tahmin etti. (Levinthal paradoksu)
Ayrıca yaklaşık 200 milyon bilinen proteine ek olarak her yıl 30 milyon tane daha keşfedilmekteydi. Ve bu yeni, eski bilene proteinlerin 10 ^ 300 (en az) konformasyon seçeneği bulunmakta. Kullanılan yöntemlerin çok pahalı ve aşırı yavaş olması bu kadar fazla olasılığa sahip problemin çözümünde istenen verimin alınmasını engelliyordu.
İşte bu bahsedilen 50 yılı aşkın bir süredir var olan sorun ve zorlukların bütününe bilim dünyası tarafından protein katlama problemi ismi verilmişti – taki Deepmind-AlphaFold devreye girinceye kadar.
Deepmind-AlphaFold ve Getirdiği Çözüm
CASP Nedir?
Yapay zeka destekli çözümün detaylarına geçmeden önce yazının başında bahsi geçen CASP yani Yapı Tahmininin Kritik Değerlendirmesi yarışmasından biraz bahsedelim.
CASP, kurucusu olan Profesör John Moult önderliğinde iki yıllık aralıklarla düzenlenen bir yarışma.
CASP komitesi yarışmaya katılan yapı tahmin programlarını değerlendirmek için çok yakın zamanda deneysel olarak belirlenmiş ( hatta hala değerlendirilme aşamasında bulunan) protein yapılarını seçer. Ve bu seçimleri kamuoyuyla paylaşmazlar. Yani katılımcıların proteinlerin yapısını körü körüne tahmin etmeleri gerekmektedir. Tahmin işlemi sonlandıktan sonra CASP komitesi tahmin sonuçlarıyla deneysel sonuçları karşılaştırarak değerlendirmeye alır.
CASP tarafından tahminlerin doğruluğunu ölçmek için kullanılan ana ölçü, 0-100 arasında değişen Küresel Mesafe Testidir (GDT). Profesör Moult’a göre, 90 GDT civarında bir puan alan yapı tahmin programı gayri resmi olarak deneysel yöntemlerden elde edilen sonuçlarla örtüşme kabiliyetine sahiptir.
(CASP-14 Modellemeleri için tıklayınız)
Ve Kazanan : Deepmind-AlphaFold!
DeepMind tarafından geliştirilen AlphaFold protein yapısının tahminlerini gerçekleştiren bir yapay zeka programıdır. AlphaFold’un son sürümü bu sene katıldığı CASP14 (Yapı Tahmininin Kritik Değerlendirmesi) yarışmasının sonuçlarına göre şu an alanının en başarılı yapay zeka programı. AlphaFold tüm hedeflerde genel olarak 92.4 GDT medyan puanına ulaşmıştır. Tahminlerinde (bir atomun genişliğiyle karşılaştırılabilecek kadar küçük olan 0.16 nanometre) 1,6 Angstromluk ortalama hataya sahip olan AlphaFold yarışmanın en zorlu modelleme kategorisinde yer alan serbest modelleme alanında bile 87.0 GDT’lik bir puana ulaşmıştır. (Yarışmanın sonuçları burada paylaşılmıştır.
AlphaFold’un yakaladığı bu doğruluk oranları neredeyse kriyo-elektron mikroskobu gibi proteinlerin yapısını haritalamak için geliştirilen laboratuvar tekniklerinin ölçümleriyle birebir. Ama arada açık ara AlphaFold’un önde olduğu bir avantaj bulunmakta: hız. Bahsettiğimiz laboratuvar teknikleri çok pahalı ve aynı zamanda çok yavaş. Bu karşılaştırmayı daha iyi anlamak için bir karşılaştırma yapabiliriz. Laboratuvar yöntemlerinin her protein modelini hesaplayarak doğru sonuca ulaşması yıllarca deneme yanılma gerektirebilir ; Deepmind-
AlphaFold ise sadece birkaç gün içinde bir proteinin şeklini bulabilir.
AlphaFold CASP yarışmasına ilk kez 2018’de katılmıştı. İki yıl önce 13.kez düzenlenen CASP’de en yüksek tahmin puanını alan yine AlphaFold olmuştu. Ekip bir önceki AlphaFold sürümünün eksik yönlerini tespit ederek bu alanlara yoğunlaşarak başarılarını bir üst seviyeye çıkartmış bulunuyor.
AlphaFold’un son sürümünün eğitim sürecinde kullanılan veri tabanı yaklaşık 170.000 bilinen ve bilinmeyen yapıdaki protein dizilerini içeriyor. Ekibin resmi internet sitesi üzerinden yayınladığı son yazıya göre AlphaFold’un son sürümü hakkında daha detaylı bilgileri ve incelemeleri içeren makale hazırlık aşamasında bulunuyor. (AlphaFold ekibinin CASP13-2018 sonunda yayınladıkları inceleme için tıklayabilirsiniz.)
Yapay Zeka Işığında Gelecek
Bugüne kadarki en önemli yapay zeka ilerlemelerden biri olan Alphafold hala ilerlemeye, kendini geçmeye devam ediyor. Ancak tüm bilimsel araştırmalarda olduğu gibi, hala cevaplanmayı bekleyen birçok soru var. Birden çok proteinin nasıl kompleks oluşturduğu veya %100 doğru bir modellemenin nasıl yapılacağı hakkında öğrenilecek çok şey var.
Deepmind-AlphaFold, modellemesi bilinmeyen yüz milyonlarca proteini keşfetme potansiyeliyle bilinen hastalıkların anlaşılmasını hızlandırmanın yanı sıra gelecekte yeni bir salgına karşı da yararlı olabileceğine dair umut veriyor.
Hatta içinde bulunduğumuz pandemi günlerinin başlarında yapıları daha önce bilinmeyen SARS-CoV-2 virüsünün birkaç protein yapısı ve CASP14’te, başka bir koronavirüs proteini olan ORF8’in yapısı AlphaFold tarafından tahmin edilmişti.
Deepmind-AlphaFold ve Akla Bile Gelmeyeni Bilmeye Doğru
“DeepMind on yıl önce işe koyulduğunda, yapay zekanın temel bilimsel problemler konusundaki anlayışımızı ilerletmesi için bir araç görevi göreceğini umuyorduk. Şimdiyse AlphaFold’u geliştirmeye yönelik 4 yıllık çabanın ardından çeşitli alanlara yönelik çalışmalarla birlikte vizyonun gerçekleştiğini görmeye başlıyoruz.”
Bu sözler bizzat DeepMind-AlphaFold ekibine ait.
Christian Anfinsen yıllar önce öne sürdüğü hipotez üzerinde çalışmalarına devam ederken belki bu ilerlemeyi hayal bile edememişti. Bu açıklanan ilerleme, yapay zekanın bilginin sınırlarını genişletmede insanlığına en yararlı araç olacağını gösteriyor.
Astrobiyoloji, tıp, zooloji, mikrobiyoloji…Canlılıkla, yaşamla alakalı her alanda insanlığın bu zamana kadar bildikleri AlphaFold gibi örneklerle hızla ilerleyen yapay zeka sayesinde yeniden şekillenecek.

Yapay zeka ve gelecek
Evrenimizin bilinmeyen birçok yönü var. Buna rağmen bir yerlerde veri kümeleri tekrar derleniyor, eğitim ve test setleri belirleniyor, yapay zeka modelleri çalışmaya başlıyor ve evrenin bilinmezlikleri biraz daha çözülüyor.
Gelecek gerçekten de heyecan verici!
Kaynakça
Callaway, E. (2020, Kasım 30). ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Nature: https://www.nature.com/articles/d41586-020-03348-4 adresinden alındı
DeepMind. (2020, Kasım 30). AlphaFold: a solution to a 50-year-old grand challenge in biology. DeepMind: https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology adresinden alındı
DeepMind. (2020, Ocak 15). AlphaFold: Using AI for scientific discovery. DeepMind: https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery adresinden alındı
Dursunkaya, B. (2012, Aralık 16). İkincil Protein Yapısı. Evrim Ağacı: https://evrimagaci.org/ikincil-protein-yapisi-5633 adresinden alındı
Heaven, W. D. (2020, Kasım 30). DeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology. MIT Technology Review: https://www.technologyreview.com/2020/11/30/1012712/deepmind-protein-folding-ai-solved-biology-science-drugs-disease/ adresinden alındı
Hutson, M. (2019, Temmuz 22). AI protein-folding algorithms solve structures faster than ever. Nature: https://www.nature.com/articles/d41586-019-01357-6 adresinden alındı
Vikipedi. (2020, Aralık 6). Protein yapısı. Vikipedi: https://tr.wikipedia.org/wiki/Protein_yap%C4%B1s%C4%B1#:~:text=D%C3%B6rd%C3%BCnc%C3%BCl%20yap%C4%B1%20birka%C3%A7%20protein%20veya,dis%C3%BClf%C3%BCr%20ba%C4%9Flar%C4%B1%20taraf%C4%B1ndan%20stabilize%20edilir. adresinden alındı
Görseller
https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery
https://deepmind.com/research/case-studies/alphafold
https://elearningindustry.com/future-of-artificial-intelligence-amazing-applications
https://www.researchgate.net/figure/Solution-of-Levinthals-paradox-in-Levinthals-terms-was-obtained-at-the-level-of-the_fig4_323224404
https://www.nature.com/articles/d41586-020-03348-4