DeepMind-AlphaFold ve 50 Yıllık Protein Katlanması Problemine Çözüm

 

 

 

DeepMind-AlphaFold şema Geçtiğimiz günlerde Google AI şubesi  DeepMind  tarafından geliştirilen AlphaFold isimli yapay zeka (AI) ağı bilim dünyasının en büyük soru işaretlerinden birini daha çözüme kavuşturma yolunda büyük bir adım attı. Bu büyük soru işaretiyse  amino asit dizisinden yola çıkarak canlı yaşamının temelini oluşturan  protein moleküllerinin 3 boyutlu yapısının hesaplanıp hesaplanamayacağıydı.

 Deepmind-AlphaFold , Critical Assessment of Structure Prediction (Yapı Tahmininin Kritik Değerlendirmesi) yani kısaca  CASP olarak adlandırılan iki yılda bir yapılan protein yapısı tahmin yarışmasında yaklaşık 100 rakip takımı geride bırakarak mükemmele yakın bir başarı gösterdi. Proteinlerin yapısını bir atomun genişliği içinde tahmin edebilen bir derin öğrenme sistemi olan AlphaFold’un en son sürümü, biyolojinin en büyük zorluklarından birini aşmış bulunuyor.

 

Proteinler nasıl katlanır? Yaklaşık 50 yıldır bu soruya takılıp kaldık.  DeepMind ‘ın bunun için bir çözüm ürettiğini görmek, uzun süre bu problem üzerinde kişisel olarak çalışmış ve acaba cevaba varabilir miyiz diye merak eden biri için çok değerli.

PROFESÖR JOHN MOULT

CASP KURUCU KURUCU VE BAŞKANI

Şemada gösterilen protein moleküllerinde yeşil renkli alanlar proteinin doğadaki formunu,mavi renkli kısımlarsa AlphaFold tarafından hesaplanan yapılardır.

 

CASP’yi yürüten ekibin başındaki isim olan Maryland Üniversitesi’nden biyolog  John Moult, elde edilen bu başarıyı “Ciddi bir sorunu çözmek için yapay zekanın ilk kullanımı” sözleriyle özetleyerek  yapay zeka ve biyoloji dünyasının buluştuğu bu ortak noktanın önemini belirtti.

Peki yazının başından beri övgüyle bahsedilen AlphaFold’un bu başarısı neden bu kadar önemli? Evet, proteinler önemli moleküller; peki protein katlanmaları ve bu katlanmaların hesaplanması neden bu kadar önemli? Şimdi biraz bunlara değinerek AlphaFold’u daha iyi tanımaya çalışalım.

Kısaca Protein Nedir ?

Sözlük tanımına bakacak olursak eğer proteinler kendi yapıtaşları olan amino asitlerin zincir halinde birbirlerine bağlanması sonucu oluşan büyük organik bileşiklerdir.

Proteinler bütün canlıların vücudunda bulunan, neredeyse bütün metabolik olayların gerçekleşmesini sağlayan biyolojik yapılardır. Hücre zarının ve hemen hemen tüm enzimlerin yapısına katılma, birçok hormonda bulunma, temel yapıcı onarıcı aynı zamanda düzenleyici ve enerji verici olarak vücutta yer alma  proteinlerin görevlerine verilecek örneklerden sayılabilir.

Protein Katlanması Nedir?

Protein katlanma aşamaları ve yapıları

 

 

 

Proteine 3 boyutlu şeklini, yani işlevsel halini veren yapısındaki aminoasit dizilimidir. Doğada bulunan 20  çeşit aminoasit bir zincirdeki gibi  dizilerek proteinleri meydana getirir ve her bir protein için hangi çeşit aminoasitin hangi sırayla dizileceği DNA tarafından önceden belirlenmiştir.

Bir proteinin belirli bir vazifeyi yerine getirebilmesi için 3 boyutlu şeklinin de o vazifeye uygun olması, yani proteinin uygun şekilde katlanması gerekmektedir. Bu katlanma işlemi belli seviyelere ayrılarak incelenebilir.

Birincil Protein Yapısı

Bir proteinin birincil yapısı doğrusal amino asit dizisinden oluşur ve proteinin doğal yapısını belirler. Bu amino asit dizisi hücrede bulunan ribozom organeli tarafından sentezlenip düzensiz bir formda bulunmaktadır.

Birincil yapı oluşan ilk form olmasının yanında proteinin “üçüncül yapısı” olarak adlandırılan üç boyutlu yapısını büyük oranda belirlediği için büyük öneme sahiptir. Ancak, protein katlanması o kadar karmaşıktır ki; birincil yapıyı bilmek proteinin tamamlanmış formunu bilmemizi sağlamaz.

İkincil Protein  Yapısı

İkincil bir yapının oluşturulması, bir proteinin kendi doğal yapısını alması için katlama işleminin ilk adımıdır. Bu aşamada amino asit zinciri kıvrımlar yapar ve katlanmalara uğrar. Bu katlanma ve kıvrımlara ek olarak amino asitlerin yüzeyinde bulunan belirli kimyasal gruplar arasında kurulan hidrojen bağları bu yeni yapıya sağlamlık ve farklı şekiller  kazandırır. Birincil yapıdaki karmaşık ve düzensiz formda bulunan aminoasit zinciri bu aşamada daha düzenli ve organize moleküllere dönüşmüşlerdir.Şu ana kadar çeşitli ikincil yapı türleri belirlenmiştir fakat  en yaygın formlar alfa sarmal ve beta yaprak olarak bilinen  formlardır.

Üçüncül Protein Yapısı

Sıradaki üçüncül yapı, tek bir protein molekülünün üç boyutlu yapısıdır. İkincil yapının formları olan alfa sarmal ve beta yapraklar kompakt bir yapı oluşturacak şekilde katlanırlar. Bu katlanma hidrofobik etkileşimler (hidrofobik kalıntıların sudan uzaklaştırılması) tarafında yönlendirilir ama yapının stabil olabilmesi için spesifik üçüncül etkileşimlerle (tuz köprüleri, hidrojen bağları, disülfür bağları ve yaz zincirlerin sıkı istiflenmesi gibi) çeşitli kısımlarının yerinin sabitlenmesi gerekir ki moleküler organizasyon daha düzenli bir hale geçebilsin.

Dördüncül Protein Yapısı

Birkaç protein veya uzunlu kısalı amino asit zincirlerinin  (bu bağlamda bunlara protein altbirim denir) bir araya gelmesinden meydana gelen büyük bir toplaşmadır. Dördüncül yapı, üçüncül yapıyı stabilize eden, kovalent olmayan bağlar ve disülfür bağları gibi etkileşimler tarafından stabilize edilir. Çoğu proteinin dördüncül yapısı yoktur ve monomer olarak işlev görürler.

 

Protein Katlanmasının Önemi Nedir?

Protein katlanmasını temsil eden animasyon

 

Bir önceki bölümde proteinlerin işlevsel hale gelme sürecinde geçirdiği yapısal değişimlerden konuştuk. Özetleyecek olursak bir protein, birçok karmaşık bükülme, dönme ve dolanma ile kendisini katlayan bir amino asit şeridinden  veya bu şeritlerin birleşmesiyle meydana gelir. Bu yapı ne yapacağını belirler. Proteinlerin ne yaptığını anlamak, yaşamın temel mekanizmalarını, ne zaman işe yarayıp ne zaman yaramadığını anlamanın en önemli adımıdır. Bunu anlayabilmek için de amino asit diziliminin nasıl olacağından katlanma şekillerinin belirlenmesine kadar ki sürecin temelini oluşturan DNA büyük önem taşımaktadır.

DNA okumasıyla canlı vücudundaki proteinlerin işleyişinin beklenen şekilde olup olmayacağı hakkında bir ön bilgi edinebiliriz. Aynı zamanda protein katlanmaları yani diğer bir değişle proteinin hangi işleve uygun olduğu hakkında bir tahminde bulunabilmemiz mümkün olabilir.

Bu öngörü sayesinde şu an küresel sağlık sorunu olarak görülen Alzheimer gibi protein birikmesi sonucu beyni tahrip eden hastalıkların altında yatan nedenleri ve bu nedenler doğrultusunda uygun tedavi yöntemleri geliştirilebilir. Bir başka örnek olarak erken tanı koymaya engel olabilecek kadar az semptom gösteren çeşitli kanser türlerini tespit etmek için belirlenen yöntemleri daha da duyarlı hale getirerek ön tanıyı mümkün kılabilir. Ya da  canlılığın gezegenimizin üzerinde nasıl başladığına dair yürütülen çalışmaların hızlanmasına ve aydınlatılmasına yardımcı olabilir.

Protein Katlanması Sorunu(AlphaFold)

Protein Katlanması Probleminin Şeması

 

Proteinin yapısından , katlanmasından ve bu yapıların önceden tahmin edilebilmesinin neden önemli olduğunu  konuştuk. Şimdi de protein katlanmasının önceden tahmin edilebilmesinin neden bilim dünyasının uğraştığı en büyük soru işaretlerinden biri olduğuna bakalım.

1972 Nobel Kimya Ödülü’nü kazanan Christian Anfinsen, teorik olarak bir proteinin amino asit dizisinin aynı proteinin yapısını tam olarak belirlemesi gerektiğini öne süren bir hipotez öne sürmüştü. Bu hipotezin ortaya atılmasıyla birlikte yalnızca amino asit dizisine (birincil yapı) dayalı olarak bir proteinin 3 boyutlu tamamlanmış yapısını hesaplamalı olarak tahmin edebilmek için yaklaşık elli yıl sürecek olan bir arayış ateşlenmiş oldu. Bu arayış büyük ilerlemelerle beslenerek devam etti. Kriyo-elektron mikroskobu (2017 yılındaNobel Kimya Ödülüyle ödüllendirilmiştir) , nükleer manyetik rezonans ve x-ışını kristalografisi gibi çözüm yolları bu arayışta öncü olmuşlardır.

Levinthal's paradoksu ve çözümü hakkında bir şema

Karşı karşıya kalınan problemse hala bilim dünyasını zorlayan bir yerdeydi : bir proteinin tamamlanmış 3 boyutlu yapısına ulaşırken teorik olarak katlanabileceği yolların sayısı astronomik sayılarla tanımlanıyordu. 1969’da Cyrus Levinthal, tipik bir proteinin tüm olası konfigürasyonlarını kaba kuvvet hesaplamasıyla sayma işleminin bilinen evrenin yaşından daha uzun süreceğini belirtti .Levinthal ayrıca tipik bir protein için 10 ^ 300 olası konformasyon olduğunu tahmin etti. (Levinthal paradoksu)

Canlı yaşamı ve protein bağlantısının şeması

 

Ayrıca yaklaşık 200 milyon bilinen proteine ek olarak her yıl 30 milyon tane daha keşfedilmekteydi. Ve bu yeni, eski bilene proteinlerin 10 ^ 300 (en az) konformasyon seçeneği bulunmakta. Kullanılan yöntemlerin çok pahalı ve aşırı yavaş olması bu kadar fazla olasılığa sahip problemin çözümünde istenen verimin alınmasını engelliyordu.

İşte bu bahsedilen 50 yılı aşkın bir süredir var olan sorun ve zorlukların bütününe bilim dünyası tarafından protein katlama problemi ismi verilmişti  – taki Deepmind-AlphaFold devreye girinceye kadar.

 

Deepmind-AlphaFold ve Getirdiği Çözüm

 

CASP Nedir?

Yapay zeka destekli çözümün detaylarına geçmeden önce yazının başında bahsi geçen CASP yani Yapı Tahmininin Kritik Değerlendirmesi yarışmasından biraz bahsedelim.

AlphaFold ve aminoasit dizilimi diyagramı

 

CASP, kurucusu olan Profesör John Moult önderliğinde iki yıllık aralıklarla  düzenlenen bir yarışma.

CASP komitesi yarışmaya katılan yapı tahmin programlarını değerlendirmek için çok yakın zamanda deneysel olarak belirlenmiş ( hatta hala değerlendirilme aşamasında bulunan) protein yapılarını seçer. Ve bu seçimleri kamuoyuyla paylaşmazlar. Yani katılımcıların proteinlerin yapısını körü körüne tahmin etmeleri gerekmektedir. Tahmin işlemi sonlandıktan sonra CASP komitesi tahmin sonuçlarıyla deneysel sonuçları karşılaştırarak değerlendirmeye alır.

CASP tarafından tahminlerin doğruluğunu ölçmek için kullanılan ana ölçü, 0-100 arasında değişen Küresel Mesafe Testidir (GDT). Profesör Moult’a göre, 90 GDT civarında bir puan alan yapı tahmin programı gayri resmi olarak deneysel yöntemlerden elde edilen sonuçlarla örtüşme kabiliyetine sahiptir.

(CASP-14 Modellemeleri için tıklayınız)

Ve Kazanan : Deepmind-AlphaFold!

Ana Yapay Sinir Ağ Modeline Genel Bir Bakış

 

DeepMind tarafından geliştirilen AlphaFold protein yapısının tahminlerini gerçekleştiren bir yapay zeka programıdır. AlphaFold’un son sürümü bu sene katıldığı CASP14 (Yapı Tahmininin Kritik Değerlendirmesi) yarışmasının sonuçlarına göre şu an alanının en başarılı yapay zeka programı.  AlphaFold tüm hedeflerde genel olarak 92.4 GDT medyan puanına ulaşmıştır. Tahminlerinde (bir atomun genişliğiyle karşılaştırılabilecek kadar küçük olan 0.16 nanometre) 1,6 Angstromluk  ortalama hataya sahip olan AlphaFold yarışmanın en zorlu modelleme kategorisinde yer alan serbest modelleme alanında bile 87.0 GDT’lik   bir puana ulaşmıştır.  (Yarışmanın sonuçları burada paylaşılmıştır.                                                                                                                                  

Serbest modelleme kategorisindeki modellerin yıllara göre GDT puan grafiği.

 

AlphaFold’un yakaladığı bu doğruluk oranları neredeyse kriyo-elektron mikroskobu gibi proteinlerin yapısını haritalamak için geliştirilen laboratuvar tekniklerinin ölçümleriyle birebir. Ama arada açık ara AlphaFold’un önde olduğu bir avantaj bulunmakta: hız. Bahsettiğimiz laboratuvar teknikleri çok pahalı ve aynı zamanda çok yavaş. Bu karşılaştırmayı daha iyi anlamak için bir karşılaştırma yapabiliriz. Laboratuvar yöntemlerinin her protein modelini hesaplayarak doğru sonuca ulaşması  yıllarca deneme yanılma gerektirebilir ; Deepmind-

AlphaFold ise sadece birkaç gün içinde bir proteinin şeklini bulabilir.

 

Yapay zeka ve getirdiği çözümler

AlphaFold  CASP yarışmasına ilk kez 2018’de katılmıştı. İki yıl önce 13.kez düzenlenen CASP’de  en yüksek tahmin puanını alan yine AlphaFold olmuştu. Ekip bir önceki AlphaFold sürümünün eksik yönlerini tespit ederek bu alanlara yoğunlaşarak başarılarını bir üst seviyeye çıkartmış bulunuyor.

AlphaFold’un son sürümünün eğitim sürecinde kullanılan veri tabanı yaklaşık 170.000  bilinen ve bilinmeyen yapıdaki protein dizilerini içeriyor. Ekibin resmi internet sitesi üzerinden yayınladığı son yazıya göre AlphaFold’un son sürümü hakkında daha detaylı bilgileri ve incelemeleri içeren makale hazırlık aşamasında bulunuyor. (AlphaFold ekibinin CASP13-2018 sonunda yayınladıkları inceleme için tıklayabilirsiniz.)

Yapay Zeka Işığında Gelecek

Protwin ktlanması ve çözüm anahtarı olan AlphaFold diyagramı

 

Bugüne kadarki en önemli yapay zeka ilerlemelerden biri  olan Alphafold hala ilerlemeye, kendini geçmeye devam ediyor. Ancak tüm bilimsel araştırmalarda olduğu gibi, hala cevaplanmayı bekleyen birçok soru var. Birden çok proteinin nasıl kompleks oluşturduğu  veya %100 doğru bir modellemenin nasıl yapılacağı hakkında öğrenilecek çok şey var.

Deepmind-AlphaFold, modellemesi bilinmeyen yüz milyonlarca proteini  keşfetme potansiyeliyle bilinen hastalıkların anlaşılmasını hızlandırmanın yanı sıra gelecekte yeni bir salgına karşı da  yararlı olabileceğine dair umut veriyor.

 Coronavirus-19

 

Hatta içinde bulunduğumuz pandemi günlerinin başlarında yapıları daha önce bilinmeyen  SARS-CoV-2 virüsünün birkaç protein yapısı ve CASP14’te, başka bir koronavirüs proteini olan ORF8’in yapısı AlphaFold tarafından tahmin edilmişti.

 

Deepmind-AlphaFold ve Akla Bile Gelmeyeni Bilmeye Doğru

 

“DeepMind on yıl önce işe koyulduğunda, yapay zekanın temel bilimsel problemler konusundaki anlayışımızı ilerletmesi için bir araç görevi göreceğini umuyorduk. Şimdiyse AlphaFold’u geliştirmeye yönelik 4 yıllık çabanın ardından çeşitli alanlara yönelik çalışmalarla  birlikte vizyonun gerçekleştiğini görmeye başlıyoruz.”

Bu sözler bizzat DeepMind-AlphaFold ekibine ait.

Christian Anfinsen yıllar önce öne sürdüğü hipotez üzerinde çalışmalarına devam ederken belki bu ilerlemeyi hayal bile edememişti. Bu açıklanan ilerleme, yapay zekanın bilginin sınırlarını genişletmede insanlığına en yararlı araç olacağını gösteriyor.

Astrobiyoloji, tıp, zooloji, mikrobiyoloji…Canlılıkla, yaşamla alakalı her alanda insanlığın bu zamana kadar bildikleri AlphaFold gibi örneklerle hızla ilerleyen yapay zeka sayesinde yeniden şekillenecek.

The Future Of Artificial Intelligence - eLearning Industry

Yapay zeka ve gelecek

 

Evrenimizin bilinmeyen birçok yönü var. Buna rağmen bir yerlerde veri kümeleri tekrar derleniyor, eğitim ve test setleri belirleniyor, yapay zeka modelleri çalışmaya başlıyor ve evrenin bilinmezlikleri biraz daha çözülüyor.

Gelecek gerçekten de heyecan verici!

 

 

Kaynakça

Callaway, E. (2020, Kasım 30). ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Nature: https://www.nature.com/articles/d41586-020-03348-4 adresinden alındı

DeepMind. (2020, Kasım 30). AlphaFold: a solution to a 50-year-old grand challenge in biology. DeepMind: https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology adresinden alındı

DeepMind. (2020, Ocak 15). AlphaFold: Using AI for scientific discovery. DeepMind: https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery adresinden alındı

Dursunkaya, B. (2012, Aralık 16). İkincil Protein Yapısı. Evrim Ağacı: https://evrimagaci.org/ikincil-protein-yapisi-5633 adresinden alındı

Heaven, W. D. (2020, Kasım 30). DeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology. MIT Technology Review: https://www.technologyreview.com/2020/11/30/1012712/deepmind-protein-folding-ai-solved-biology-science-drugs-disease/ adresinden alındı

Hutson, M. (2019, Temmuz 22). AI protein-folding algorithms solve structures faster than ever. Nature: https://www.nature.com/articles/d41586-019-01357-6 adresinden alındı

Vikipedi. (2020, Aralık 6). Protein yapısı. Vikipedi: https://tr.wikipedia.org/wiki/Protein_yap%C4%B1s%C4%B1#:~:text=D%C3%B6rd%C3%BCnc%C3%BCl%20yap%C4%B1%20birka%C3%A7%20protein%20veya,dis%C3%BClf%C3%BCr%20ba%C4%9Flar%C4%B1%20taraf%C4%B1ndan%20stabilize%20edilir. adresinden alındı

Görseller

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery

https://deepmind.com/research/case-studies/alphafold

https://elearningindustry.com/future-of-artificial-intelligence-amazing-applications

https://www.researchgate.net/figure/Solution-of-Levinthals-paradox-in-Levinthals-terms-was-obtained-at-the-level-of-the_fig4_323224404

https://www.nature.com/articles/d41586-020-03348-4

CNN (Evrişimsel Sinir Ağları) ve Cilt Kanseri Tanısı

Yapay zeka teknolojileri hızla ilerlemekte .Bu ilerleme sayesinde sağlık alanı da birçok yönden gelişim ve değişim süreci içine girmiş durumda. Bu yazımızdaysa yapay zeka destekli bir teknoloji sayesinde cilt kanseri tanısı nasıl konulur ve başarı oranı nedir bunu inceleyeceğiz.