Z BioInf
Skocz do: nawigacja, szukaj
(Utworzył nową stronę „==Model HP== '''Model HP''' (''hydrophobic-polar protein folding model'') to model polimeru wykorzystywany w badaniach nad ogólnymi zasadami rządzącymi procesem ...”)
 
(Model HP)
Linia 1: Linia 1:
==Model HP==
+
=Model HP=
  
 
'''Model HP''' (''hydrophobic-polar protein folding model'') to model polimeru wykorzystywany w badaniach nad ogólnymi zasadami rządzącymi procesem zwijania białek. Badania tego typu w przypadku modeli pełnoatomowych wiążą się ze znacznymi kosztami obliczeniowymi, podczas gdy w modelu HP, ze względu na uproszczoną charakterystykę układu, możliwe jest przeprowadzenie krótkiej symulacji (trwającej od kilku minut do kilku godzin), w trakcie której układ jest w stanie osiągnąć wszystkie możliwe mikrostany <ref name="dill1995">{{cite journal |author=Dill K.A. |title=Principles of protein folding - A perspective from simple exact models |journal=Protein science |volume=4 |issue=4 |year=1995 |id={{Entrez Pubmed|7613459}} |pages=561–602 |pmid=7613459}}</ref>.  
 
'''Model HP''' (''hydrophobic-polar protein folding model'') to model polimeru wykorzystywany w badaniach nad ogólnymi zasadami rządzącymi procesem zwijania białek. Badania tego typu w przypadku modeli pełnoatomowych wiążą się ze znacznymi kosztami obliczeniowymi, podczas gdy w modelu HP, ze względu na uproszczoną charakterystykę układu, możliwe jest przeprowadzenie krótkiej symulacji (trwającej od kilku minut do kilku godzin), w trakcie której układ jest w stanie osiągnąć wszystkie możliwe mikrostany <ref name="dill1995">{{cite journal |author=Dill K.A. |title=Principles of protein folding - A perspective from simple exact models |journal=Protein science |volume=4 |issue=4 |year=1995 |id={{Entrez Pubmed|7613459}} |pages=561–602 |pmid=7613459}}</ref>.  
 
__TOC__
 
__TOC__
 
  
 
== Wstęp ==
 
== Wstęp ==

Wersja z 15:59, 12 mar 2012

Model HP

Model HP (hydrophobic-polar protein folding model) to model polimeru wykorzystywany w badaniach nad ogólnymi zasadami rządzącymi procesem zwijania białek. Badania tego typu w przypadku modeli pełnoatomowych wiążą się ze znacznymi kosztami obliczeniowymi, podczas gdy w modelu HP, ze względu na uproszczoną charakterystykę układu, możliwe jest przeprowadzenie krótkiej symulacji (trwającej od kilku minut do kilku godzin), w trakcie której układ jest w stanie osiągnąć wszystkie możliwe mikrostany [1].

Wstęp

Plik:Hp2d2 1.png
(1) Dwuwymiarowy model HP o sekwencji: HPHPHHHHHPHP (wizualizacja w PyMOLu). Na czerwono zaznaczono aminokwasy hydrofobowe (H), na czarno aminokwasy polarne (P). Ponieważ w powyższym mikrostanie nie występują kontakty H-H, energia wynosi 0.
Plik:Hp2d2 inter.png
(2) Obrót wokół szóstego aminokwasu (zaznaczono na zielono) skutkuje utworzeniem kontaktu H-H między ósmym i piątym aminokwasem.
Plik:Hp2d2 2.png
(3) Transformacja została zaakceptowana, liczba kontaktów H-H wynosi 1, zatem nowa energia układu wynosi -ɛ.

Idea modelu HP opiera się na obserwacji, iż kluczową rolę w procesie zwijania białek pełni efekt hydrofobowy (w tym kontekście spotkać się można z terminem: "oddziaływania hydrofobowe"). W podstawowym modelu HP polimer zbudowny jest z monomerów H (hydrofobowych) oraz P (polarnych), przy czym wkład do energii pochodzi jedynie od H. Można więc myśleć o modelu HP jak o modelu białka, w którym alfabet aminokwasów ograniczony został do zbioru {H,P}. Aminokwasy znajdują się w węzłach sieci kwadratowej (square lattice) w przypadku modelu dwuwymiarowego (2D), bądź w węzłach sieci sześciennej (cubic lattice) w przypadku modelu trójwymiarowego (3D). Dwa aminokwasy nie mogą znajdować się w tym samym węźle. Natomiast jeśli dwa aminokwasy połączone są wiązaniem (przez analogię do wiązania peptydowego między aminokwasami w białkach), to muszą się one znajdować w sąsiednich węzłach. Mikrostan układu można określić poprzez: sekwencję peptydu oraz współrzędne poszczególnych aminokwasów.

Ewolucję układu w modelu HP zadaje zestaw dozwolonych transformacji struktury oraz rozkład prawdopodobieństwa przejść między mikrostanami. Przykładem dozwolonej transformacji może być obrót części białka o pewien kąt wokół wybranego aminokwasu (przykład przedstawiono po prawej). W przypadku modelu 2D istnieją trzy możliwe nietrywialne obroty. Jeżeli po dokonaniu obrotu żadne dwa aminokwasy nie zajmują tego samego punktu w przestrzeni, obrót uznajemy za dozwolony.

Po dokonaniu dozwolonej transformacji prawdopodobieństwo akceptacji nowego mikrostanu zależy jedynie od zmiany wartości energii. Innymi słowy: to, czy zaakceptujemy mikrostan uzyskany w wyniku transformacji zależy jedynie od mikrostanu przed transformacją; wcześniejsza historia układu nie ma tu znaczenia. Zatem ewolucja peptydu (ciąg mikrostanów wygenerowany w toku symulacji) jest realizacją procesu stochastycznego, w którym prawdopodobieństwo zdarzenia (akceptacja nowego mikrostanu) zależy jedynie od wyniku poprzedniego. Proces stochastyczny tego typu w przypadku dyskretnej przestrzeni stanów nazywany jest łańcuchem Markowa.

Sieć

Niech:

będą wektorami bazowymi w przypadku dwuwymiarowym, zaś:

wektorami bazowymi w przypadku trójwymiarowym. Siecią kwadratową nazywać będziemy zbiór:

zaś zbiór:

nazwiemy siecią sześcienną. Element sieci (węzeł) opisujemy przez podanie dwóch, bądź trzech liczb całkowitych (współrzędnych węzła), przykładowo dla sieci sześciennej: (0,1,-10).

Powiemy, że węzły a i b sąsiadują ze sobą na siatce (ozn. a ~ b), jeżeli istnieje wektor bazowy e taki, że:

.

Niech będzie zbiorem aminokwasów tworzących peptyd, gdzie - długość peptydu. Wówczas strukturę przestrzenną wyrażać będziemy przez funkcję:

spełniającą warunki:

Podanie struktury (w postaci funkcji s) nie wystarcza do określenia miktrostanu układu, potrzebna jest jeszcze sekwencja.

Sekwencja

Sekwencja łańcucha określona jest przez wzorzec hydrofobowy . Rozważany model dzieli aminokwasy ze względu na właściwości oddziaływań dalekozasięgowych na dwie kategorie: hydrofobowe (H) oraz polarne (P). Dalekozasięgowość oddziaływań odnosi się do wzajemnych położeń aminokwasów w sekwencji, a nie w przestrzeni. Przykładowo: o obecności oddziaływań dalekozasięgowych możemy mówić w przypadku pary aminokwasów o numerach 1 i 4, bądź: 2 i 9, ale nie w przypadku par: 1 i 3, czy też 4 i 5. Szczegóły w poniższej sekcji Oddziaływania.

Oddziaływania

W najprostszym modelu HP rozważa się jedynie oddziaływania dalekozasięgowe pomiędzy aminokwasami hydrofobowymi. Energia danego mikrostanu zależy od liczby kontaktów występujących między aminokwasami H, niesąsiadującymi w peptydzie.

Niech

będzie liczbą kontaktów H-H w peptydzie o strukturze s. Energia układu wyraża się przez:

gdzie ɛ >0.

Interakcje pomiędzy aminokwasami hydrofobowymi odzwierciedlają ich tendencję do kierowania się do wewnątrz białka i tym samym unikania kontaktu z wodą. Należy podkreślić, że model HP uwydatnia jeden aspekt procesu zwijania białek (efekt hydrofobowy), ignoruje natomiast oddziaływania lokalne występujące w rzeczywistym białku - "sztywność" łańcucha (objawiająca się niedozwolonymi wartościami kątów φ-ψ na wykresie Ramachandrana) oraz wiązania wodorowe (istotne w α-helisach i β-kartkach). Proste modele, jak model HP, skłaniają do zadawania pytań: Które z własności białek udaje się odtworzyć pomimo poczynionych przybliżeń?

Średnia po zespole

Niech A będzie pewną własnością fizyczną badanego układu. Mikrostan układu oznaczymy przez , gdzie n jest liczbą stopni swobody. Przyjmujemy, że własność A objawia się jako średnia po próbce pewnej przestrzeni mikrostanów, tzn.:

gdzie f jest funkcją rozkładu gęstości prawdopodobieństwa, jest przestrzenią dostępnych stanów układu (nazywana również w szerszym kontekście: przestrzenią fazową), zaś:

to sumą statystyczna nazywana również funkcją podziału. Rozkład f określa odpowiedni zespół statytyczny (mikrokanoniczny, kanoniczny,...).

W przypadku modelu HP liczba mikrostanów układu jest skończona (ozn. N), zaś średnią wartość A wyraża się w postaci sumy po dostępnych mikrostanach układu:

gdzie jest prawdopodobieństwem uzyskania przez układ i-tego mikrostanu. Prawdopodobieństwo, że układ o określonej, stałej temperaturze T (używa się też określenia: w kontakcie z termostatem o temperaturze T) osiągnie i-ty mikrostan o energii , dane jest rozkładem Boltzmanna:

gdzie k - stała Boltzmanna. Suma w mianowniku zapewnia normalizację rozkładu :

Metoda Monte Carlo - algorytm Metropolisa

W celu wyznaczenia dla układu o temperaturze T wystarczy dysponować metodą do generowania mikrostanów zgodnie z rozkładem Boltzmanna. Metodą tego typu jest algorytm Metropolisa.

Wprowadźmy następujące oznaczenie:

gdzie a jest mikrostanem o energii . Istotą algorytmu Metropolisa jest stworzenie ciągu mikrostanów, będący realizacją łańcucha Markowa z prawdopodobieństwem przejść, zależącym od różnicy energii kolejnych mikrostanów. W przypadku modelu HP algorytm Metropolisa przebiega następująco:
1. Zainicjuj ciąg mikrostanów, tworząc pierwszy, dowolny mikrostan X.
2. Oblicz energię .
3. Dokonaj dozwolonej transformacji peptydu (transformacje opisano dalej, dla ustalenia uwagi - dokonujemy obrotu części peptydu wokół losowo wybranego aminokwasu).
4. Wyznacz energię uzyskanego w wyniku transformacji mikrostanu Y.
5. Zaakceptuj nowy mikrostan (X:=Y) z prawdopodobieństwem i wróć do 3. albo zakończ, jeśli wygenerowano ciąg o długości M.

Dysponując ciągiem mikrostanów uzyskanych w algorytmie Metropolisa, możemy wyznaczyć średnią wartość A:

Transformacje

...

Symulowane wyżarzanie (Simulated Annealing)

Najprostszym sposobem znajdowania konformacji o minimalnej energii jest systematyczne obniżanie temperatury podczas symulacji. Wadą tego rozwiązania jest to, że układ może łatwo zatrzymać się w lokalnym minimum energii, z którego wyjście przy obniżonej temperaturze okaże się niemożliwe (precyzyjniej: niezwykle mało prawdopodobne). Ponadto, zbieżność algorytmu przy niskich temperaturach jest dosyć wolna. Układ może stracić dużo czasu (kroków symulacji) w niecce reprezentującej lokalne minimum, bądź oscylując między stanami o tej samej energii.

Zamiana replik (Replica Exchange Monte Carlo)

W tym podejściu równolegle symuluje się wiele kopii układu, każdy w innej, stałej temperaturze. Załóżmy, że w pewnym momencie symulacji algorytmu Metropolisa i-ta replika o temperaturze jest w mikrostanie o energii , zaś j-ta replika w odpowiednio: temperaturze , mikrostanie i energii . Z rozkładu jednostajnego losujemy parę kolejnych replik (i,j) , które z prawdopodobieństwem zostaną zamienione miejscami:

gdzie

Po zamianie i-ta replika symulowana jest w temperaturze , a j-ta w temperaturze . Ponieważ prawdopodobieństwo zamiany maleje wykładniczo wraz ze wzrostem różnicy temperatur, rozważamy wyłącznie repliki sąsiednie.

Zamiana temperatur zmienia krajobraz energetyczny. W bardzo wysokich temperaturach bariery energetyczne znikają i można domniemywać, że prawdopodobieństwo odwiedzenia mikrostanu jest zadane rozkładem jednostajnym. Repliki, które utknęły w lokalnych minimach mogą zostać z nich wyzwolone przez przeniesienie do wyższej temperatury.

Wymiany nie powinny być zbyt częste. Po zmianie temperatury układ przez pewien czas się stabilizuje i przemieszcza w najbardziej prawdopodobny region krajobrazu energetycznego.

Po zakończeniu symulacji średnia A w temperaturze może zostać oszacowana wzorem:

Symulacje planowane na ćwiczeniach

Celem ćwiczeń jest zaimplementowanie modelu HP (domyślnie w języku Java) i sprawdzenie wyników przedstawionych w publikacji K. A. Dilla z 1995 roku. W pierwszym etapie przeprowadzimy symulowane wyżarzania modeli dwuwymiarowych trzech polimerów o sekwencjach:

  • PHPPHPPHHPPHHPPHPPHP
  • HPPHPPHPHPPHPHPHHH
  • HPPPHHPPHPHHPHHH

(na ostatnich ćwiczeniach zawęziłem symulacje obowiązujące na 25. marca do jednej sekwencji, pierwszej na powyższej liście). W przypadku każdego peptydu temperaturą początkową będzie , a temperaturą końcową . Temperatura będzie w trakcie symulacji maleć o czynnik . Po przeprowadzeniu transformacji (dokonując akceptacji/odrzuceń wygenerowanych konformacji) w danej temperaturze , przeprowadzamy kolejnych kroków w temperaturze i tak dalej, aż do osiągnięcia .

W każdej temperaturze wygenerujemy konformacji, które akceptować będziemy na drodze algorytmu Metropolisa i dla każdej takiej próby możemy wyznaczyć ciepło właściwe układu , średni moment bezwładności oraz histogram wystąpień stanów w zależności od liczby kontaktów.

(z ostatnich ćwiczeń: na 25. marca proszę wykonać wykres Cv(T) oraz histogramy dla poszczególnych temperatur. Załączone rysunki przedstawiają czego spodziewać się można po wynikach).

Plik:Cv.png
Ciepło właściwe w funkcji temperatury, uzyskane w symulowanym wyżarzaniu.
Plik:HistogramT0 3.png
Histogram wystąpień stanów w zależności od liczby kontaktów.
Plik:MeanI.jpg
Średni moment bezwładności w funkcji temperatury.

Ciepło właściwe wyraża się wzorem:

Warto zauważyć, że w jest proporcjonalne do wariancji energii i można ją interpretować jako "miarę rozrzutu energii" stanów, jakie osiąga układ w danej temperaturze.

Moment bezwładności definiujemy następująco:

gdzie jest środkiem ciężkości, a n liczbą aminokwasów w strukturze. Natywna struktura większości białek jest globularna. Można więc przyjąć, że moment bezwładności jest dobrym przybliżeniem "stopnia zwinięcia białka".

Model HP "na piątkę"

Na ocenę bardzo dobrą z tej części ćwiczeń należy przeprowadzić dodatkowo (poza symulacją na zaliczenie, na 25. marca) dwie symulacje, dla białek o sekwencjach:

  • HPPPHHPPHPHHHHHH
  • HPPPHHPPHPHHPHHH

które różnią się sekwencyjnie tylko na jednej pozycji (praca Dilla, str. 20). Specyfikacje symulacji są te same, co poprzednio. Należy wykonać analogiczne histogramy wystąpień kontaktów, wykresy oraz - analogiczny do wykresu - wykres .

Czy różnica sekwencyjna na jednej pozycji powoduje zmianę minimalnej wartości energii dla tych dwóch białek? Czy obydwa białka "zwijają się" do minimum energii? A jak nie - to do minimum jakiego potencjału?

Linki zewnętrzne

  • Szablon:Cite journal