Z BioInf
Wersja z dnia 16:07, 12 mar 2012 autorstwa Mkolin (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Skocz do: nawigacja, szukaj

Modelowanie przez homologię

Rys. 1. Ogólnie stosowany schemat modelowania struktury białka przez homologię.

W przypadku, gdy dysponujemy białkiem homologicznym, szablonem (ang. template), wykazującym pewne podobieństwo sekwencyjne o znanej strukturze przestrzennej, budowę modelu rozpoczynamy od prawidłowego dopasowania sekwencji (uliniowienia sekwencji, ang. sequence alignment). W przypadku gdy dwa białka pochodzą od wspólnego przodka, jednego białka pierwotnego, sekwencje aminokwasów ulęgały zmianom podczas procesu ewolucji na skutek zachodzących substytucji (podstawienia), insercji (wstawienia) lub delecji (usunięcia). Algorytmy stosowane do uliniowienia (porównania) sekwencji białkowych w większości przypadków oparte są na metodzie Needlemana i Wunscha [1]. W celu poprawnego dopasowania dwóch sekwencji stosowana jest macierz podobieństwa (ang. comparison matrix), 20´20 odpowiadająca dwudziestu aminokwasom, na podstawie, której dopasowywane reszty są odpowiednio punktowane. Liczba punktów zależy od charakteru pokrywających się par aminokwasów w uliniowionych sekwencjach. Reszty identyczne są oceniane najwyżej. Odpowiednia liczba punktów przydzielana jest zależnie od typu stosowanej macierzy, na podstawie wspólnych cech fizykochemicznych danych reszt (ładunku, polarności, rozmiaru i innych cech), prawdopodobieństwa wystąpienia danej mutacji, charakteru hydrofobowego czy hydrofilowego oraz na podstawie kodu genetycznego, uwzględniając liczbę zmian jakie musiały zajść w kodzie RNA lub DNA (kodonach definiujących poszczególne aminokwasy) aby zmiana aminokwasu była możliwa. Algorytm przydziela również punkty karne za przerwy w sekwencji (ang. gap penalty). W niektórych przypadkach algorytm optymalizując liczbę przyznanych punktów jest w stanie poprawnie dopasować badane sekwencje.

Poprawne uliniowienie sekwencji jest warunkiem koniecznym dla otrzymania prawidłowej struktury białka. Ten etap modelowania jest też bardzo podatny na błędy. Analizując wykonane ustawienie sekwencji należy zwrócić szczególną uwagę na fragmenty łańcucha odpowiedzialne za strukturę drugorzędową (β-kartki lub α-helis), lokalizację mostków disulfidowych (par cystein) oraz prolin. Bardzo istotne jest także prawidłowe dopasowanie fragmentów sekwencji obecnych w miejscach odpowiedzialnych za funkcje danego białka, w miejscach wiążących ligandy oraz motywów (fragmentów sekwencji) charakterystycznych dla danej rodziny białek. Pomocne w identyfikacji wyżej wymienionych obszarów może być wykonanie uliniowienia wielu różnych sekwencji białek (ang. multiple sequenece alignment) należących do tej samej rodziny lub, w niektórych przypadkach, białek pełniących podobną funkcję.

Szacuje się, że jeśli podobieństwo sekwencyjne między szablonem a budowanym białkiem przekracza 50%, otrzymany model wykazuje dużą dokładność (podobieństwo do struktury natywnej) porównywalną z dokładnością metod NMR. Podstawowe błędy mogą dotyczyć wtedy upakowania łańcuchów bocznych aminokwasów. Podobieństwo sekwencyjne między 30%-50% może prowadzić do niewłaściwego dopasowania odcinków sekwencji, a w rezultacie do otrzymania błędnej konformacji dla poszczególnych fragmentów łańcucha peptydowego, zwłaszcza w rejonie pętli. Przyjmuje się, iż podobieństwo sekwencji niższe niż 30% jest zwykle niewystarczające do otrzymania prawidłowego modelu białka.

Następnym etapem modelowania przez homologię jest przepisanie współrzędnych z szablonu (białka o znanej strukturze przestrzennej) na poszczególne atomy budowanego białka na podstawie wykonanego wcześniej uliniowienia sekwencji. Jednym z programów pozwalającym na przewidywanie struktury przestrzennej białek za pomocą metod porównawczych jest MODELLER [2-4]. W programie tym współrzędne atomów budowanego białka definiowane są za pomocą więzów (ang. restraints) przestrzennych pobranych bezpośrednio ze struktury szablonu.

Często jednak zdarza się, że w uliniowionych sekwencjach występują przerwy (ang. gaps). Ma to miejsce głównie w obszarze pętli modelowanej cząsteczki. W programie MODELLER znalezienie odpowiedniej konformacji dla tych fragmentów odbywa się dwiema metodami. W przypadku krótkich pętli (poprawne rezultaty otrzymujemy z reguły dla fragmentów poniżej 7 aminokwasów) program automatycznie generuje losowe ułożenie przestrzenne aminokwasów, a następnie optymalizuje geometrię dodanego fragmentu. W przypadku dłuższych pętli, program przeszukuje bazę znanych struktur przestrzennych białek (PDB) w celu odszukania fragmentu łańcucha białkowego wykazującego jak największe podobieństwo sekwencyjne. Program ocenia również czy struktura pętli, zbudowana na podstawie tak odszukanego fragmentu, będzie mogła być poprawnie dopasowana do pozostałej części modelowanego białka. Po wstawieniu brakującej części łańcucha białkowego, jego geometria jest dodatkowo optymalizowana.

Ocena modelu

Otrzymany model białka należy poddać ocenie, aby zweryfikować poprawność struktury i jego przydatność do dalszych badań. Pierwszym kryterium jest jego ocena wizualna. Bardzo użyteczne na tym etapie są dane strukturalne pochodzące z badań eksperymentalnych. Na ich podstawie możemy w niektórych przypadkach zweryfikować obecność wiązań disulfidowych w łańcuchu peptydowym, miejsc wiązania ligandów, a nawet odległości pomiędzy poszczególnymi resztami. Niestety, rzadko dysponujemy taką wiedzą. Dlatego w celu wykrycia ewentualnych nieprawidłowości w zbudowanym modelu należy skorzystać z dostępnych programów umożliwiających ocenę struktury białka.

Program PROCHECK [5] pozwala na analizę geometrii oraz stereochemii modelowanej cząsteczki. Program ten sprawdza wartości kątów φ i ψ, wartości kątów płaskich, planarność wiązań peptydowych, długości wiązań między atomami oraz konformację łańcuchów bocznych aminokwasów, a także geometrie wiązań wodorowych. Zmierzone wartości oraz parametry łańcucha białkowego zbudowanego modelu mogą być następnie zestawione z odpowiadającymi im wartościami, pochodzącymi ze znanych struktur krystalicznych białek.

Metoda Verify3D [6, 7] pozwala na ocenę prawidłowego upakowania aminokwasów w łańcuchu peptydowym przez ocenę kompatybilności danej reszty z jej otoczeniem. Program sprawdza, między innymi wzajemne położenie aminokwasów o właściwościach hydrofilowych i hydrofobowych, ekspozycje reszt naładowanych na zewnątrz białka oraz tendencje do przyjmowania przez dane aminokwasy określonej struktury drugorzędowej. Profil weryfikujący poprawność modelu powstaje przez przyznanie każdej z reszt określonej punktacji. Liczba przyznawanych punktów oparta jest na statystycznej preferencji występowania każdego z 20 aminokwasów w określonym otoczeniu, jaka jest obserwowana w znanych strukturach białek.

Aby ocena modelu była wiarygodna należy korzystać z jak największej liczby dostępnych metod i narzędzi pomocnych w ocenie struktury przestrzennej budowanego białka, między innymi takich jak: Proq [8], Anolea [9-11], ProsaII [12, 13]. W przypadku stwierdzenia błędów w strukturze zbudowanego modelu należy wrócić do poprzednich etapów modelowania (wyboru szablonu, uliniowienia sekwencji…itd.) w celu usunięcia możliwych błędów lub doboru innych parametrów.

Zobacz też

Literatura

  1. Needleman, S.B. and C.D. Wunsch, A general method applicable to the search for similarities in the amino acid sequence of two proteins. J Mol Biol, 1970. 48(3): p. 443-53.
  2. Eswar, N., et al., Protein structure modeling with MODELLER. Methods Mol Biol, 2008. 426: p. 145-59.
  3. Eswar, N., et al., Comparative protein structure modeling using MODELLER. Curr Protoc Protein Sci, 2007. Chapter 2: p. Unit 2 9.
  4. Sali, A., et al., Evaluation of comparative protein modeling by MODELLER. Proteins, 1995. 23(3): p. 318-26.
  5. Laskowski, R.A., et al., PROCHECK: a program to check the stereochemical quality of protein structures. J. Appl. Cryst., 1993. 26: p. 283-291.
  6. Bowie, J.U., R. Luthy, and D. Eisenberg, A method to identify protein sequences that fold into a known three-dimensional structure. Science, 1991. 253(5016): p. 164-70.
  7. Luthy, R., J.U. Bowie, and D. Eisenberg, Assessment of protein models with three-dimensional profiles. Nature, 1992. 356(6364): p. 83-5.
  8. Schwarzenbacher, R., et al., The importance of alignment accuracy for molecular replacement. Acta Crystallogr D Biol Crystallogr, 2004. 60(Pt 7): p. 1229-36.
  9. Melo, F., et al., ANOLEA: a www server to assess protein structures. Proc Int Conf Intell Syst Mol Biol, 1997. 5: p. 187-90.
  10. Melo, F. and E. Feytmans, Novel knowledge-based mean force potential at atomic level. J Mol Biol, 1997. 267(1): p. 207-22.
  11. Melo, F. and E. Feytmans, Assessing protein structures with a non-local atomic interaction energy. J Mol Biol, 1998. 277(5): p. 1141-52.
  12. Sippl, M.J., Recognition of errors in three-dimensional structures of proteins. Proteins, 1993. 17(4): p. 355-62.
  13. Wiederstein, M. and M.J. Sippl, ProSA-web: interactive web service for the recognition of errors in three-dimensional structures of proteins. Nucleic Acids Res, 2007. 35(Web Server issue): p. W407-10.