- Tytuł:
-
Identyfikacja białek z wykorzystaniem techniki Peptide Mass Fingerprinting (PMF). Część II - algorytmy scoringu
The identification of proteins by Peptide Mass Fingerprinting (PMF). Part II - the scoring algorithms - Autorzy:
-
Kamińska, H.
Podbielska, H. - Powiązania:
- https://bibliotekanauki.pl/articles/261443.pdf
- Data publikacji:
- 2011
- Wydawca:
- Politechnika Wrocławska. Wydział Podstawowych Problemów Techniki. Katedra Inżynierii Biomedycznej
- Tematy:
-
proteomika
identyfikacja protein
spektrometria masowa
peptide mass fingerprinting
schematy scoringu
proteomics
identification of proteins
mass spectrometry
scoring schemes - Opis:
-
Postęp w dziedzinie komputerów oraz rozwój Internetu zrewolucjonizował, proces identyfikacji białek oraz przyczynił się do szybkiego wzrostu proteomicznych baz danych. Krótko po wprowadzeniu pierwszej technologii identyfikacji białek z widm spektrometrów masowych PMF (Peptide Mass Fingerprinting) okazało się, że algorytmy wykorzystywane do wyszukiwania w bazie danych protein odpowiadających wynikom eksperymentu mają kluczowe znaczenie dla wysokiej poprawności identyfikacji. Rozwój metody PMF był zatem uwarunkowany nie tylko przez usprawnienia techniczne schematu, ale przede wszystkim przez zastosowanie rozmaitych metod matematycznych i statystycznych (tzw. algorytmów scoringu) przy wyszukiwaniu poprawnych rozwiązań. Kolejnym krokiem w informatycznym usprawnieniu identyfikacji było opracowanie metod walidacji jej rezultatów na podstawie istniejących baz danych lub też symulacji. Walidacja rezultatów pozwoliła na wyeliminowanie większości błędów pierwszego rodzaju w identyfikacji metodą PMF. Przez wzgląd na powszechność stosowania metody, a także jej ulepszenia autorzy postanowili podsumować obecny stan wiedzy w tym zakresie. Praca została podzielona na dwie części: w pierwszej przedstawiono opis historii powstania metody PMF wraz z charakterystyką jej części eksperymentalnej i opisem najpopularniejszych baz danych stosowanych przy identyfikacji, natomiast druga część jest poświęcona zagadnieniom algorytmicznym związanym z wyszukiwaniem w bazie danych protein najlepiej odzwierciedlających białko analizowane w próbce. Bioinformatyczne ujęcie identyfikacji białek w drugiej części nawiązuje do specyfikacji eksperymentu, omówionej w części pierwszej publikacji. Druga część pracy w szczegółowy sposób opisuje główne aspekty porównywania mas teoretycznych i eksperymentalnych, tj. trawienie in silico, rozpoznawanie modyfikacji białek, dopasowywanie mas oraz kalibrację poprawnych dopasowań. Opisane zostały także sposoby budowania funkcji scoringowych oraz algorytmy walidacji ich wartości. Dodatkowo, w pracy przedstawiono najbardziej znane funkcje scoringowe oraz pełny przegląd oprogramowania do identyfikacji białek metodą PMF.
The internet and computer science progress have revolutionized the process of protein identification and contributed to the growth of proteomics databases. Just after discovering the first technology for protein identification from the mass spectra PMF (peptide mass fingerprinting), it appeared that the algorithms searching databases for proteins corresponding to experiment results have crucial meaning for the sensitivity and specificity of the identification procedure. Therefore, the development of PMF method was conditioned by both the technological improvements in the PMF scheme and the application of various mathematical and statistical methods (so called: scoring algorithms) to the searching of correct identifications. The next step in the development of an identification procedure was to work out the methods for identification results validation, according to the proteomics databases content or simulations. The results validation allowed to eliminate the most of unwanted false positives in the PMF identification. Regarding the method common use, as well as its improvements which are still present, the authors decide to summarize the current level of knowledge related to this topic. The publication is divided into two parts. The first one is devoted to the origins of PMF scheme, the characteristics of its experimental part and a description of the most popular databases used in the identification procedure. The second part relates to the algorithmic issues of searching the database protein, which reflects the sample content best. From the bioinformatics point of view the protein identification in the second part of publication refers to the experiment specification described in the first part. The second part of the publication describes in details the aspects of theoretical and experimental masses comparison, i.e. in silico digestion, the discrimination of protein modifications, the pairing of masses and the calibration of matches. Moreover, the scoring functions building manners and the algorithms for scoring functions values validation were also taken into the consideration. Additionally, we present the most known scoring schemes with the comprehensive review of the PMF protein identification software. - Źródło:
-
Acta Bio-Optica et Informatica Medica. Inżynieria Biomedyczna; 2011, 17, 3; 239-247
1234-5563 - Pojawia się w:
- Acta Bio-Optica et Informatica Medica. Inżynieria Biomedyczna
- Dostawca treści:
- Biblioteka Nauki