- Tytuł:
-
A system for simulation of DNA coverage in shotgun sequencing processes
System dla symulacji pokrycia DNA w procesach sekwencjonowania typu shotgun - Autorzy:
-
Garbulowski, M.
Polański, A. - Powiązania:
- https://bibliotekanauki.pl/articles/151357.pdf
- Data publikacji:
- 2014
- Wydawca:
- Stowarzyszenie Inżynierów i Techników Mechaników Polskich
- Tematy:
-
sequencing
statistic
DNA coverage
sekwencjonowanie
statystyka
pokrycie DNA - Opis:
-
A design of a computational environment for simulation and statistical analysis of shotgun DNA sequencing process is presented. The approach involves developing simulation procedures on the basis of the Lander-Waterman theory. The explored aspects concern numbers of gaps and contigs. Simulations allow drawing certain conclusions: the created model is very similar to the Lander-Waterman theory, simulations of k-mers maps by the Poisson process allows estimating statistics of contigs number.
W artykule zawarte są informacje dotyczące statystycznej analizy metody sekwencjonowania typu „Shotgun”. Projekt zakładał stworzenie środowiska obliczeniowego oraz modelu matematycznego, który jak najdokładniej odzwierciedla proces sekwencjonowania metodą „Shotgun”, wykorzystując przy tym losowe powstawanie krótkich sekwencji nukleotydowych, tak zwanych read’ów, a co za tym idzie również losowe formowanie się contig’ów – w pełni odtworzonych odcinków sekwencji. Stworzony model dzielił sekwencję zasad na zadaną ilość read’ów o stałej długości którą następnie odtwarzał poprzez porównanie końca poprzedniego i początku kolejnego read’a, sprawdzając tym samym ile fragmentów zostaje w pełni złożonych w contig’i. Jako własności statystyczne metody można rozumieć wzory Landera-Watermana przewidujące ilość powstawania contig’ów, które biorą pod uwagę całkowitą ilość read’ów, długość read’ów oraz całą długość sekwencji wejściowej. Wartości uzyskane metodą Landera-Watermana oraz uzyskane za pomocą modelu przedstawiono w postaci wykresu zależności ilości powstających contig’ów do parametru ścieżki pokrycia. Dodatkowo pod względem statystycznym wykreślono histogramy przedstawiające częstość występowania zasad w danym miejscu stworzone w oparciu o model oraz wykreślono na wykresie zakres wyników dla ilości powstających contig’ów wyliczony jako maksima i minima dla wielu losowych prób i przedstawione jako zależność od ścieżki pokrycia. - Źródło:
-
Pomiary Automatyka Kontrola; 2014, R. 60, nr 6, 6; 376-377
0032-4140 - Pojawia się w:
- Pomiary Automatyka Kontrola
- Dostawca treści:
- Biblioteka Nauki