Profilowanie sekwencji końcowej - End-sequence profiling

Profilowanie sekwencji końcowych (ESP) (czasami „mapowanie sparowanych końców (PEM)”) to metoda oparta na łącznikach znakowanych sekwencjami, opracowana w celu ułatwienia sekwencjonowania genomu de novo w celu identyfikacji liczby kopii o wysokiej rozdzielczości i aberracji strukturalnych, takich jak inwersje i translokacje .

Przepływ pracy profilowania sekwencji końcowej

W skrócie, docelowy genomowy DNA jest izolowany i częściowo trawiony enzymami restrykcyjnymi na duże fragmenty. Po frakcjonowaniu pod względem wielkości fragmenty klonuje się do plazmidów w celu skonstruowania sztucznych chromosomów, takich jak sztuczne chromosomy bakteryjne (BAC), które są następnie sekwencjonowane i porównywane z genomem referencyjnym. Różnice, w tym różnice w orientacji i długości między skonstruowanymi chromosomami a genomem referencyjnym, będą sugerować liczbę kopii i aberrację strukturalną.

Sztuczna konstrukcja chromosomów

Przepływ pracy budowy sztucznych chromosomów bakterii

Przed analizą aberracji strukturalnej genomu docelowego i zmienności liczby kopii (CNV) za pomocą ESP, genom docelowy jest zwykle amplifikowany i konserwowany za pomocą sztucznej konstrukcji chromosomu. Klasyczną strategią konstruowania sztucznego chromosomu jest bakteryjny sztuczny chromosom (BAC). Zasadniczo docelowy chromosom jest losowo trawiony i wstawiany do plazmidów, które są transformowane i klonowane w bakteriach. Wielkość wstawionych fragmentów wynosi 150–350 kb. Innym powszechnie stosowanym sztucznym chromosomem jest fosmid. Różnica między BAC a fosmidami polega na wielkości wstawionego DNA. Fosmidy mogą zawierać jedynie fragmenty DNA o wielkości 40 kb, co pozwala na dokładniejsze określenie punktu przerwania.

Wykrywanie aberracji strukturalnych

Profilowanie sekwencji końcowej (ESP) można wykorzystać do wykrywania zmian strukturalnych, takich jak insercje, delecje i rearanżacje chromosomowe. W porównaniu z innymi metodami, które analizują nieprawidłowości chromosomalne, metoda ESP jest szczególnie przydatna do identyfikowania nieprawidłowości neutralnych dla kopii, takich jak inwersje i translokacje, które nie byłyby widoczne podczas analizy zmienności liczby kopii. Z biblioteki BAC oba końce wstawionych fragmentów sekwencjonuje się przy użyciu platformy do sekwencjonowania. Wykrywanie zmian jest następnie osiągane przez mapowanie odczytów zsekwencjonowanych na genom referencyjny.

Inwersja i translokacja

Inwersje i translokacje są stosunkowo łatwe do wykrycia przez nieprawidłową parę zsekwencjonowanych końców. Na przykład translokację można wykryć, jeśli sparowane końce zostaną zmapowane na różne chromosomy w genomie referencyjnym. Odwrócenie można wykryć przez rozbieżną orientację odczytów, gdzie wkładka będzie miała dwa końce dodatnie lub dwa końce ujemne.

Rearanżacje chromosomów wykryte przez ESP

Wstawianie i usuwanie

W przypadku insercji lub delecji, mapowanie sparowanego końca jest zgodne z genomem referencyjnym. Ale odczyty są niezgodne z pozorną wielkością. Widoczna wielkość to odległość zsekwencjonowanych końców BAC zmapowanych w genomie referencyjnym. Jeśli BAC ma wstawkę o długości (l), zgodne mapowanie pokaże fragment o rozmiarze (l) w genomie referencyjnym. Jeśli sparowane końce są bliżej niż odległość (l), podejrzewa się insercję w pobranym DNA. Odległość (l< μ-3σ) może być użyta jako odcięcie do wykrywania wstawienia, gdzie μ jest średnią długością wkładki, a σ jest odchyleniem standardowym. W przypadku delecji sparowane końce są mapowane dalej w genomie referencyjnym w porównaniu z oczekiwaną odległością (l> μ-3σ).

Skopiuj odmianę numeru

Skopiuj zmiany numeru wykryte przez ESP

W niektórych przypadkach niezgodne odczyty mogą również wskazywać na CNV, na przykład w powtórzeniach sekwencji. W przypadku większych CNV gęstość odczytów będzie się różnić w zależności od liczby kopii. Wzrost liczby kopii zostanie odzwierciedlony przez zwiększenie mapowania tego samego regionu w genomie referencyjnym.

Historia ESP

ESP został po raz pierwszy opracowany i opublikowany w 2003 roku przez dr Collinsa i jego kolegów z Uniwersytetu Kalifornijskiego w San Francisco. Ich badania ujawniły rearanżacje chromosomów i CNV ludzkich komórek rakowych MCF7 w rozdzielczości 150 kb, co jest znacznie dokładniejsze w porównaniu do CGH i kariotypowania spektralnego w tym czasie. W 2007 roku dr Snyder i jego grupa poprawili rozdzielczość ESP do 3 kb, sekwencjonując obie pary fragmentów DNA o długości 3 kb bez konstrukcji BAC. Ich podejście jest w stanie zidentyfikować delecje, inwersje, insercje ze średnią rozdzielczością punktu przerwania 644 pz, która jest zbliżona do rozdzielczości reakcji łańcuchowej polimerazy (PCR).

Aplikacje ESP

Do analizy profilowania sekwencji końcowych można wykorzystać różne narzędzia bioinformatyczne. Typowe to BreakDancer, PEMER, Variation Hunter, common LAW, GASV i Spanner. ESP można wykorzystać do mapowania zmienności strukturalnej w wysokiej rozdzielczości w chorej tkance. Ta technika jest stosowana głównie na próbkach guzów z różnych typów raka. Dokładna identyfikacja nieprawidłowości chromosomalnych neutralnych pod względem kopii jest szczególnie ważna, ponieważ translokacja może prowadzić do białek fuzyjnych, białek chimerycznych lub nieprawidłowej regulacji białek, które można zaobserwować w guzach. Technikę tę można również wykorzystać w badaniach ewolucji, identyfikując duże różnice strukturalne między różnymi populacjami. Podobne metody są opracowywane dla różnych zastosowań. Na przykład do oceny różnorodności drobnoustrojów poprzez sekwencjonowanie znacznika 16S V6 zastosowano metodę sekwencjonowania parowanego końca Illumina (BIPES) z kodem kreskowym.

Zalety i ograniczenia

Rozdzielczość wykrywania zmienności strukturalnej za pomocą ESP została zwiększona do poziomu podobnego do poziomu PCR i można ją dodatkowo poprawić poprzez selekcję fragmentów DNA o bardziej równomiernej wielkości. ESP można zastosować zarówno z lub bez skonstruowanego sztucznego chromosomu. Dzięki BAC cenne próbki mogą być uwiecznione i zakonserwowane, co jest szczególnie ważne w przypadku niewielkich ilości małych, które są planowane do obszernych analiz. Ponadto BAC niosące przegrupowane fragmenty DNA można bezpośrednio transfekować in vitro lub in vivo w celu analizy funkcji tych układów. Jednak budowa BAC jest nadal droga i pracochłonna. Badacze powinni być naprawdę ostrożni, aby wybrać strategię, której potrzebują do konkretnego projektu. Ponieważ ESP analizuje tylko krótkie sekwencje sparowanych końców, ma tę zaletę, że dostarcza użytecznych informacji dla całego genomu bez potrzeby sekwencjonowania na dużą skalę. Około 100-200 guzów można zsekwencjonować z rozdzielczością większą niż 150 kb w porównaniu z sekwencjonowaniem całego genomu.

Bibliografia

Zobacz też