Zmienność strukturalna - Structural variation

Genomowa zmienność strukturalna to zmienność struktury chromosomu organizmu . Składa się z wielu rodzajów zmienności w genomie jednego gatunku i zwykle obejmuje typy mikroskopowe i submikroskopowe , takie jak delecje, duplikacje, warianty liczby kopii , insercje, inwersje i translokacje . Oryginalnie zmienność struktury wpływa na długość sekwencji około 1 kb do 3 MB, która jest większa niż SNP i mniejsza niż anomalia chromosomowa (chociaż definicje częściowo się pokrywają). Jednak zakres operacyjny wariantów strukturalnych poszerzył się o zdarzenia > 50 pb. Definicja zmienności strukturalnej nie implikuje niczego na temat częstotliwości lub efektów fenotypowych. Wiele wariantów strukturalnych jest związanych z chorobami genetycznymi , jednak wiele nie. Ostatnie badania dotyczące SV wskazują, że SV są trudniejsze do wykrycia niż SNP. Około 13% ludzkiego genomu definiuje się jako wariant strukturalny w normalnej populacji, a co najmniej 240 genów istnieje jako homozygotyczne polimorfizmy delecyjne w populacjach ludzkich, co sugeruje, że te geny są zbędne u ludzi. Szybko gromadzone dowody wskazują, że zmiany strukturalne mogą obejmować miliony niejednorodności nukleotydów w każdym genomie i prawdopodobnie wnoszą istotny wkład w różnorodność ludzi i podatność na choroby.

Mikroskopowa zmienność strukturalna

Mikroskop oznacza, że ​​można go wykryć za pomocą mikroskopów optycznych , takich jak aneuploidie , chromosom markerowy , duże rearanżacje i zmienność wielkości chromosomów. Uważa się, że częstość występowania w populacji ludzkiej jest niedoszacowana, ponieważ niektóre z nich nie są w rzeczywistości łatwe do zidentyfikowania. Te nieprawidłowości strukturalne występują w 1 na 375 żywych urodzeń według przypuszczalnych informacji.

Submikroskopowa zmienność strukturalna

Submikroskopowe warianty strukturalne są znacznie trudniejsze do wykrycia ze względu na ich niewielkie rozmiary. Pierwsze badanie z 2004 r., w którym wykorzystano mikromacierze DNA, pozwoliło wykryć dziesiątki genetycznych loci, które wykazywały zmienność liczby kopii , delecje i duplikacje , większe niż 100 kilozasad w ludzkim genomie. Jednak do 2015 roku badania sekwencjonowania całego genomu mogą wykryć około 5000 wariantów strukturalnych tak małych jak 100 par zasad obejmujących około 20 mega zasad w każdym pojedynczym genomie. Te warianty strukturalne obejmują delecje, duplikacje tandemowe, inwersje , insercje elementów ruchomych . Częstość mutacji jest również znacznie wyższa niż mikroskopijnych wariantów strukturalnych, oszacowanych w dwóch badaniach odpowiednio na 16% i 20%, z których oba są prawdopodobnie niedoszacowane ze względu na wyzwania związane z dokładnym wykryciem wariantów strukturalnych. Wykazano również, że generowanie spontanicznych wariantów strukturalnych znacząco zwiększa prawdopodobieństwo wygenerowania dalszych spontanicznych wariantów pojedynczego nukleotydu lub indeli w obrębie 100 kilozasad od zdarzenia zmienności strukturalnej.

Odmiana numeru kopii

Zmienność liczby kopii (CNV) to duża kategoria zmienności strukturalnej, która obejmuje insercje , delecje i duplikacje . W ostatnich badaniach zmienność liczby kopii testuje się na osobach, które nie mają chorób genetycznych, przy użyciu metod stosowanych do ilościowego genotypowania SNP. Wyniki pokazują, że 28% podejrzanych regionów u osobników rzeczywiście zawiera różnice w liczbie kopii. Ponadto CNV w ludzkim genomie wpływają na więcej nukleotydów niż polimorfizm pojedynczego nukleotydu (SNP). Warto również zauważyć, że wiele CNV nie znajduje się w regionach kodujących. Ponieważ CNV są ​​zwykle spowodowane nierówną rekombinacją , rozpowszechnione podobne sekwencje, takie jak LINE i SINE, mogą być powszechnym mechanizmem tworzenia CNV.

Inwersja

Znanych jest kilka inwersji związanych z chorobami człowieka. Na przykład, powtarzająca się 400 kb inwersja w genie czynnika VIII jest częstą przyczyną hemofilii A , a mniejsze inwersje wpływające na 2-sulfatazę idunoranową (IDS) powodują zespół Huntera . Więcej przykładów to zespół Angelmana i zespół Sotosa . Jednak ostatnie badania pokazują, że jedna osoba może mieć 56 domniemanych inwersji, a zatem inwersje niezwiązane z chorobą są częstsze niż wcześniej sądzono. Również w tym badaniu wskazano, że punkty przerwania inwersji są powszechnie związane z duplikacjami segmentów. Jedna inwersja o długości 900 kb w chromosomie 17 jest poddawana selekcji pozytywnej i przewiduje się, że jej częstotliwość zwiększy się w populacji europejskiej.

Inne warianty konstrukcyjne

Mogą wystąpić bardziej złożone warianty strukturalne, w tym połączenie powyższych w jednym zdarzeniu. Najczęstszym typem złożonej zmienności strukturalnej są duplikacje nietandemowe, w których sekwencja jest duplikowana i wstawiana w odwróconej lub bezpośredniej orientacji do innej części genomu. Inne klasy złożonych wariantów strukturalnych obejmują delecję-inwersję-delecję, duplikację-inwersję-duplikację i duplikację tandemową z delecjami zagnieżdżonymi. Istnieją również kryptyczne translokacje i segmentalna jednorodzicielska disomia (UPD). Pojawia się coraz więcej doniesień o tych odmianach, ale są one trudniejsze do wykrycia niż tradycyjne odmiany, ponieważ te odmiany są zrównoważone i metody oparte na macierzach lub PCR nie są w stanie ich zlokalizować.

Zmienność strukturalna i fenotypy

Podejrzewa się, że niektóre choroby genetyczne są spowodowane zmianami strukturalnymi, ale związek nie jest do końca pewny. Nie jest prawdopodobne, aby podzielić te warianty na dwie klasy jako „normalne” lub „choroba”, ponieważ rzeczywista wydajność tego samego wariantu również będzie się różnić. Ponadto kilka wariantów jest faktycznie pozytywnie wybranych (wspomnianych powyżej). Seria badań wykazała, że spontaniczne ( de novo ) CNV uszkadzające geny uszkadzają geny w przypadku autyzmu około cztery razy częściej niż w grupie kontrolnej i przyczyniają się do około 5–10% przypadków. Odziedziczone warianty również przyczyniają się do około 5–10% przypadków autyzmu.

Zmienność strukturalna ma również swoją funkcję w genetyce populacyjnej. Różną częstotliwość tej samej zmienności można wykorzystać jako znak genetyczny w celu wywnioskowania związku między populacjami na różnych obszarach. Pełne porównanie zmienności strukturalnej człowieka i szympansa sugeruje również, że niektóre z nich mogą być utrwalone w jednym gatunku ze względu na jego funkcję adaptacyjną. Istnieją również delecje związane z odpornością na malarię i AIDS . Uważa się również, że niektóre wysoce zmienne segmenty są spowodowane równoważeniem doboru, ale istnieją również badania przeciwko tej hipotezie.

Baza danych zmienności strukturalnej

Niektóre przeglądarki genomu i bioinformatyczne bazy danych mają listę zmian strukturalnych w ludzkim genomie z naciskiem na CNV i mogą wyświetlać je na stronie przeglądania genomu, na przykład UCSC Genome Browser . Pod stroną wyświetlającą część genomu znajdują się „Common Cell CNVs” i „Structural Var”, które można włączyć. W NCBI znajduje się specjalna strona poświęcona zmienności strukturalnej. W tym systemie pokazane są zarówno współrzędne „wewnętrzne”, jak i „zewnętrzne”; oba nie są rzeczywistymi punktami przerwania, ale przypuszczalnymi minimalnymi i maksymalnymi zakresami sekwencji, na które wpływa zmienność strukturalna. Typy są klasyfikowane jako wstawienie, strata, wzmocnienie, inwersja, LOH, wywinięcie, transchr i UPD.

Metody wykrywania

Sygnatury i wzory SV dla delecji (A), insercji nowej sekwencji (B), inwersji (C) i duplikacji tandemowej (D) w liczbie odczytów (RC), para odczytu (RP), odczyt dzielony (SR), oraz metody montażu de novo (AS).

Opracowano nowe metody analizy genetycznej zmienności strukturalnej człowieka w wysokiej rozdzielczości. Metody stosowane do testowania genomu są albo w specyficzny, ukierunkowany sposób, albo w sposób obejmujący cały genom. W przypadku testów obejmujących cały genom, oparte na macierzach metody porównawczej hybrydyzacji genomu zapewniają najlepsze skany całego genomu w celu znalezienia nowych wariantów liczby kopii. Techniki te wykorzystują fragmenty DNA, które są znakowane z genomu będącego przedmiotem zainteresowania i są hybrydyzowane z innym genomem znakowanym inaczej, z macierzami naniesionymi na sklonowane fragmenty DNA. Ujawnia to różnice w liczbie kopii między dwoma genomami.

W przypadku ukierunkowanych badań genomu najlepsze testy do sprawdzania określonych obszarów genomu opierają się głównie na PCR. Najlepiej ustaloną z metod opartych na PCR jest ilościowa reakcja łańcuchowa polimerazy w czasie rzeczywistym (qPCR). Innym podejściem jest konkretnie sprawdzenie pewnych obszarów, które otaczają znane duplikacje segmentowe, ponieważ są to zwykle obszary zmienności liczby kopii. Metoda genotypowania SNP, która oferuje niezależne intensywności fluorescencji dla dwóch alleli, może być stosowana do namierzania nukleotydów pomiędzy dwiema kopiami segmentowej duplikacji. Na tej podstawie można zaobserwować wzrost intensywności z jednego z alleli w porównaniu z drugim.

Wraz z rozwojem technologii sekwencjonowania nowej generacji (NGS), zgłoszono cztery klasy strategii wykrywania wariantów strukturalnych za pomocą danych NGS, z których każda opiera się na wzorcach diagnostycznych różnych klas SV.

  • Metody głębokości odczytu lub liczby odczytów zakładają losowy rozkład (np. rozkład Poissona ) odczytów z sekwencjonowania krótkich odczytów. Rozbieżność od tej dystrybucji jest badana w celu wykrycia duplikacji i usunięć. Regiony z duplikacją będą miały większą głębokość odczytu, podczas gdy te z usunięciem będą skutkować niższą głębokością odczytu.
  • Metody odczytu z podziałem umożliwiają wykrywanie insercji (w tym insercji elementów ruchomych ) i usunięć do rozdzielczości pojedynczej pary zasad. Obecność SV identyfikuje się na podstawie nieciągłego dopasowania do genomu referencyjnego. Luka w odczycie oznacza usunięcie, a w odnośniku wstawienie.
  • Metody par odczytu badają długość i orientację odczytów sparowanych końców z danych sekwencjonowania krótkich odczytów. Na przykład przeczytanie par dalej od siebie niż oczekiwano oznacza usunięcie. Translokacje, inwersje i duplikacje tandemowe można również wykryć za pomocą par odczytowych.
  • Montaż sekwencji de novo może być stosowany z odczytami, które są wystarczająco dokładne. Podczas gdy w praktyce zastosowanie tej metody jest ograniczone przez długość odczytów sekwencji, zespoły genomu oparte na długim odczycie oferują wykrywanie zmienności strukturalnej dla klas takich jak insercje, które unikają wykrycia przy użyciu innych metod.

Zobacz też

Bibliografia

Zewnętrzne linki