Historia sekwencjonowania genomu:


Original: http://bioinfo.mbb.yale.edu/course/projects/final-4/
Copyright: Edmund Pillsbury

Sekwencjonowanie genomu ludzkiego wraz z towarzyszącymi organizmów stanowi jedno z największych przedsięwzięć naukowych w historii ludzkości. Informacje zdobywane od sekwencjonowania zapewni surowe dane dla pola eksploduje bioinformatyki, gdzie informatyka i biologia żyje w symbiotycznej harmonii. Duży sekwencjonowanie skala zaproponowana przez Human Genome Project w 1990 roku nie mogła być rzeczywistość bez nowoczesnych urządzeń komputerowych. Jedynie, dwadzieścia lat temu komputery byłby bezsilny w obliczu takiej ilości trudnym i tablicy danych. Identyfikacja i charakterystyka genomu homolog między organizmami milionów nukleotydów tworzących pomyślenia było, aż do szybkiego rozwoju mikroprocesorów i procesorów w ciągu ostatnich dwóch dekad. Ponadto pierwsze sekwencjonowanie genomu żywego organizmu, Haemophilus influenzae, byłoby niemożliwe bez metod obliczeniowych opracowanych na obiektach Instytutu Genetyki (TIGR). Choć nie jest to technicznie aspekt bioinformatyki, rozwój ten byłby niemożliwy z komputerami z wczoraj. Krótka historia sekwencjonowania genomu rozpoczął wynalazku Fryderyka Sanger w sekwencjonowania prawie dwadzieścia pięć lat temu.

Sztuka określenie sekwencji DNA jest znana jako Sanger sekwencjonowania po genialny pionier. Technika ta obejmuje oddzielenie fluorescencyjne znakowanych fragmentów DNA w oparciu o ich długość na żelu polyacrilimide (PAGE). Podstawa na końcu każdego fragmentu mogą być widoczne przez identyfikację i barwnika, z którymi wchodzi w reakcję. Czas i pracochłonne charakter preparatu żelu i działa, jak również duże ilości próbki wymagane, zwiększenie czasu i kosztów sekwencjonowania genomowego. Te warunki drastycznie obniżyć efektywność projektów sekwencjonowania ostatecznie ograniczających naukowców w ich próbach sekwencjonowania.

Bakteriofaga fX174, pierwszy do sekwencjonowania genomu, w genom wirusa tylko 5368 par zasad (bp). Frederic Sanger, w innym rewolucyjnego odkrycia, wynalazł metodę “Strzelba” sekwencjonowania, strategia oparta na izolacji przypadkowych kawałków DNA z genomem gospodarza, które mają być używane jako startery do amplifikacji PCR całego genomu. Wzmocniony fragmenty DNA są następnie montowane przez ich regionów pokrywających tworząc ciągłe zapisy (inaczej znany jako sąsiadujących). Końcowy etap polegał na wykorzystanie niestandardowych starterów w celu wyjaśnienia rozbieżności między kontigów pozostawiając całkowicie sekwencjonowaniu genomu. Sanger pierwszy zastosowano “Strzelba” sekwencjonowania pięć lat później, aby zakończyć sekwencję bakteriofaga l, który był znacznie większy, 48.502 bp. Metoda ta pozwoliła projektów sekwencjonowania prowadzono w znacznie szybszym tempie więc rozszerzenie zakresu realistycznym przedsięwzięciem sekwencjonowania. Od tego czasu kilka innych genomów wirusowych i organellar zostały zsekwencjonowane przy użyciu podobnych technik, takich jak na 229 kb z genomu wirusa cytomegalii (CMV), 192 kb genomu krowianki, oraz 187 kb i mitochondrialne 121 kb chloroplastu z genomów Marchantia polymorpha, genomu i 186 kb ospy.

Sukces z wirusowym sekwencjonowania genomu wynikała z relatywnie niewielkiej długości ich kodów genetycznych. W 1989 roku, Andre Goffeau utworzenie europejskiego konsorcjum do sekwencji genomu pączkowania drożdży Saccharomyces cerevisiae (12,5 Mb). Europejska współpraca Goffeau jest zaangażowanych 74 różnych laboratoriach wyciągnięte do projektu w nadziei sekwencjonowanie homologi swoich ulubionych genów. Większość laboratoriów wykorzystywane Sanger to “Strzelba” metodę sekwencjonowania, która stała się akceptowanym standardem dla sekwencjonowania genomu. S. cerevisiae miał ćwiczenie około 60 razy większa niż każda sekwencja uprzednio próbował wskazując dlaczego Goffeau poczuł się zmuszony, aby zaprosić do współpracy grupy laboratoriów. W czasie sekwencjonowania organizmów modelowych, takich jak S. cerevisiae wydawało się logicznym krokiem w kierunku ostatecznego charakterystyki ludzkiego genomu, zadanie wydawało się, że poza zakresem technologii ze względu na jego ogromną wielkość 3.000 Mb. Sekwencjonowanie genomu podkreślający mniejsze problemy z technik sekwencjonowania ostatecznie dopracowaniu technologii do wykorzystania na dużych projektów, takich jak H. Sapiens. Ponadto cenne dotyczących tych organizmów byłoby zdobyte wyjaśnienia ich genetycznego.

W następnym roku wszczęcie mnóstwo ambitnych propozycji sekwencjonowania najważniejsze jest wprowadzenie Human Genome Project w 1990 roku. US Human Genome Project (HGP) jest wspólnym przedsięwzięciem Departamentu Energii i Narodowego Instytutu Zdrowia, który został zaprojektowany jako program trzech kroków do produkcji genetyczne mapy, mapy fizyczne i wreszcie kompletny nukleotydów mapa sekwencji ludzkiego chromosomami. Pierwsze dwa cele projektu są praktycznie spełnione, a teraz większość prac koncentruje się na dokładnej sekwencji nukleotydowej człowieka. W ślad za tym ogłoszeniem przyszedł początek z trzech projektów mających na celu poznanie sekwencji mniejszych organizmów modelowych, podobnych do S. cerevisiae w ich akademickiej użyteczności, takich jak Escherichia. coli, Mycoplasma capricolum i Caenorhabditis. elegans. Liczono na to, że projekty te zwiększą wydajność sekwencjonowania ale niestety daleki od tego zadania. Wiele oczekuje się, że E. coli będzie pierwszym do sekwencjonowania genomu w całości, ale do szoku społeczności naukowej, faworyt wygrał wyścig na pierwszej sekwencji całego genomu wolnego żywego organizmu, Haemophilus influenzae.

Zespół kierowany przez J. Craig Venter z Instytutu Genomic Research (TIGR) oraz laureata Nagrody Nobla Hamiltona Smitha z Johns Hopkins University, sekwencjonowanie 1,8 bakterię Mb nowych metod obliczeniowych opracowanych w zakładzie Tigr jest w Rockville, w stanie Maryland. Poprzednie projekty sekwencjonowania zostały ograniczone przez brak odpowiednich metod obliczeniowych do montażu dużej ilości przypadkowych sekwencji produkowanych przez “Strzelba” sekwencjonowania. W konwencjonalnym sekwencjonowania genomu podziale mozolnie do sortowane, nakładanie segmentów, z których każdy zawiera do 40 kb DNA. Segmenty te są “shotgunned” na mniejsze kawałki, a następnie sekwencjonuje się odtworzyć genom. Zespół Venter jest wykorzystywana bardziej kompleksowego podejścia poprzez “shotgunning” całe 1,8 mb H. influenzae genom. Wcześniej takie podejście nie udało, ponieważ oprogramowanie nie istnieje w montażu takiej ogromnej ilości informacji dokładnie. Oprogramowanie opracowane przez TIGR zwany Assembler TIGR był na wysokości zadania i odtworzenie około 24.000 fragmenty DNA do całego genomu. Po H. influenzae genom “shotgunned” i klony oczyszcza dostatecznie oprogramowanie Assembler TIGR wymaga około 30 godzin centralnej jednostce czasu przetwarzania na SPARCenter 2000 zawierającego pół gigabajta pamięci RAM, co świadczy o ogromnej złożoności obliczeń.

Venter na H. influenzae projektu nie udało się zdobyć dofinansowanie z Narodowego Instytutu Zdrowia wskazując na poważne wątpliwości otaczających jego ambitnego projektu. To po prostu nie wierzono, że takie podejście może sekwencja duży 1,8 sekwencję Mb bakterii dokładnie. Venter okazało wszyscy tak i udało sekwencjonowania genomu w 13 miesięcy w cenie 50 centów na podstawie, która miała pół koszty i znacznie szybciej niż konwencjonalne sekwencjonowania. Ta nowa metoda sekwencjonowania doprowadziły do ​​wielu zakończonych sekwencji ciągu kolejnych latach przez TIGR. Mycoplasma genitalium, bakteria, która jest związana z zakażeniami dróg rozrodczym i jest znane za najkrótszy genom wszystkich organizmów wolno żyjących zsekwencjonowano przez TIGR w okresie ośmiu miesięcy od stycznia do sierpnia 1995 roku niezwykły przykład efektywności Nowa metoda jest Tigr sekwencjonowanie. TIGR później opublikował pierwszą sekwencję genomu przedstawiciela archeowców, Methanococcus jannaschii, pierwsza sekwencja genomu siarkę metabolizmie organizmu, Archaeoglobus fulgidus, sekwencja genomu patogenu zaangażowanych w chorobie wrzodowej, Helicobacter pylori, a sekwencja genomu z boreliozy krętki, Borrelia burgdorferi.

Dramatyczny rolę TIGR lidera w dziedzinie sekwencjonowania genomu towarzyszył finalizację dwóch największych sekwencji genomowych, bakterie E. coli K-12, i, drożdże S. cerevisiae, w roku 1997. Projekty te były zwieńczeniem ponad siedem lat intensywnej pracy. Genomu drożdży był ostateczny wynik ogromnej międzynarodowej współpracy ponad 600 naukowców z ponad 100 laboratoriów reprezentujących największą zdecentralizowanego eksperyment w nowoczesnej biologii molekularnej. Prace końcowe stanowiły wysiłki naukowców z Japonii, Europie, Kanadzie i Stanach Zjednoczonych produkujących największą pełną sekwencję długość (12 MB) kiedykolwiek zrobiliśmy. W niesamowitym wyświetlaczu organizacyjnej mistrzostwa tylko 3,4% całości wysiłków sekwencjonowania były powielane między laboratoriami. Sekwencja E. Coli był znacznie mniejszy (4,6 Mb), ale równie ważne z punktu widzenia doświadczalnego użyteczności. E. coli jest preferowany model biochemicznych genetyki, biologii molekularnej i biotechnologii, a jego charakterystyka genomu będzie niewątpliwie dalszych badań w kierunku pełniejszego zrozumienia tego ważnego experimental, medycznych i organizmu przemysłowego.

Na zakończenie 1997 roku, jesteśmy w połowie drogi wyznaczony czas zakończenia Human Genome Project wyświetlanego zakończyć w dniu 30 września 2005 roku około pięćdziesiąt lat po przełomowym papierze Watson i Crick. Obecnie główne grupy przeprowadzili sekwencjonowanie około 50 Mb ludzkiego DNA, które stanowią mniej niż 1,5% w 3000 genomu Mb. Szacunkowa wykończenie ludzkiego genomu przez rok 2000 wydaje się dość optymistyczne, uznając, że na świecie na dużą skalę pojemność sekwencjonowanie około 100 Mb rocznie. Aby zakończyć genom średnia produkcja musi zwiększyć do 400 MB na rok. Kilka czynników, w tym powolnym tempem Sanger sekwencjonowania i wysoki cel dokładność HGP, który pozwala na jednym błędzie w 10.000 baz ogranicza zdolność naukowców, aby przejść szybciej. Postęp w Sanger sekwencjonowania lub wymianą możliwe do tego czasu proces intensywnego będzie konieczne dla zapewnienia HGP, jakim jest zakończenie do roku 2005.

Począwszy od września 1997 roku, trzynaście sekwencje genomu organizmów wolno żyjących, zostały ukończone w tym dwóch największych, E. coli i drożdży i jedenastu innych genomów mikroorganizmów pod długości 4,2 Mb. Czterech innych dużych projektów trwają tym kolejności nicieni C. elegans, 71%, który jest wypełniony, muszki owocowej, Drosophola melanogaster 6%, który jest wypełniony, myszy, która ma mniej niż 1% zakończeniu i człowieka, który jest tylko 1,5% ukończone. Te statystyki są imponujące biorąc pod uwagę, że tylko cztery lata temu, nie ukończone sekwencje istniał.

Szybkiego rozprzestrzeniania informacji biologicznej w postaci sekwencji genomu była głównym czynnikiem w tworzeniu dziedzinie bioinformatyki, która koncentruje się na nabycie, przechowywania, dostępu, analiza, modelowanie i dystrybucji wielu rodzajów informacji osadzonych w sekwencje DNA. To pole zostanie zakwestionowana przez wymagania podwyższanie szerszej informacji na temat obecnie stosowanych algorytmów do manipulacji sekwencji. Rosnąca wiedza sekwencji ludzkiego genomu, porównywany do utworzenia układu okresowego w 19 wieku. Podobnie jak w przeszłości apteki uporządkowali wszystkie elementy w tablicy, którym zrobione ich różnice i podobieństwa, Human Genome Project pozwoli współcześni naukowcy skonstruować biologiczną okresowego dotyczącego jednostek nukleotydów. Okresowego nie będzie zawierać 100 elementów, ale 100.000 geny odbijająca nie ich podobieństwo w elektronicznych konfiguracji ale ich ewolucyjne i funkcjonalny związek. Bioinformatyka będzie narzędziem współczesnego uczonego w interpretacji tego okresowego informacji biologicznej.

W przypadku jakichkolwiek uwag dotyczących poczty papierowej autora: Edmund Pillsbury.

Comments are closed.