Je tu obrovský problém s jádrem projektu lidského genomu

$config[ads_kvadrat] not found

Alison Tyler at her 1st Fitness Competition

Alison Tyler at her 1st Fitness Competition

Obsah:

Anonim

Projekt Lidský genom, který začal v 90. letech, byl Homo sapiens Pokusu zmapovat celou DNA našeho druhu. Produkoval lidský referenční genom, jemně leštěnou sbírku lidské DNA, která je klíčová pro výzkum genetiky a testování genetiky po celém světě. Dva vědci z Univerzity Johnse Hopkinse zjistili, že referenční genom postrádá kus nebo dvě jamky, 296 485 284 párů bází DNA, aby bylo přesné.

Referenční genom je základní mapa lidského genetického materiálu, která se používá jako základ pro srovnání. Když sledujeme svou vlastní DNA pro pochopení zdraví, rodinné historie a budoucího rizika onemocnění, rozsekáme sekvenci na spoustu malých kousků a porovnáme její úseky s referenčním genomem, hledáme oblasti, kde se liší. Základní problém s tím, vědci píšou v nedávném dokumentu v Nature Genetics je to, že referenční genom je založen převážně na jedné osobě. Vzhledem k nesčetným genetickým rozdílům mezi 7,7 miliardami lidí, kteří dnes žijí, to samozřejmě není ideální.

Profesor informatiky a biostatistiky Steven Salzberg, Ph.D., a Rachel Sherman, Ph.D. tento případný genom nezachycuje rozmanitost lidské genetiky. Některé populace se liší příliš mnoho z tohoto referenčního genomu. Pro jejich případy se vztahují k genomům 910 jednotlivců z dvaceti různých zemí, z nichž pan-afrického původu.

V DNA těchto jedinců našel tým 300 milionů kusů DNA, které v našem „referenčním“ genomu neexistují. Pokud nebudeme brát ohled na tento materiál, říká Salzberg, nevyhnutelně nám uniknou klíčové poznatky o zdraví a historii konkrétních populací. Jsou také lidé, takže by neměli být zastoupeni v „lidském“ referenčním genomu?

„Tyto oblasti jsou pro komunitu genetiky v podstatě neviditelné, dokud nemáme referenční genom, který zahrnuje tyto regiony,“ říká Salzberg Inverzní.

Problém s referenčním genomem.

V průběhu let jsme průběžně zpracovávali referenční genom. Ale nedávná analýza naznačuje, že téměř sedmdesát procent jeho materiál byl sbírán od jediného Afričana-americký jednotlivec, kdo je odkazoval se jen jako RPCI-11, vysvětluje Salzburg.

To znamená, že když vědci provádějí genetickou analýzu, aby identifikovali rozdíly mezi různými populacemi z celého světa, většinu času srovnávají tyto genomy s genetickým materiálem, většinou od jedné osoby. To nás vede k tomu, abychom často ignorovali materiál, který by mohl být příliš odlišný od tohoto odkazu, říká Sherman. Říká jim „chybějící kusy“.

„Když se vám něco podaří, budou tam kousky, které se neliší vůbec, protože jsou příliš odlišné, než aby odpovídaly cokoliv z referenčního genomu.“ Sherman říká. "Pak ignorujete všechny věci, které nejsou v pořádku, protože nejsou opravdu relevantní, nebo opravdu nestojí za to, abyste se podívali na to, kdy jsou to vlastně ty kusy, které jsou nejvíce zajímavé, protože se nejvíce liší od referenčního genomu."

Ve studii si Sherman a Salzberg vzali velké kousky tohoto „odlišného“ materiálu (asi 1000 párů bází) a snažili se zjistit, zda představují pouze náhodné struny sekvenčních chyb - nebo skutečně měli užitečné informace o neprozkoumaných lidských DNA.

Tým dospěl k závěru, že tato „nová“ DNA má dostatečně vysokou kvalitu, aby si vyžadovala druhý průchod, i když neví, jaký je její význam pro lidské tělo.

Jaké jsou důsledky?

Sherman zatím říká, že nevíme, co nám chybí, ignorováním DNA, která není v referenčním genomu zastoupena. Ale kdo ví, co bychom tam mohli najít, když se podíváme?

Salzberg navrhuje, abychom si představili fiktivní populaci, která má navíc chromozom - 24 místo obvyklých 23 v každé buňce. Nic v tomto extra chromozomu z této populace by nebylo v souladu s referenčním genomem. Možná, říká, někde na tomto skrytém chromozomu, je důvodem, proč smyšlená populace má tendenci vyvíjet určité onemocnění - a proč zbytek světa ne. Ale protože nemáme ten správný odkaz, abychom to srovnávali, nikdy bychom to nevěděli.

Originální reklama, která přinesla dárce pro projekt Lidský genom (Buffalo News, 23.3.1997), h / t Pieter de Jong, který umístil reklamu pic.twitter.com/gNB7mMv3Yu

- Jay Shendure (@JShendure) 28. října 2017

„Kdyby jednou za čas existovaly mutace v tom chromozomu, které by způsobily problémy, nikdy byste je nemohli studovat,“ říká Salzberg. „Nikdy byste je nebyli schopni pozorovat, pokud byste se spoléhali výhradně na tento referenční genom.“

Jasně řečeno: tento výzkum neposkytuje důkazy o nějakém neobjeveném chromozomu. Ale to naznačuje, že jsme pravděpodobně chybí hodně, když používáme jeden referenční genom z nějaké osoby zvané RPCI-11 jako základ pro všechny naše analýzy na DNA našeho celého druhu.

Jak to můžeme opravit?

Namísto snahy o jednotný univerzální referenční genom, tým tvrdí, že bychom měli mít chomáč referenčních genomů - snad jeden pro každou populaci zájmu.

„To, co jsme s tímto zjištěním obhajovali, je to, že skutečně potřebujeme budovat referenční genomy pro každou populaci,“ říká Sherman. „Pokud v této populaci chybí v DNA mnoho DNA, model se musí změnit.“

Některé země si to vzaly na sebe, aby se alespoň pokusily vytvořit vlastní referenční genomy. Například Dánsko sestavuje genetický materiál od 150 Dánů ve snaze vytvořit skutečný „dánský“ referenční genom. Papír v roce 2016 Příroda popisuje pokus o kompilaci odkazu pro korejské jednotlivce, ačkoli tento papír také popisuje pouze výzkum prováděný na jedné osobě. Ale i jiné projekty, jako je projekt 1000 Genomes, se také snaží tento proces zahájit, ale je to hodně práce na vytvoření referenčního materiálu, který je vyleštěn jako současná verze, známá jako GRCh38.

„Musíte udělat více, než jen jít a poslat další osobu z jiné populace, abyste vytvořili referenční genom,“ dodává. "Musíš udělat o něco víc."

Není to o tom, že by výzkumníci nevěděli, že potřebujeme více referenčních genomů. Salzberg jen doufá, že jich bude více a že budou přinejmenším široce přijímány jako standardní referenční genomy. Dokument naráží na to, že žádný z těchto pokusů nedosáhl stejného statusu a vlivu jako GRCh38 - i když je to cíl dánského projektu.

Sherman a Salzberg jdou dál, aby si tento projekt zahajovali, a to budováním několika dalších referenčních genomů, o kterých doufají, že se vydají za jeden až dva roky. Chtějí začít vytvářet knihovnu referenčních genomů, která by lidem pomohla získat co nejvíce informací o jejich genetickém materiálu, bez ohledu na to, jak je „odlišný“.

"Co opravdu potřebujeme, jsou stovky referenčních genomů," dodává. "To se stane jeden den."

$config[ads_kvadrat] not found