Celogenómové sekvenovanie vs. genotypizácia – záleží na kvalite, nie na kvantite dát

Deoxyribonukleová kyselina, v skratke DNA, je nositeľkou genetickej informácie a nachádza sa v jadre takmer každej bunky v našom tele. Môžeme si ju predstaviť ako „knihu receptov“, v ktorej jednotlivé recepty predstavujú gény. Vďaka génom si vie bunka vyrobiť výsledné produkty, čo sú vo väčšine prípadov proteíny. Tie v našom organizme následne zabezpečujú rôzne úlohy, od stavebných, regulačných, transportných až po mnohé ďalšie. Pokiaľ sa v týchto receptoch (génoch) vyskytne nejaká chyba, výsledný produkt môže mať iné vlastnosti, prípadne sa nemusí vôbec tvoriť. Tieto chyby označujeme ako „mutácie“ a práve tie sú vo veľkej miere zodpovedné za rôzne odlišnosti v našom organizme.

Čo konkrétne sa píše v týchto receptoch sa nám podarilo odhaliť až začiatkom tohto storočia, kedy vedci prečítali celý ľudský genóm. Ten sa skladá z približne 3 miliárd stavebných blokov, ktoré označujeme ako tzv. „nukleotidy“. Celá sekvencia DNA je poskladaná zo 4 základných nukleotidov – adenín, guanín, cytozín a tymín. Z tohto dôvodu sa pri sekvencii DNA stretneme s písmenami A, G, C a T. Samotný sled písmen nám však nič nepovie. Dnes už vieme, že gény tvoria len približne 2 % ľudského genómu a máme ich približne 20 000. Zvyšok viac-menej nepoznáme, aj keď vieme, že aj v tejto časti sa nachádzajú dôležité oblasti pre správne fungovanie našich buniek.

Ako veľmi sa z pohľadu genetiky navzájom líšime? Naša DNA sa medzi nami zhoduje až do miery 99,9 %. Na prvý pohľad sa môže zdať, že sa takmer nelíšime. Keď sa však vrátime k veľkosti nášho genómu, zistíme, že sa líšime v približne 3 miliónoch nukleotidov. A práve tieto miesta, na ktorých sa v populácii nachádzajú rôzne písmená, sú obrovským záujmom mnohých štúdií. Vďaka týmto štúdiám dnes vieme napríklad povedať, že pokiaľ sa u vás vyskytuje na konkrétnom mieste v DNA nejaké konkrétne písmeno, potom máte zvýšenú genetickú predispozíciu na rozvoj nejakého ochorenia, ako je napríklad melanóm alebo infarkt myokardu.
Vďaka obrovskému pokroku v oblasti „čítania“ DNA má dnes takmer každý možnosť nahliadnuť priamo do svojich buniek, do sekvencie svojej DNA. Je to naozaj fenomenálny úspech vedy, keďže osekvenovať jeden ľudský genóm stálo ešte na začiatku tohto storočia približne 3 miliardy dolárov, a trvalo to 13 rokov. Dnes sme sa už dostali pod 1000 dolárov za genóm a samotné sekvenovanie trvá len niekoľko minút.

Cena DNA analýzy

V súčasnosti sú využívané hlavne dva spôsoby čítania DNA – sekvenovanie a genotypizácia.

Sekvenovanie

Jednou z techník využívaných na stanovenie sekvencie DNA je tzv. sekvenovanie, teda určovanie poradia nukleotidov v genóme jednotlivca. V súčasnosti sa využívajú najmä dva prístupy, a to tzv. celoexómové a celogenómové sekvenovanie.

Celoexómové sekvenovanie

Technológia celoexómového sekvenovania je zameraná len na konkrétne miesta v genóme, ktoré poskytujú informácie na výrobu proteínov. Predpokladá sa, že tieto časti, nazývané ako „exóny“, tvoria približne 1 % genómu človeka. Spoločne všetky exóny v genóme sú známe ako „exóm“, a preto je ich spôsob sekvenovania známy ako celoexómové sekvenovanie. Tento prístup umožňuje identifikovať mutácie v kódujúcej oblasti akéhokoľvek génu, a nie iba v niekoľkých vybraných génoch. A keďže sa väčšina známych mutácií spôsobujúcich ochorenie vyskytuje práve v exónoch, tento spôsob sekvenovania je efektívny v identifikácii takýchto potenciálnych mutácií.

Celogenómové sekvenovanie

Je však známe, že aj mutácie mimo oblastí exónov môžu ovplyvniť génovú aktivitu a produkciu bielkovín, a tým pádom môžu viesť k rôznym ochoreniam. Práve preto je najideálnejším spôsobom celogenómové sekvenovanie, ktoré určuje poradie takmer všetkých nukleotidov v genóme jednotlivca.

V súčasnosti je najbežnejšou používanou metódou tzv. ILLUMINA sekvenovanie, vďaka ktorému vzniklo viac ako 90 % všetkých sekvenačných dát na svete. Názov tejto metódy odkazuje na americkú spoločnosť, ktorá sa podieľa na vývoji, výrobe a predaji systémov na analýzu genetických variácií a biologických funkcií, a ktorá túto metódu komercionalizovala. Táto metóda je založená na detegovaní jednotlivých nukleotidov (A, G, C a T) potom, ako sa začlenia do rastúceho vlákna DNA. Detekcia nukleotidov je založená na fluorescenčnom signáli, to znamená, že každý nukleotid je označený nejakou fluorescenčnou značkou (môžeme si ju predstaviť ako nejakú farebnú značku) a po pridaní sa do reťazca počítač vyhodnotí daný signál.

Stačí však prečítať celý genóm len raz?

Momentálne ešte nie sme v bode, kedy by stačilo prečítať celý ľudský genóm len jedenkrát. V súčasnosti totižto ešte nie sú tak presné sekvenačné metódy, aby dokázali len počas jedného čítania prečítať bezchybne celý genóm. Práve z tohto dôvodu odporúča spoločnosť ILLUMINA minimálne pokrytie 30x. To znamená, že v priemere je každý nukleotid prečítaný nezávisle 30-krát.

Niektoré spoločnosti však dnes ponúkajú aj celogenómové sekvenovanie s oveľa menším pokrytím, v niektorých prípadoch dokonca s pokrytím len 1x. Pri sekvenovaní s takým nízkym pokrytím je v súčasnosti nereálne prečítať celý genóm. Ako je potom možné poskladať celú skladačku, keď z čítania nie sú k dispozícii niektoré dieliky? 

Tento proces je pomerne zložitý, ale v jednoduchosti sa využíva princíp tzv. „imputácie“. Týmto spôsobom sa štatisticky doplnia neprečítané miesta, a to na základe známych haplotypov v populácii. Využíva sa tu to, že jednotlivé nukleotidy sa nededia samostatne, ale dedia sa spoločne v skupinách, ktoré označujeme ako „haplotypy“. Aby sme však mohli považovat sekvenovanie s takýmto nízkym pokrytím za relevantné, je potrebné mať veľký a populačne špecifický referenčný panel, na základe ktorého bude možné doplniť chýbajúce dieliky genómu jednotlivca s vysokou presnosťou. Avšak aj pri splnení týchto podmienok nie je tento prístup vhodný na analýzu veľmi vzácnych genetických variantov.

Sekvenovanie špecifických génov

V klinickej praxi sa častokrát nesekvenuje celý genóm, ani exóm, ale sekvenujú sa len konkrétne vybraté úseky – konkrétne gény. Toto diagnostické vyšetrenie je účinným nástrojom potvrdenia alebo vyvrátenia nejakej špecifickej patogénnej mutácie vedúcej k nejakému závažnému ochoreniu, ktoré sa vo väčšej miere vyskytuje v rodinnej histórii daného pacienta. 

Genotypizácia

Napriek tomu, že nám celogenómové sekvenovanie poskytuje najlepší obraz o našom genóme, stále patrí medzi relatívne drahé metódy. Práve preto sa v súčasnosti v komerčných DNA testoch využíva najmä prístup tzv. genotypizácie, a to z dôvodu jej efektivity v pomere cena/výkon. Ide o analýzu konkrétnych miest v DNA na čipe. Na rozdiel od celogenómového sekvenovania sa teda nečíta celá DNA, ale len konkrétne miesta, ktoré boli vybraté na základe toho, či o nich niečo poznáme a teda či ich vieme s niečím asociovať. Tieto miesta zahŕňajú napríklad mutácie spájané s rôznymi ochoreniami alebo s atletickým potenciálom. Viac o tom, ako prebieha genotypizácia, si môžete prečítať v tomto blogu.

Ktorý prístup je teda v súčasnosti vhodnejší pre komerčné genetické testovanie?

Ako bolo už spomenuté vyššie v texte, samotný sled nukleotidov v genóme nám nič nepovie, kľúčová je asociácia konkrétnych zmien s konkrétnymi znakmi.

Celogenómové sekvenovanie síce poskytuje najucelenejší pohľad na genóm jednotlivca, avšak musí byť urobené kvalitne, s dostatočne veľkým pokrytím. To je však stále pomerne nákladné, a preto v kombinácii s tým, že v súčasnosti nepoznáme funkciu väčšiny miest v genóme, nemôžeme dnes považovať tento prístup za efektívny pre komerčné genetické testovanie.

Pri genotypizácii sa neanalyzuje celý genóm, sledujú sa len vybraté miesta so známou funkciou. Tento efektívny prístup umožnil znížiť cenu za genetické testovanie natoľko, že sa stal vhodným nástrojom pre komerčné využitie. Práve preto využívame tento prístup v našich DNA testoch aj my v DNA ERA.

Zdroje

  1. Li, Y., Willer, C., Sanna, S., & Abecasis, G. (2009). Genotype imputation. Annual review of genomics and human genetics, 10, 387-406.
  2. Shendure, J., Balasubramanian, S., Church, G. M., Gilbert, W., Rogers, J., Schloss, J. A., & Waterston, R. H. (2017). DNA sequencing at 40: past, present and future. Nature, 550(7676), 345-353.
  3. https://www.illumina.com/science/technology/next-generation-sequencing/plan-experiments/coverage.html

Zdroje fotografií

  1. https://www.freepik.com/photos/technology‘>Technology photo created by freepik – www.freepik.com
  2. https://en.wikipedia.org/wiki/$1,000_genome#/media/File:Cost_per_Genome.png
Genetik DNA ERA

Mgr. Filip Uhrin

Genetik

Filip je absolventom odboru genetika na Prírodovedeckej fakulte Univerzity Komenského v Bratislave. V spoločnosti DNA ERA pôsobí na pozícii genetika takmer od úplného vzniku. Na základe rôznych vedeckých štúdií pripravuje podklady pre prípravu DNA analýz, ale zabezpečuje aj odborné konzultácie so zákazníkmi.  

Podobné články