Databáze

Databáze je dostupná na adrese https://database.acgt.cz pro odbornou veřejnost skrze přihlášení přes e-INFRA CZ AAI. Jste-li odborná veřejnost a nedaří se vám do databáze přihlásit, napište vědeckému týmu na e-mail info@acgt.cz s prosbou o zpřístupnění. 

V současné době je zveřejněna první verze v pilotním režimu, která bude dále aktualizována a vylepšována.
​V nových verzích vás čeká více dat i vylepšená funkcionalita.

Informace o databázi

Tato databáze je výsledkem spolupráce tří univerzit a dvou firem v rámci projektu Analýza Českého Genomu pro Teranostiku (A-C-G-T):

  • Středoevropský technologický institut, Masarykova univerzita Brno (koordinátor)
  • 1. a 2. lékařská fakulta, Univerzita Karlova v Praze
  • Ústav molekulární a translační medicíny, Univerzita Palackého v Olomouci
  • Genomac výzkumný ústav, s. r. o
  • EUC Laboratoře CGB (od 11/2019)
  • Institute of Applied Biotechnologies (pouze do 10/2019)

Cílem projektu bylo sekvenování celých genomů 1 000-1 500 zdravých Čechů a vytvoření referenční databáze genomových variant v obecné populaci.

Kritéria, na základě kterých se účastníci mohli zúčastnit studie:

  • Věk od 30 do 55 let.
  • Bez vážné genetické nemoci.
  • Rodiče účastníka pocházejí ze stejného regionu České republiky (otec se narodil ve stejném kraji jako matka). Matka a otec mohou pocházet z dvou různých krajů, pokud jsou jejich místa narození vzdálena méně než 50 km vzdušnou čarou.

Vylučující kritéria, aby se zabránilo chimerismu (přítomnosti cizí DNA):

  • Podstoupení transplantace orgánu, tkáně nebo kostní dřeně kdykoli během života účastníka.
  • Obdržení krevní transfuzi během posledního měsíce.
  • Právě probíhající těhotenství.

Údaje o účastnících (včetně zdravotního stavu a lékařské historie) byly dobrovolně hlášeny účastníky, žádný odkaz na zdravotní registry nebyl vytvořen.

Etika:

  • Projekt byl schválen etickou komisí každé univerzity a/nebo místa sběru vzorků. Všichni účastníci souhlasili se zpracováním svých údajů a vzorků, což bylo zdokumentováno podpisem informovaného souhlasu.

Metodika (příprava knihoven, sekvenování):

  • Fragmentace DNA: pomocí zařízení Covaris, velikost 350 bp
  • Kity pro přípravu knihovny: KAPA HyperPrep Kit PCR-free nebo Illumina TruSeq DNA PCR-free
  • Platforma pro sekvenování: Illumina Novaseq
  • Parametry sekvenování: Párové sekvenování, 2×150 bp
  • Průměrné pokrytí: 30x

Analýza dat:

  • Nextflow workflow - nf-core/sarek (v2.7.1): Více na https://nf-co.re/sarek/2.7.1.
  • Sarek byl vyvinut s ohledem na analýzu germinálních variant podle osvědčených postupů GATK.

Datový soubor ve verzi 1.0:
Databáze bude aktualizována a v blízké budoucnosti obsahuje více dat. V současné době dataset zahrnuje tyto vzorky:

  • Počet vzorků v databázi: 1016
  • Počet ženských vzorků: 493
  • Počet mužských vzorků: 523
  • Počet vzorků z následujících krajů:
  • PHA - Praha: 108
  • JHC - Jihočeský kraj: 24
  • JHM - Jihomoravský kraj: 167
  • KVK - Karlovarský kraj: 15
  • VYS - Vysočina: 55
  • HKK - Královéhradecký kraj: 67
  • LBK - Liberecký kraj: 26
  • MSK - Moravskoslezský kraj: 109
  • OLK - Olomoucký kraj: 87
  • PAK - Pardubický kraj: 38
  • PLK - Plzeňský kraj: 53
  • STC - Středočeský kraj: 117
  • ULK - Ústecký kraj: 72
  • ZLK - Zlínský kraj: 76
  • RUZ - Různé regiony rodičů: 1
  • NA - Není k dispozici (nebylo vyplněno účastníkem): 1

Kontakt:

  • info@acgt.cz

 Tato práce vznikla za podpory projektu A-C-G-T, reg. č. CZ.02.1.01/0.0/0.0/16_026/0008448 financovaného z EFRR, který probíhal od ledna 2019 do června 2023.