ENCODE projekts: cilvēka genoma enciklopēdija un regulējošie DNS elementi
ENCODE projekts: detalizēta cilvēka genoma enciklopēdija par regulējošajiem DNS elementiem—promotoriem, pastiprinātājiem un to lomu gēnu ekspresijā un evolūcijā.
ENCODE (Encyclopedia of DNA Elements) ir starptautisks pētniecības projekts, kura mērķis bija izveidot visaptverošu cilvēka genoma funkcionālo elementu karti. Projekts tika sāktos 2003. gadā, un tā mērķis bija identificēt un katalogizēt visus genomā esošos funkcionālos elementus — gan olbaltumvielas kodējošās sekvences, gan regulējošos DNS elementus, kas kontrolē gēnu ekspresiju. ENCODE konsorcijā piedalījās vairāk nekā 400 zinātnieku no aptuveni 32 laboratorijām ASV, Apvienotajā Karalistē, Spānijā, Singapūrā un Japānā. Galvenie rezultāti tika publicēti vairākos brīvi pieejamos rakstos, tostarp žurnālos Nature, Genome Biology un Genome Research, un šī joprojām ir viena no detalizētākajām cilvēka genoma funkcionālo elementu analīzēm.
Galvenie secinājumi
Vienkāršots svarīgāko atziņu izklāsts:
- Aptuveni 1 % cilvēka genoma tieši kodē olbaltumvielas — tas atbilst aptuveni 21 000 gēnu.
- Aptuveni 70 000 sekvenču tika atzītas par promotoriem — reģioniem, kas parasti atrodas pirms gēna un kuros olbaltumvielas saistās, lai kontrolētu gēnu ekspresiju.
- Aptuveni 400 000 reģionu identificēja kā pastiprinātājus (enhancers), kas var ietekmēt attālinātus gēnus un būt atbildīgi par šūnu tipam specifisku ekspresijas regulāciju.
- Vēl aptuveni 4 miljoni nelielu DNS segmentu tika identificēti kā iespējami gēnu "slēdži" — regulējoši elementi, kas nosaka, kad un kur konkrēti gēni tiek ieslēgti vai izslēgti.
- ENCODE eksperimenti parādīja, ka aptuveni 80 % genoma posmu parāda kādu bioķīmisku aktivitāti (piemēram, transkripciju, transkripcijas faktoru saistīšanos vai histonu modificēšanas zīmes). Tas liek apšaubīt vienkāršu uzskatu par lielu daļu DNS kā “nelietderīgu”. Tomēr jārēķinās, ka ENCODE definēja "funkciju" plašāk — kā jebkādu reproducējamu bioķīmisku signālu — un diskusijas par šīs definīcijas interpretāciju turpinās.
- Evolūcijas izmaiņas fenotipā var rasties ne tikai no mutācijām olbaltumvielas kodējošās sekvencēs, bet arī no izmaiņām DNS elementu secībā, kas maina gēnu regulāciju, tādējādi ietekmējot gēnu darbību un laika/šūnu tipa specifisku ekspresiju.
Metodes un datu iegūšana
ENCODE konsorcijs izmantoja plašu eksperimentālo un bioinformātikas metožu klāstu, lai identificētu un raksturotu funkcionālos elementus genomā. Galvenās pieejas bija:
- Transkriptoma analīze — izolēja un sekvencēja genoma transkribēto RNS, izmantojot modernās sekvenēšanas metodes (RNA‑seq), lai noteiktu, kur un kādas RNS molekulas tiek ražotas.
- Transkripcijas faktoru un citu proteīnu saistīšanās kartēšana — ChIP‑seq eksperimenti ļāva atrast aptuveni 120 dažādu transkripcijas produktu saistīšanās vietas un citus DNS‑saistošos elementus.
- Atvērtās hromatīna zonas — DNāzes hipersensitivitātes (DNase‑seq) un ATAC‑seq testi, kas identificē DNS reģionus, kuros hromatīns ir atvērts un pieejams regulējošām molekulām.
- Histonu modifikāciju analīze — pētīja histonu ķīmiskās modifikācijas (piem., metilēšana, acetilēšana), kuru raksti saistīti ar aktivētu vai nomāktu gēnu ekspresiju, lai atlasītu potenciālos promotora vai pastiprinātāja reģionus.
- Massīvs eksperimentu apjoms — kopumā tika veikti vairāk nekā 1648 eksperimentu dažādos nosacījumos un ar 147 šūnu tipiem, nodrošinot plašu datu bāzi dažādu šūnu stāvokļu un audu kontekstos.
Ietekme, pielietojums un datu pieejamība
ENCODE rezultāti ir būtiski gan fundamentālajai bioloģijai, gan klīniskajai pētniecībai:
- Tie palīdz interpretēt slimību asociētās ģenētiskās variācijas: daudzi GWAS (genome‑wide association studies) atklāj srenscific variants ārpus kodējošajām sekvencēm; ENCODE dati norāda, ka daļa šo variantu atrodas regulējošos elementos un var mainīt gēnu regulāciju.
- Veicina jaunus modeļus par attālinātu regulāciju (enhancer–promoter looping) un šūnu tipa specifisku gēnu vadību, kas svarīgi attīstot mērķterapijas un izpratnei par audu attīstību.
- Visi ENCODE dati ir publiski pieejami — tas ļauj pētniekiem visā pasaulē atkārtot analīzes, izstrādāt jaunus bioinformātikas rīkus un integrēt datus klīniskajos pētījumos.
Strīdi un ierobežojumi
ENCODE sniedza revolucionārus datus, bet radīja arī diskusijas:
- Definīcija "funkcionalitātei": ENCODE pētījumi izmantoja plašu bioķīmisko aktivitāšu kopumu, lai noteiktu elementus ar iespējamu funkciju. Tomēr evolucionāri konservācijas kritēriji — kas novērtē, cik lielā mērā DNS posmi tiek saglabāti sugām — bieži norāda uz mazāku "funkcionālu" genoma daļu. Kritiķi uzsvēra, ka bioķīmiska aktivitāte nenozīmē obligātu bioloģisku nozīmi organismam, un ka daļa aktivitāšu var būt šūnai nejaušas vai kontekstuālas.
- Interpretācijas sarežģītība: daudzu regulējošo elementu funkcijas ir kontekstuālas (atšķiras atkarībā no šūnas tipa, attīstības stadijas vai vides), tāpēc šo elementu precīza bioloģiskā nozīme prasa papildu funkcionālas validācijas.
Evolūcija un bioloģiskā nozīme
Kā norāda projekts, evolūcija ne vienmēr darbojas tikai caur mutācijām olbaltumvielu kodējošajās sekvencēs — būtiskas izmaiņas var rasties arī izmaiņu dēļ DNS reģionos, kas regulē gēnu darbību. Kā teikts, "Viens no lielākajiem izaicinājumiem evolūcijas bioloģijā ir saprast, kā atšķirības DNS secībā starp sugām nosaka to fenotipu atšķirības. Evolūcijas pārmaiņas var notikt gan ar izmaiņām olbaltumvielas kodējošās sekvencēs, gan ar sekvenču izmaiņām, kas maina gēnu regulāciju." Šī perspektīva paplašina izpratni par to, kā ģenētiskās izmaiņas var radīt morfoloģiskas un funkcionālas atšķirības.
Secinājums
ENCODE ir nodrošinājis plašu datu resursu cilvēka genoma funkcionālo elementu kartēšanai un mainījis izpratni par to, cik daudz genoma var būt aktīvs vai regulējošs. Projektam ir milzīga ietekme uz molekulāro bioloģiju, evolucionāro izpēti un medicīnas pētījumiem, taču tā rezultāti jāvērtē kopā ar citiem pieejamiem pierādījumiem un rūpīgi jāinterpretē, īpaši attiecībā uz to, ko nozīmē "funkcionāls" genoma posms. ENCODE datu analīze un interpretācija turpinās, un sekojošie pētījumi koncentrējas uz funkciju validēšanu un uz to, kā genomiskie regulējošie tīkli ietekmē veselību un slimības.
Ar šo darbu saistītās ziņas:
Jautājumi un atbildes
J: Kas ir ENCODE?
A: ENCODE ir DNS elementu enciklopēdija. To sāka veidot 2003. gadā, lai noteiktu visus funkcionālos elementus (darba bitus) cilvēka genomā.
J: Kas veica ENCODE darbu?
A: Darbu veica vairāk nekā 400 zinātnieku 32 laboratorijās ASV, Apvienotajā Karalistē, Spānijā, Singapūrā un Japānā.
J: Ko viņi noskaidroja par cilvēka genomu?
A: Viņi atklāja, ka tikai 1 % genoma kodē olbaltumvielas, kas ir aptuveni 21 000 gēnu. Turklāt viņi atklāja, ka 70 000 sekvenču kodē "promotoru" reģionus pirms gēniem, kur proteīni saistās, lai kontrolētu gēnu ekspresiju; 400 000 "pastiprinātāju" reģionus, kas regulē attālākus gēnus; un četrus miljonus gēnu "slēdžu", kas ir DNS sekvences, kuras kontrolē, kad gēni tiek ieslēgti vai izslēgti. Turklāt tika konstatēts, ka 80 % genoma ir noteikta bioķīmiska funkcija.
J: Kā viņi veica savu pētījumu?
A: Izmantotās metodes ietvēra no genoma pārrakstītās RNS izolēšanu un sekvencēšanu; transkripcijas produktu saistīšanās vietu identificēšanu; histonu ķīmisko modifikāciju modeļu izpēti, lai atrastu reģionus, kuros gēnu ekspresija tiek pastiprināta vai nomākta; un 1648 eksperimentu veikšanu ar 147 šūnu tipiem.
J: Ko šis pētījums liecina par evolūciju?
A: Šis pētījums liecina, ka evolūciju izraisa gan izmaiņas gēnos, kas kodē olbaltumvielas, gan izmaiņas DNS, kas kodē regulatīvo kontroli. Tas arī norāda, ka evolūcijas pārmaiņas var notikt, mainot secības, kas maina gēnu regulāciju, kā arī mainot olbaltumvielas kodējošās secības.
J: Kur tika publicēti viņu atklājumi?
A.: Pētnieku atklājumi publicēti 30 brīvi pieejamos rakstos trīs žurnālos - Nature, Genome Biology un Genome Research.
Meklēt