ENCODE – en gång till

av Lars Johan Erkell

För två år sedan gick diskussionens vågor höga kring ENCODE-projektet, ett jätteprojekt som syftar till att ta vid där HUGO-projektet slutat. När man nu kartlagt människans genom ville man undersöka hur genomet verkligen användes i olika celltyper. Projektet publicerade en flod av data, men allt detta hamnade helt i skuggan av projektledarnas påstående att man hade visat att 80 % av människans genom var funktionellt, och att det kunde vara dags att skrota begreppet ”skräp-DNA”. Detta utlöste en kritikstorm av tidigare sällan skådat format. Projektledarna anklagades för att grovt övertolka data, och för att ignorera mycket av den kunskap som redan finns på området.

En av kritikernas invändningar var att man kunde vänta sig att en del av de metoder som använts borde visa aktivitet även med DNA med slumpartade sekvenser (som finns i ”skräp-DNA”) och därför knappast kunde tyda på biologiska funktioner. Så var fanns kontrollförsöken som visade att aktiviteten verkligen var biologiskt relevant och inte slumpartad? Ingen hade brytt sig om att göra dem, visade det sig.

En av de metoder ENCODE-projektet använder för att kartlägga funktioner är att undersöka var i genomet transkriptionsfaktorer binder till DNA. En transkriptionsfaktor är ett proteinkomplex som binder till DNA och initierar kopiering av DNA-sekvenser till RNA. Detta RNA kan sedan starta proteinsyntes, eller det kan reglera geners aktivitet på olika sätt. Transkriptionsfaktorer spelar alltså en nyckelroll för genomets funktion.

Inom ENCODE-projektet har man utgått ifrån att om en transkriptionsfaktor binder till DNA, så är detta ett tecken på en specifik biologisk funktion. Men, påpekade kritikerna, transkriptionsfaktorer binder till mycket korta DNA-sekvenser, på ungefär tio baspar, och sekvenserna kan också variera en del. Det betyder att om den största delen av genomet inte är kodande utan har mer eller mindre slumpartade sekvenser, så skulle det ändå finnas miljontals korta sekvenser som kunde binda transkriptionsfaktorer. Och den bindningen skulle inte ha någon biologisk funktion.

En av dem som efterlyste kontrollförsök med slumpartat DNA var molekylärbiologen Michael White. Och han inte bara efterlyste försöken – han gjorde dem. I arbetet med en annan problemställning behövde han göra just det kontrollexperiment som man borde gjort inom ENCODE-projektet, nämligen att kontrollera om transkriptionsfaktorer binder till DNA med helt slumpartade sekvenser. I ett arbete som publicerades förra sommaren visade White och hans kollegor att av 1 300 slumpvis genererade DNA-strängar kunde de flesta binda transkriptionsfaktorn Crx, och dessutom starta transkription av en gen. Alltså just det som man i ENCODE-projektet menat vara evidens för en specifik biologisk funktion. Michael White har skrivit en sammanfattning av experimenten på sin blogg: Finding functions in the genome with a null hypothesis och All function is local (almost).

Här föll alltså ett viktigt argument för påståendet att vårt genom skulle vara nästan helt funktionellt. Om nu DNA med slumpartade sekvenser kan binda transkriptionsfaktorer i stor omfattning, kan man då hävda att sådan bindning måste vara ett tecken på funktion i DNA? Knappast. Det här borde man ha tänkt på.

Hur har då de forskare som drev linjen om det (nästan) helt funktionella genomet reagerat på Michael Whites resultat och på all annan kritik man utsatts för? Givetvis har man fått retirera. I en artikel i Science citeras nu projektets ledare, John Stamatoyannopoulos, sålunda:

”Given the current state of knowledge, Stamatoyannopoulos says, scientists need to remain ’fairly agnostic’ about the potential function of various genomic elements [1].”

Det här är något helt annat än vad han sade i samma tidskrift 2012, när resultaten presenterades:

”These results are going ’to change the way a lot of [genomics] concepts are written about and presented in textbooks’, Stamatoyannopoulos predicts [2].”

Det är inte tal om att skriva om läroböckerna längre. Och det är inte bara Stamatoyannopoulos som backar. I en artikel som publicerades häromveckan diskuterar han och 29 kollegor ifrån ENCODE-konsortiet frågan om hur man egentligen ska definiera ”funktion” hos DNA [3]. Detta är precis den diskussion som saknades när man gick ut med sina resultat 2007 och 2012 [4,5]. Om resultaten med biokemiska markörer, som bindning av transkriptionsfaktorer, skriver man nu:

”In short, although biochemical signatures are valuable for identifying candidate regulatory elements in the biological context of the cell type examined, they cannot be interpreted as definitive proof of function on their own [3].”

Man ger alltså kritikerna rätt. De kontroversiella påståendena att 80 % av genomet skulle vara funktionellt nämns inte. Nu skriver man:

”The major contribution of ENCODE to date has been high-resolution, highly-reproducible maps of DNA segments with biochemical signatures associated with diverse molecular functions. We believe that this public resource is far more important than any interim estimate of the fraction of the human genome that is functional [3].”

Man backar alltså ifrån sina tidigare påståenden om att den största delen av genomet skulle vara funktionellt, utan att direkt medge att man gick för långt. Det hade nog varit för plågsamt.

Om man fördjupar sig i den data som redovisas i artikeln finner man inget stöd för att 80 % av genomet skulle vara funktionellt – snarare får man intrycket att 80 % saknar funktion, även om det är omöjligt att fastslå en siffra. Den flod av data ENCODE-projektet genererat visar alltså på att den största delen av vårt DNA saknar kodande funktion. Men även om DNA inte är kodande skulle det kunna ha strukturella funktioner, exempelvis genom att låta DNA-molekylen vecka sig på lämpligt sätt, eller genom att hålla gener på ett lämpligt avstånd ifrån varandra.

Vi har aldrig vetat så mycket om genomet som i dag, och den kunskap vi har visar att det inte alls är dags att skrota begreppet ”skräp-DNA”, tvärtom. Men jag vågar mig ändå på förutsägelsen att många skapelsetroende och intelligent design-anhängare aldrig kommer att acceptera detta; de kommer envist att hävda att den allra största delen av människans genom är funktionellt, och att detta skulle vara vetenskapligt bevisat. Helt oberoende av vad forskningen kommer fram till.

***

Men hur kunde man inom ENCODE-projektet gå ut med påståenden som man nu måste ta tillbaka? Det är faktiskt svårt att förklara. För, som kritikerna påpekade, att så många forskare anser att största delen av genomet inte har någon kodande funktion beror inte på att man saknar kunskap om genomet, utan tvärtom på att man har kunskap som visar att en stor del av genomet sannolikt inte har kodande funktioner.

En anledning till att man så gärna vill se genomet som fullt av funktioner bottnar nog i att ENCODE-projektet, liksom tidigare HUGO-projektet, är ett jätteprojekt som slukar massor av pengar. Det kan vara svårt att motivera kostnaderna om det visar sig att man i stor utsträckning kartlägger funktioner som inte är biologiskt relevanta.

En annan tänkbar orsak till uppståndelsen kring projektet är att dagens villkor för forskningsfinansiering allt mer bygger på att forskare kan skapa uppmärksamhet kring sina projekt. Forskningsansökningar utvärderas i dag med bibliometriska metoder, vilket bland annat medför att forskare som väcker debatt, och därför ofta blir citerade, kommer att rankas högt [6]. Universiteten håller sig dessutom numera med pressavdelningar som gör vad de kan för att skriva pressreleaser som skildrar det arbete som görs vid universitet som så nyskapande och banbrytande det bara är möjligt. Tidskrifterna som publicerar resultaten vill också göra mesta möjliga av dem för att stärka sitt eget varumärke. I dagens forskningsklimat är uppmärksamhet hårdvaluta.

Det här gör att den bild av nya forskningsresultat som allmänheten får sig till livs kan vara ganska friserad; i det här fallet så friserad att den är rent vilseledande. Men även om ENCODE-projektets ledare har fått (och enligt min mening också förtjänat) skarp kritik för sitt sätt att tolka och gå ut med resultaten, har man visat stor skicklighet; trots – eller kanske tack vare – kritiken har man fått fortsatt finansiering av sitt jätteprojekt.

Noter

[1] Bhattacharjee, Y. (2014): The Vigilante. Science 343:1306–1309.

[2] Pennisi, E. (2012): ENCODE Project Writes Eulogy for Junk DNA. Science 337:1159–1161.

[3] Kellis, M., Wold, B., Snyder, M.P., Bernstein, B.E., Kundaje, A., Marinov, G.K., Ward, L.D., Birney, E., Crawford, G.E., Dekker, J., Dunham, I., Elnitski, L.L., Farnham, P.J., Feingold, E.A., Gerstein, M., Giddings, M.C., Gilbert, D.M., Gingeras, T.R., Green. E.D., Guigo, R., Hubbard, T., Kent, J., Lieb, J.D., Myers, R.M., Pazin, M.J., Ren, B., Stamatoyannopoulos, J.A., Weng, Z., White, K.P., Hardison, R.C. (2013): Defining Functional DNA Elements in the Human Genome. PNAS 111:6131–6138.

[4] The ENCODE Project Consortium (2007): Identification and Analysis of Functional Elements in 1 % of the Human Genome by the ENCODE Pilot Project. Nature 447:799–816.

[5] The ENCODE Project Consortium (2012): An Integrated Encyclopedia of DNA Elements in the Human Genome. Nature 489:57–74.

[6] Lundgren, E. (2014): Bibliometri íngen neutral metod. GU-Journalen 2:36.

[Ursprungligen publicerad på http://biologg.wordpress.com.]