Department of Toxicogenomics

Maastricht UMC in Nature Genetics Effectiever gebruik van biologische data

Maastricht vertegenwoordigt Nederland in publicatie in Nature Genetics over Effectiever gebruik van biologische data

MAASTRICHT, 1 februari 2012 – Een data-explosie. Daarvan is deze eeuw sprake binnen de bio-wetenschappen. Om al deze data toegankelijk te maken voor wetenschappers zullen ze moeten voldoen aan standaarden qua structuur, format en annotatie. Onderzoekers pleiten in het gezaghebbende tijdschrift Nature Genetics hier de ISA standaard voor te gebruiken (ISA staat voor Investigation / Study / Assay). In totaal onderschrijven 50 vertegenwoordigers van 37 onderzoeksgroepen uit de hele wereld het artikel Towards interoperable bioscience data dat zojuist is gepubliceerd. Nederland is in die groep vertegenwoordigd met twee wetenschappers uit Maastricht: prof.dr. Jos Kleinjans, voorzitter van de vakgroep Toxicogenomics en zijn collega dr. Chris Evelo voorzitter van de vakgroep Bioinformatica, beiden van het Maastricht Universitair Medisch Centrum+ / Universiteit Maastricht.

Het (sneller, beter en gecombineerd kunnen analyseren van omvangrijke sets data zal in toenemende mate een belangrijke succes factor zijn voor baanbrekend biologisch onderzoek. Daarnaast zal het ten grondslag liggen aan nieuwe innovatie en groei van productiviteit, blijkt uit onderzoek Big data: The next frontier for innovation, competition, and productivity van MGI-en McKinsey's Business Technology Office**. Probleem is a) dat deze gigantische hoeveelheid data toegankelijk moeten worden gemaakt en b) dat data decentraal over de hele wereld zijn en worden opgeslagen.

Data-sharing

De visie waarover de biowetenschappers van 37 onderzoeksgroepen het eens zijn geworden, is dat deze ‘Big Data’ zo snel mogelijk moeten worden gestandaardiseerd, geïntegreerd en toegankelijk gemaakt. Die standaardisatie – waarvoor men de ISA-tab standaard wil gebruiken – moet niet alleen bestaan uit bijvoorbeeld de dna-informatie die benodigd is voor een specifiek onderzoek, maar ook uit metadata die beschrijft hoe en waarom die data verkregen is en wat er verder bekend over de onderzoeksobjecten. Die metadata geven bovendien aan waar de ruwe data zijn opgeslagen en hoe die toegankelijk zijn.

Kleinjans: “Wij zijn hierbij betrokken geraakt door het EU project ‘CarcinoGENOMICS’ waarin we een alternatief proberen te vinden voor proefdieren voor het testen van kankerverwekkende stoffen. Hierbij is genomics de kerntechnologie, waarmee zeer veel data zijn geproduceerd omtrent de reactie van cellen op kankerverwekkende stoffen. Voorwaarde voor succes van dit soort initiatieven is echter data-sharing. Daarvoor moeten wetenschappers vertrouwen hebben in de kwaliteit van de data-beschrijvingen en zijn er voorbeelden nodig van zogeheten open source tools die met die data om kunnen gaan; zonder tools heeft het nog geen zin. Samen met het European Bioinformatics Institute hebben we een eerste toolset ontwikkeld, en mede hieruit is de ISA-infrastructuur ontstaan.”

Evelo: “Wat ISA vooral mogelijk maakt is het opnieuw gebruiken van data en het vinden van elkaar aanvullende studies. Je zou bijvoorbeeld alle studies waarin het effect van vet voedsel op de ontwikkeling van diabetes wordt bekeken kunnen vinden en meteen de bijbehorende resultaten kunnen downloaden. Dat maakt data waardevoller, en maakt het mogelijk verbanden te vinden die in een enkele data set niet boven water komen”

Omdat het beschikbaar maken van data alleen werkt als zoveel mogelijk instituten mee doen is het belangrijk dat dit artikel en het voorstel daarin wordt gedragen door een zo breed mogelijke groep.”

Techniek van de toekomst

Dat ‘Big Data’ geen hobby is van een paar wetenschappers blijkt uit de 'Digital Agenda for Europe' http://ec.europa.eu/information_society/digital-agenda/index_en.htm waar eurocommissaris Kroes veel geld voor uittrekt. “Daardoor is de hardware voor informatica inmiddels gerealiseerd, nu nog de applicaties die nodig zijn om deze warehouses te vullen”, aldus Kleinjans, waarbij hij hamert op kwaliteit, want “Rubbish in rubbish out”.

Hij voorziet een belangrijke rol voor de integratie van Big Data met name in verband met de opkomende sequencing technologie in de voorspellende geneeskunde. “Sequencing is de techniek van de toekomst, ook omdat het veel goedkoper wordt: kostte tien jaar geleden het sequencen van het DNA van een mens 7 miljard dollar, binnenkort kan dat al voor 1000 dollar.” “Juist die grote hoeveelheden, vaak erg kostbare data maakt dat het belangrijk is de beschrijving van die data centraal beschikbaar te hebben”, aldus Evelo. ”Als je bijvoorbeeld ook weet of sequentie data afkomstig is van een diabetes patiënt is kun je die informatie en daarmee ook de sequentie voor meer zaken gebruiken.”

Article

Lees het volledige interview met Susanna-Assunta Sansone hier.

Posted on Feb 03, 2012