Wetenschap kent een data probleem. Dankzij innovatieve methoden is de hoeveelheid onderzoek explosief toegenomen.
Het is eenvoudiger dan ooit om belangrijke data over menselijk gezondheid en ziekten te verzamelen. Maar ondanks deze overvloed aan kennis zijn er nog veel ziekten die we niet genoeg in detail begrijpen om daar effectieve behandelingen voor te ontwikkelen.
Dit probleem komt mede voort uit de complexiteit van het samenvoegen van verschillende vormen van experimentele metingen. De hoeveelheid data die samengevoegd moet worden is extreem groot. Bestaande databases richten zich vaak op een specifiek doel en bewaren data in aparte formaten die dat doel ondersteunen, maar moeilijk bruikbaar maken voor nieuwe data. Een nieuwe studie, gepubliceerd in PLoS Computational Biology, van wetenschappers van de Universiteit van Maastricht en de Gladstone Institutes in San Francisco, heeft die uitdaging opgepakt en gezocht naar nieuwe methoden voor het integreren van verschillende data bronnen om zo de data en daarmee ons begrip van een ziekte te verbeteren.
“Er is veel informatie beschikbaar, maar we hebben betere methoden nodig om die bij elkaar te brengen”, zegt mede-auteur Alex Pico, PhD, interimdirecteur van de Gladstone Bioinformatics Core, in San Francisco. Om dit probleem op te lossen hebben wetenschappers kennis uit WikiPathways – een open source database van biologische processen – in een modern linkbaar formaat omgezet. Ze gebruikten hiervoor semantische web- en ontologie technologieën om het integreren van data bronnen te vereenvoudigen. Hiermee waren ze in staat om kennis uit WikiPathways te combineren met andere databases. Zoals DisGeNET, waarin kennis is verzameld over de relatie tussen genen en ziekten, en de EBI Expression Atlas, waarin de expressie van genen onder verschillende condities gedocumenteerd is. De integratie van deze informatiebronnen geven wetenschappers een dieper inzicht in de biologische processen achter ziektes zoals diabetes mellitus en astma.
“We denken dat onze uitkomsten andere wetenschappers helpen gebruik te maken van beschikbare data, waardoor eenvoudiger nieuwe eiwitten gevonden kunnen worden voor de ontwikkeling van medicijnen tegen een bepaalde ziekte, “ zegt de eerste auteur Andra Waagmeester, voormalig onderzoeker aan de Universiteit van Maastricht, CEO van zijn start-up Micelio. De onderzoekers hebben samengewerkt met de Open PHACTS Foundation, volgend uit een onderzoeksproject dat bekostigd is door de Europese Innovative Medicines Initiative. Nick Lynch, PhD, CTO van Open PHACTS, zegt: “Vijfentwintig procent van het huidige gebruik van onze programmeerbare database gebruikt data uit WikiPathways. Daarom is het belangrijk dat we deze data eenvoudig kunnen combineren met onze andere bronnen, om zo medicijnonderzoek te ondersteunen.”
“Deze nieuwe technologie biedt een enorme kans om nieuwe databronnen te verbinden en nieuwe samenwerkingen mogelijk te maken,” voegt co-auteur Prof. Chris Evelo toe, hoofd van de afdeling Bioinformatica (BiGCaT) aan de Universiteit van Maastricht.
WikiPathways is een open, wiki-gebaseerde, internationale samenwerking die is gestard in 2008, op initiatief van de Universiteit van Maastricht en de Gladstone Institutes. Het wordt vaak gebruikt bij de analyse van experimentele data van grote genexpressie en metabolomics studies. Alle verzamelde kennis is nu beschikbaar in een formaat geschikt voor de Europese Open Science Cloud. WikiPathways werkt met andere projecten, zoals WormBase, samen via onderzoekswebsites. Het project is meer dan 600 keer geciteerd.
Bron: Maastricht University