Beyond Project MinE NederlandProject MinE, het grootste genetische ALS onderzoek ooit

Om een behandeling voor ALS te vinden is kennis over de oorzaak nodig. Voor sporadische ALS (de niet-erfelijke variant) is het echter nog gissen naar de oorzaak. Het enige dat we vrijwel zeker weten is dat een belangrijk deel van de oorzaak in het erfelijk materiaal, ons DNA, ligt. Daarom hebben twee patiënten samen met ALS Centrum Nederland een ongekend groot internationaal genetisch onderzoeksproject opgezet: Project MinE. Voor dit project zullen enorme hoeveelheden data worden geanalyseerd. Daarom is een team aangesteld bij het ALS Centrum met onder andere een bioinformaticus. Dit is Kristel Kool-Van Eijk, zij heeft verstand van het opslaan en analyseren van grote hoeveelheden genetische data.

Kristel Kool-Van Eijk

Kristel Kool-Van Eijk

22.500 DNA-profielen

Kristel legt uit waarom een goede ICT infrastructuur cruciaal is bij Project MinE: “Het doel van Project MinE is om het volledige DNA-profiel, oftewel al het erfelijke materiaal, van 15.000 ALS-patiënten en 7.500 gezonde controlepersonen wereldwijd te verkrijgen en vervolgens te analyseren. Project MinE is dus een ongekende uitdaging in hoeveelheid data en benodigde rekencapaciteit. Voor het werken met ‘big data’, de gegevens van zoveel patiënten en controlepersonen bij elkaar, moeten de beste opslag- en rekenfaciliteiten worden geregeld.”

Petabytes

Voor Project MinE worden de DNA-profielen volledig afgelezen met whole genome sequencing. Een DNA-profiel dat volledig is afgelezen heeft een ruwe data van 80 gigabyte (GB). Uiteindelijk zal het onderzoeksteam de data van wel 22.500 DNA-profielen van patiënten en controlepersonen wereldwijd verkrijgen. Als deze DNA-profielen volledig zijn afgelezen met whole genome sequencing, dan spreken we hier over bijna zeven petabytes aan data. Deze data moet dan nog worden geanalyseerd door onderzoekers van ALS Centrum Nederland. Hiervoor is veel rekencapaciteit door computers nodig. Het is een hoeveelheid data waarmee binnen gezondheidsonderzoek bijna nooit wordt gerekend, een enorme uitdaging dus. Er wordt daarom onder andere gekeken naar ervaringen binnen ruimtevaartonderzoek. Om de analyses mogelijk te maken wordt nu geïnvesteerd in opslag- en analysecapaciteit bij het ALS Centrum.

Supercomputer

Op een gewone pc zou het bijna 1.600 jaar kosten om de analyses uit te voeren met alle 22.500 DNA-profielen. Daarom is een supercomputer nodig met heel veel rekencapaciteit. En zelfs hiermee duurt het analyseren nog enkele maanden. Voor de opslag- en rekencapaciteit voor Project MinE data werkt het ALS Centrum samen met SURFsara. SURFsara heeft een supercomputer genaamd Cartesius die nummer 45 is van de top 500 supercomputers op de wereld. Voor Project MinE wordt gebruik gemaakt van grid computing, waarbij een netwerk (grid) van krachtige computers over heel Nederland wordt ingezet. Grid computing is beschikbaar voor onderzoek in Nederland, met support van de SURF coöperatie. Met grid computing kunnen enorme hoeveelheden data worden geanalyseerd specifiek door rekenopdrachten parallel uit te voeren over de computers in het grid. In samenwerking met SURFsara experts testen de onderzoekers van het ALS Centrum op dit moment het opslaan en analyseren van data op de nationale rekenfaciliteiten en archivering.

Data analyse

De bioinformaticus en de onderzoekers van het ALS Centrum zijn ook de manier van data-analyse aan het voorbereiden. Ze rekenen precies uit hoeveel tijd er voor de analyses nodig is met de nationale rekenfaciliteiten. Ook moeten de ALS centra van de verschillende landen die deelnemen aan Project MinE bij de genetische data van hun eigen patiënten kunnen. En de data opslag moet absoluut veilig zijn. De inrichting van de opslag- en analysecapaciteit bij SURFsara wordt dus getest om de beste resultaten te garanderen. De opslag- en rekencapaciteit voor Project MinE is een uitdaging, waar hard aan gewerkt wordt!

Subsidie

In 2014 heeft ALS Centrum Nederland een subsidie aangevraagd bij Stichting ALS Nederland om de kosten van de opslag- en rekencapaciteit voor de data-analyse van Project MinE te dekken (onder de naam “Beyond Project MinE NL”). Stichting ALS heeft deze aanvraag eind 2014 goedgekeurd. Zij dekken deze kosten onder andere met de inkomsten van de Amsterdam City Swim van 2014, waarbij het bestuur van de City Swim 1 miljoen euro heeft toegekend aan Beyond Project MinE NL.

Infographic NL