De uitdaging
Vitens is het grootste waterbedrijf van Nederland en voorziet 5.7 miljoen klanten van water in de provincies Flevoland, Friesland, Gelderland, Overijssel en Utrecht. Met ongeveer 1400 werknemers, 49.000 kilometer leidingen en 96 productiebedrijven wordt het mogelijk gemaakt om water uit de grond om te zetten naar drinkwater en vervolgens te leveren aan onze klanten.
Water winnen, zuiveren en leveren aan 5,7 miljoen mensen gaat gepaard met complexe ICT-systemen en applicaties..
Onze totale ICT-afdeling telt dan ook zo’n 100 professionals.
De functie
Binnen Vitens wordt er steeds meer- en complexere software ontwikkeld. Om deze software te beheren, gebruiken wij GitLab. Hiermee is het mogelijk om via een Git-versiebeheersysteem onze code te onderhouden, samen te werken en veilig te stellen.
In ons team willen wij nauwer ontwikkelen op ons Hadoop-cluster. Dit is een systeem waar performance en data op één plek beschikbaar is, waardoor er complexe algoritmes op ons enorme aanbod aan data mogelijk kan worden gemaakt. Deze algoritmen of benodigde ETL-processen worden binnen allerlei programmeertalen uitgevoerd, namelijk: R, Python, Scala, Java, maar ook Angular voor front-end applicaties.
Binnen verschillende tools wordt er vervolgens door Data Scientists (soms ook Data Engineers) ontwikkeld, bijvoorbeeld in: Apache Zeppelin, RStudio en Jupyter. Binnen deze tools is een Git-integratie mogelijk en wij zouden graag inzichtelijk willen hebben hoe dit in de praktijk het beste geïntegreerd kan worden.
Aan jou dus de taak om te onderzoeken hoe deze integratie met ons Hadoop-cluster het beste tot stand kan worden gebracht met ons versiebeheersysteem. Vind jij het interessant om te leren hoe er met big data wordt gewerkt en ons ontwikkelproces op een krachtig cluster te verbeteren, lees dan verder.
Binnen Vitens wordt er steeds meer- en complexere software ontwikkeld. Om deze software te beheren, gebruiken wij GitLab. Hiermee is het mogelijk om via een Git-versiebeheersysteem onze code te onderhouden, samen te werken en veilig te stellen.
In ons team willen wij nauwer ontwikkelen op ons Hadoop-cluster. Dit is een systeem waar performance en data op één plek beschikbaar is, waardoor er complexe algoritmes op ons enorme aanbod aan data mogelijk kan worden gemaakt. Deze algoritmen of benodigde ETL-processen worden binnen allerlei programmeertalen uitgevoerd, namelijk: R, Python, Scala, Java, maar ook Angular voor front-end applicaties.
Binnen verschillende tools wordt er vervolgens door Data Scientists (soms ook Data Engineers) ontwikkeld, bijvoorbeeld in: Apache Zeppelin, RStudio en Jupyter. Binnen deze tools is een Git-integratie mogelijk en wij zouden graag inzichtelijk willen hebben hoe dit in de praktijk het beste geïntegreerd kan worden.
Aan jou dus de taak om te onderzoeken hoe deze integratie met ons Hadoop-cluster het beste tot stand kan worden gebracht met ons versiebeheersysteem. Vind jij het interessant om te leren hoe er met big data wordt gewerkt en ons ontwikkelproces op een krachtig cluster te verbeteren, lees dan verder.
Je moet je thuis voelen in een ICT afdeling met ambitie. We geloven in stagiaires die ondernemerschap tonen en willen leren.
Daarnaast vragen wij:
- HBO werk- en denkniveau
- Je bent leergierig en wilt graag tot in de detail weten hoe iets werkt
- Je hebt kennis van softwareontwikkeling
- Je weet hoe het ontwikkelproces werkt
- Je bent helemaal in je element op een Linux (CentOS) systeem
- Je weet precies hoe versiebeheer werkt, met name Git
- Je bent praktisch ingesteld
Je hebt bij Vitens volop kans om voorop te lopen, te pionieren, je vakgebied te innoveren, en tegelijkertijd jezelf te ontwikkelen. Vitens is voortrekker in technologische vernieuwing.
Wij bieden verder:
- Werken met uitdagende- en moderne systemen
- Veel vrijheid, maar ook veel één op één begeleiding
- Een goed beeld van de werkzaamheden van een Data Engineer
- Een conforme stagevergoeding
- Werken binnen een groot bedrijf, heerlijke kantine en een potje pingpong in de pauze!