Probleem op deze pagina?

Project: Machine Learning in the Cloud

TETRA: Technologie-transfer gerichte projecten door instellingen van hoger onderwijs
01/11/2018
31/10/2020

Door een beperkte aantal eigen case studies en het bestuderen van bestaande willen we onze Vlaamse
bedrijven helpen sneller slimme applicaties te implementeren. Dit project zal duidelijk maken
1. Wat de snelste methode en technologische keuzes zijn om van een goed gestelde business vraag
naar een “slimme” applicatie te gaan
2. Welke delen van de machine learning “flow” nog heel wat specifieke kennis vereisen, die niet
aanwezig is bij de gemiddelde developer
3. Wat de sterktes en zwaktes zijn van de verschillende machine learning toolboxes
M.a.w. dit project wil de investering (time to market, operationele kosten) om een slimme applicatie te
bouwen verkleinen én duidelijk maken welke kennissprong een bedrijf moet maken om zelfstandig aan
de slag te kunnen met ML toolboxen.

Als onderzoeksgroep gelinkt aan de IT bachelor NMCT (New Media & Communication Technology www.nmct.be)
die focust op applicaties in een Internet of Things context mikken wij op twee doelgroepen. De eerste
doelgroep zijn alle bedrijven die inzichten willen halen uit sensor data, de tweede uit ongestructureerde
tekst data uit een context van sociale media. Of in machine learning termen: applicaties die vnl.
classificatie & regressie vereisen. We mikken ook op bedrijven die Machine Learning niet als
kernactiviteit hebben, maar het zien als een “toolbox” om betere software te schrijven.

Tot voor kort was het gebruik van Machine Learning (ML) methodes een heel moeizaam proces:
statistische analyse van data, data cleaning, feature learning, het kiezen van het juist machine learning
model … het vereiste het bouwen van een “pipeline” van complexe software. Dit vereist heel specifieke
en vooral moeilijk te vinden profielen. Gezien de schaarste aan data engineers en scientists op de
arbeidsmarkt was het bouwen van een intelligente applicatie een dure, bijna onmogelijke opdracht voor
de gemiddelde KMO.
De Machine Learning toolboxes, aangeboden door de grote Cloud Providers – Google, Microsoft en
Amazon – beloven dat developers met beperkte data science kennis in staat zijn om een webservice te
bouwen die gebruikt maakt van Machine Learning. Die software wordt gebouwd met een browser
gebaseerde tool die een drag-en-drop interface aanbiedt. Tientallen voorbeelden en kant en klare
bibliotheken vereenvoudigen de job van de developer tot het kiezen van de juiste “building blocks” in
een workflow. Gesofisticeerde modellen kan je bouwen zonder één lijn code. En indien dat toch nodig
is kan je de bekende R of Python code invoegen.
Het leidt geen twijfel dat deze toolboxen een groot deel van het moeizame proces om inzichten en
voorspellingen uit de data te puren sterk kunnen vereenvoudigen en automatiseren. In voorgaande
TETRA projecten hebben wij heel wat bedrijven geholpen om hun (Big) Data zo efficiënt mogelijk op
te slaan, vnl. “in de Cloud”. Op zoek gaan naar methodes om die data zo veel mogelijk te valoriseren
is de volgende logische stap.
Doelgroep
Als onderzoeksgroep gelinkt aan de IT bachelor

Howest (Sizing Servers Lab)
Johan De Gelas
Artificiële Intelligentie (AI), Computer Software, Databanken, Database Management, Data Mining
Johan De Gelas
Pieter Dekeyzer (Savaco)
http://www.sizingservers.be
Share this on