Probleem op deze pagina?

Project: Data mining: van relationele database naar Big Data

TETRA: Technologie-transfer gerichte projecten door instellingen van hoger onderwijs
01/10/2014
30/09/2016

* De beperkingen en opportuniteiten van zowel de traditionele RDBMS als de Big Data technologie aantonen.
* De beste Data Mining technologie kiezen voor de bedrijfsspecifieke situatie.
* De meest optimale combinatie van software componenten zoeken om de drempel naar Big Data verwerking te verlagen, o.a. door het optimaliseren van het bevragen van Big data met SQL.
* De meest optimale software settings uitzoeken via real world metingen, rekening houdend met de data en software van iedere specifieke situatie. * Hardware aanbevelingen formuleren voor de Big Data clusters

Big Data Consultants, Ieder bedrijf met een relatief grote database die men beter wil benutten

De grote hype rond Big Data zorgt er voor dat bedrijven zich realiseren dat het benutten van de extern beschikbare en eigen data unieke inzichten en kennis kan verschaffen die nauw aansluiten bij de “core business” van het bedrijf.
De pendel van data mining kan op twee manieren te ver uit slaan: men kan enerzijds (te) zwaar investeren in de meest recente evoluties van op Hadoop gebaseerde/geïnspireerde gedistribueerde processing systemen en bijzonder veel tijd verliezen met het werkende krijgen. Anderzijds kan men blijven zweren bij klassieke relationele database (RDBMS), en nieuwe marktopportuniteiten laten liggen omdat men niet in staat is om goed om te gaan met niet- of semigestructureerd data.
Door het combineren van ervaring met het optimaliseren van klassieke RDBMS en het onderzoeken van de vele Big Data alternatieven, wil het Sizing Servers Lab, een onderzoeksgroep van Howest, onze Vlaamse bedrijven inzicht geven in welke soort database technologie het meest geschikt is voor hun situatie. We zullen op die manier de mogelijkheden en beperkingen van iedere technologie aantonen.
Daarnaast willen we Big Data pioniers ondersteunen om de investeringen in de jonge technologie zo rendabel mogelijk te maken door hun distributed processing cluster zo optimaal mogelijk te configureren, zowel qua hardware, software componenten als qua configuratie. Voor onze data experten, professionals die als geen andere sector specifieke data doorgronden, willen we de drempel naar het exploreren van Big Data verlagen. Daarnaast willen we onze IT integrators en hosting providers ondersteunen bij het aanbieden van oplossingen naar hun klanten toe.
De doelstellingen van deze TETRA zijn dus:
* De beperkingen en opportuniteiten van zowel de traditionele RDBMS als de Big Data technologie aantonen.
* De beste Data Mining technologie kiezen voor de bedrijfsspecifieke situatie.
* De meest optimale combinatie van software componenten zoeken om de drempel naar Big Data verwerking te verlagen, o.a. door het optimaliseren van het bevragen van Big data met SQL.
* De meest optimale software settings uitzoeken via real world metingen, rekening houdend met de data en software van iedere specifieke situatie.
* Hardware aanbevelingen formuleren voor de Big Data clusters.
Wij richten ons dus zowel op bedrijven die Big Data pioniers zijn, als op zij die een nood voor data mining voelen, maar nog volop hun data mining strategie aan het bepalen zijn. Een stap voor stap handleiding, een prototype van de optimale cluster en intensieve hands-on workshops zullen deze doelgroepen helpen om de resultaten van deze TETRA te valoriseren.

We maakten de inhoud van dit project aan 400 bedrijven bekend. Ongeveer een 80-tal bedrijven werden bereikt met adviezen over infrastructuur en software optimalisatie gebaseerd op case studie.
De cases studies bij 5 bedrijven (Be-mobile, RouteYou, E-bo Enterprises, Ontoforce en BrightEye) resulteerden allemaal in nieuwe innoverende diensten die de competitiviteit van de bedrijven sterk verhoogden. Bij het zesde bedrijf – Dataminded – ging het voornamelijk over experimenten die een kennissprong mogelijk maakten.

Een nieuwe KMO innovatie studie (RouteYou – “Long Neck Long Tail”) was het resultaat van deze TETRA.

Het begrijpen van de nieuwe data mining technologie was een serieuze uitdaging. Enkel dankzij deze TETRA waren we in staat om de technologisch nog complexere TETRA “Analytics in the Cloud” op te starten.

Sizing Servers Lab van Howest
Big data.be community, Combell, RouteYou, e-Bo Enterprises, BrightEye, BigBoard.io, Televic, Ontoforce, Savaco, EnergyICT, Dataminded, Baboon IT, Be-mobile, Datacrunchers
Johan De Gelas
Computer Hardware, Computer Software, Data Processing / Data Interchange, Middleware, Databanken, Database Management, Data Mining, IT toepassingen medisch, IT toepassingen voor Transport en Logistiek
Wannes De Smet
Bertrand Deroisy, Luc Verhoeven (Just Innovation), Marinka D'Hont (Infrabel), Luc Larmuseau (iLLumoo), Kurt Gesquiere (voestalpine Sadef)
http://www.sizingservers.be
Share this on