Hier bij GutCheck praten we veel over de 4 V’s van Big Data: volume, variety, velocity, en veracity. Er is één “V” die wij belangrijker vinden dan alle andere – waarheidsgetrouwheid. De waarheidsgetrouwheid van gegevens is het gebied dat nog voor verbetering vatbaar is en dat de grootste uitdaging vormt wanneer het om Big Data gaat. Nu er zoveel gegevens beschikbaar zijn, is het verschil tussen degenen die big data met succes gebruiken en degenen die moeite hebben ze te begrijpen, dat ervoor gezorgd moet worden dat de gegevens relevant en van hoge kwaliteit zijn.
Inzicht in het belang van de waarheidsgetrouwheid van gegevens is de eerste stap bij het onderscheiden van het signaal van de ruis als het gaat om big data. Met andere woorden, waarheidsgetrouwheid helpt bij het filteren van wat belangrijk is en wat niet, en uiteindelijk zorgt het voor een dieper begrip van data en hoe deze in context te plaatsen om actie te ondernemen.
Wat is waarheidsgetrouwheid van data?
Waarheidsgetrouwheid van data, in het algemeen, is hoe accuraat of waarheidsgetrouw een dataset kan zijn. In de context van big data krijgt het echter iets meer betekenis. Meer specifiek, als het gaat om de nauwkeurigheid van big data, gaat het niet alleen om de kwaliteit van de gegevens zelf, maar ook om hoe betrouwbaar de gegevensbron, het type en de verwerking ervan zijn. Het verwijderen van zaken als vooringenomenheid, afwijkingen of inconsistenties, duplicatie en volatiliteit zijn slechts enkele aspecten die een rol spelen bij het verbeteren van de nauwkeurigheid van big data.
Helaas hebben we soms geen controle over de volatiliteit. De volatiliteit, soms een andere “V” van big data genoemd, is de snelheid waarmee de gegevens veranderen en de levensduur van de gegevens. Een voorbeeld van zeer volatiele gegevens zijn sociale media, waar sentimenten en trending topics snel en vaak veranderen. Minder volatiele gegevens lijken meer op weertrends, die minder vaak veranderen en gemakkelijker te voorspellen en te volgen zijn.
De tweede kant van de betrouwbaarheid van gegevens is ervoor te zorgen dat de verwerkingsmethode van de feitelijke gegevens zinvol is op basis van de bedrijfsbehoeften en dat de output relevant is voor de doelstellingen. Dit is uiteraard vooral van belang wanneer primair marktonderzoek wordt gecombineerd met big data. Door big data op de juiste manier te interpreteren, zijn de resultaten relevant en bruikbaar voor actie. Bovendien betekent de toegang tot big data dat u maandenlang ongericht informatie zou kunnen doorspitten zonder een methode om vast te stellen welke gegevenspunten relevant zijn. Daarom moeten gegevens tijdig worden geanalyseerd, wat moeilijk is met big data, anders zouden de inzichten niet bruikbaar zijn.
Waarom het belangrijk is
Big data is zeer complex, en als gevolg daarvan worden de middelen om het te begrijpen en te interpreteren nog steeds volledig geconceptualiseerd. Hoewel velen denken dat machine learning een grote toepassing zal hebben voor big data-analyse, zijn statistische methoden nog steeds nodig om de kwaliteit van de gegevens en de praktische toepassing van big data voor marktonderzoekers te waarborgen. Je zou bijvoorbeeld geen industrieverslag van het internet downloaden en het gebruiken om actie te ondernemen. In plaats daarvan zou u het waarschijnlijk valideren of gebruiken om aanvullend onderzoek te doen voordat u uw eigen bevindingen formuleert. Big data zijn niet anders; je kunt big data niet nemen zoals ze zijn zonder ze te valideren of uit te leggen. Maar in tegenstelling tot de meeste marktonderzoekspraktijken heeft big data geen sterke basis met statistiek.
Daarom hebben we tijd besteed aan het begrijpen van datamanagementplatforms en big data om te kunnen blijven pionieren met methoden die gegevens integreren, aggregeren en interpreteren met een precisie van onderzoekskwaliteit zoals de beproefde methoden waaraan we gewend zijn. Onderdeel van deze methoden is het indexeren en opschonen van de gegevens, naast het gebruik van primaire gegevens om meer context te geven en de waarheidsgetrouwheid van de inzichten te handhaven.
Veel organisaties kunnen niet alle tijd besteden die nodig is om echt te kunnen onderscheiden of een big data-bron en verwerkingsmethode een hoog niveau van waarheidsgetrouwheid handhaven. Werken met een partner die de basis voor big data in marktonderzoek kent, kan helpen. Als u wilt weten hoe een klant van ons inzichten op basis van enquête- en gedrags(big)data heeft benut, bekijk dan de casestudy hieronder. U zult ook zien hoe zij in staat waren om de punten te verbinden en de kracht van audience intelligence te ontsluiten om een betere consumentensegmentatiestrategie te ontwikkelen.