Klantprofiel Index van HDN
Klantprofiel Index HDN
Nieuwe blik op hypotheekmarkt
Starters, doorstromers, oversluiters en mensen met een tweede hypotheek zijn op de woningmarkt vertrouwde begrippen. Maar is die verdeling nog van deze tijd? Hoe eenduidig is het beeld van de starter en bestaat de gemiddelde oversluiter eigenlijk wel? HDN (Hypotheken Data Netwerk) en HippoLine hebben machine learning technieken (advanced analytics) losgelaten op bijna 390.000 hypotheekaanvragen uit 2018. Wij hebben tien nieuwe, gedetailleerde klantprofielen ontdekt en ontwikkelde samen de Klantprofiel Index.

Wie kent ze niet: de starter. Jong, gretig en ambiteus. Maar op de woningmarkt kunnen ze geen kant op. Of toch wel?
De Klantprofiel Index is een BI-applicatie op het HDN Platform. HDN is een coöperatieve vereniging voor alle grote aanbieders van hypotheek- en hypotheek gerelateerde producten. Met de Index kunnen instellingen hun doelgroepen en marktpositie grondiger analyseren, hun beleidsvoornemens bijstellen en producten ontwikkelen die beter aansluiten op geherdefinieerde klantprofielen (clusters). HippoLine verzorgt sinds 2017 interactieve jaar- en kwartaaloverzichten van HDN.
Rijk klantbeeld
HDN heeft de nieuwe Index op 3 oktober gepresenteerd op het IRR Mortage Tech Event in Amsterdam. ‘Het herdefiniëren van de woningmarkt aan de hand van tien relevante groepen heeft grote impact’, aldus Arjen de Bake, business development manager van HDN. De Index rekent af met ‘starters’ en ‘doorstromers’ en introduceert tien nieuwe ‘etiketten’: Starter Jong, Starter Stabiel, Starter Hoog Segment. Opstromer, Opstromer Nieuwsbouw en Doorstromer NHG. Oversluiter, Ondernemer Aankoop, Verbouwer en Gepensioneerde.
Dag starters…
De tien klantprofielen zitten in één applicatie. De Index op het HDN Platform heeft elf tabbladen. Die geven de gebruiker een rijk en gevarieerd klantbeeld, analysetools, visualisaties en verklarende tekst over leningen, waardes en rentes. Per klantprofiel kan worden ingezoomd op kenmerken en ontwikkelingen. Er zijn een uitgebreide tabel per cluster, een geografische kaart en export modus. Daarmee kan informatie met derden worden gedeeld. De Bake: ‘Met deze Index kan het succes van nieuwe producten nauwgezet worden gemonitord, zonder dat daar door anderen kostbaar onderzoek naar hoeft te worden gedaan.’
Clusteranalyse
Het is voor het eerst dat op nagenoeg alle Nederlandse hypotheekdata clusteranalyse is toegepast. ‘Machine learning is een ingewikkeld proces. Menselijke rekenkracht is ontoereikend om tot een dergelijke classificatie te komen,’ aldus De Bake van HDN. Vanuit HippoLine had Thijs de Bruijn de regie over het technische deel van het werk. Clustering is een machine learning techniek waarbij datapunten, ofwel de ‘regels’ in de dataset, worden gegroepeerd. Datapunten in dezelfde groep moeten vergelijkbare kenmerken hebben, terwijl datapunten in verschillende groepen zeer ongelijke kenmerken hebben. Het doel van het creëren van deze groepen is om gedetailleerdere informatie met betrekking tot een bepaald vraagstuk te krijgen en daarmee de mogelijkheid te scheppen om de groepen op een specifieke manier te behandelen of benaderen, zonder dat je dat zelf zou kunnen.
Methodieken
In aanloop naar de Klantprofiel Index zijn door analisten van HippoLine extreme waardes, uit de gegevens gehaald. Daarop volgden vier methoden van onderzoek: PCA, Elbow, Clara en Cohens ‘D’. PCA (Principal Component Analysis) is vooral gebruikt om te bepalen welke dimensies gebruikt worden. Zo hangt de marktwaarde van een woning samen met de hoogte van een inkomen. Maar kenmerken die overduidelijk over hetzelfde gaan, zoals de ‘marktwaarde van een te verkopen woning’ tegenover ‘er is een woning te verkopen’, die worden in het model niet dubbel gewogen. Na PCA bleven 43 kenmerken overeind om de volgende stap te kunnen zetten.
Afbeelding PCA
Om van deze 43 kenmerken marketingclusters te maken is de Elbow-methodiek toegepast, een systematische interpretatie- en validatiemethode ontworpen om het juiste aantal clusters in de gegevensset te vinden.
Met behulp van de Clara-methodiek (Clustering Large Applications) worden vervolgens volledig automatisch de clusters bepaald. En krijgt ieder cluster zijn eigen set met kenmerken. Met de Clara-methodiek worden overigens deze clusters niet geïnterpreteerd. Daarvoor wordt de Cohen ‘D’ gebruikt.
Afbeelding Cluster Plot.
Tot slot heeft ieder cluster met Cohens ‘D’ een wegingsfactor gekregen. Zo is een beeld van het cluster ontstaan en hebben de ontwikkelaars van de Klantprofiel Index de naam van het klantprofiel geformuleerd. Op basis van dit procedé zijn de nieuwe benamingen tot stand gekomen.
Afbeelding 4 marketingcluster.
Andere toepassingen
De Klantprofiel Index is een voorbeeld van hoe clusteranalyse toegevoegde waarde kan creëren binnen een sector of organisatie, zeker als er sprake is van veel, heel veel data. Het verkrijgen van marktinformatie is slechts één van de mogelijkheden. Andere zijn:
- Binnen e-commerce is het bijvoorbeeld mogelijk om landingspagina’s te maken voor bezoekers met specifieke kenmerken uit een cluster. Op die manier kan de conversie worden verhoogd.
- Gemeenten, provincies of nutsbedrijven kunnen clusteranalyse inzetten om hun doelstellingen te koppelen aan buurt-karakteristieken of andere factoren.
- Ook kunnen grote hoeveelheden producten worden geclusterd om klanten beter van dienst te kunnen zijn, zoals Spotify en Netflix dat doen.
Machine learning kan interessant zijn voor bedrijven en organisaties die worstelen met een datavraagstuk en het idee hebben dat hun kennis op dit moment te generiek is. Om dan tot zinvolle inzichten te komen is domeinkennis essentieel en de datakwaliteit moet worden beoordeeld. Daarnaast is technische expertise nodig voor de inzet van de juiste methodieken en een correcte interpretatie van de resultaten op statistische modellen. Daar kunnen de specialisten van HippoLine je bij helpen.
Benieuwd naar wat een Clusteranalyse voor je organisatie zou kunnen betekenen? Neem dan vrijblijvend contact met ons op, wij kijken er graag samen naar!
Mirjam van Kooten, CEO HippoLine