Van alle data in de wereld dateert 90 procent van de laatste twee jaar. Iedere dag komt daar wereldwijd 2,5 triljoen bytes bij. Gelukkig verwerkt een machine data tot 2000 keer sneller dan de mens. Maar dat laat onverlet dat de snoepwinkel eenvoudigweg te groot is, erkent Herman van der Sluis van pensioenbelegger PGGM. Het probleem is niet de dataverwerking door de computer, maar de vraag die de belegger moet beantwoorden: welke data voegt wel of niets toe?
De grootste, meest sophisticated partijen in de beleggingssector, zoals PGGM en APG in Nederland, zijn bezig om de toekomst in huis te halen - dat is er één van kunstmatige intelligentie, machine learning, alternatieve data en data science. Om te zorgen dat deze technieken en datasets iets toevoegen aan de beleggingsprocessen worden veel specialisten binnengehaald, zoals wiskundigen, econometristen, software-specialisten en data scientists. Zij moeten helpen bepalen welke traditionele en alternatieve data meerwaarde heeft voor de beleggingen van PGGM, de in-house belegger voor Pensioenfonds Zorg en Welzijn.
Herman van der Sluis (foto), die lead portfolio manager of Investment Analytics is, zegt in een gesprek met Investment Officer dat de data science revolutie die op dit moment door de beleggingsindustrie gaat het gevolg is van het feit dat 3 ontwikkelingen samen zijn gekomen: de opkomst van een enorme hoeveelheid datasets voor beleggers, de ontwikkeling van geavanceerde analyse technieken, zoals artificiële intelligentie, machine learning en natural language processing, waarmee deze data verwerkt kan worden, en de beschikbaarheid van bijzonder krachtige computers om deze analyses ook daadwerkelijk uit te kunnen voeren.
‘Gezien de grote aantallen beschikbare datasets en de vaak hoge prijzen per dataset is de kernvraag hoe je ‘het kaf van het koren scheidt’, erkent ook van der Sluis. ‘Mijn advies is: begin bij jezelf. Wat wil je als beleggingsteam echt graag weten? Wat voegt daadwerkelijk iets toe aan je beleggingsbeslissing en aan je beleggingsdoelen? Ik denk dat dat het goede vertrekpunt is.’
Inzet van data scouts
Om sneller de weg te vinden in de wereld van alternatieve data kun je vervolgens gebruik maken van data scouts. ‘Zij kennen de markt en weten wat de goede providers zijn. Welke datasets beschikbaar zijn, bijvoorbeeld over een specifiek ESG onderwerp, en wat de beschikbare historie, dekking en kwaliteit van elke dataset is. Zo kan het zoeken naar geschikte datasets vlotter verlopen.’
Alternatieve data kan niet alleen inzichten geven op het gebied van ESG, maar de juiste informatie kan ook bijdragen aan het rendement. Alternatieve data waar PGGM op dit moment naar kijkt, is bij voorbeeld tekstuele informatie die je uit jaarverslagen kunt halen en sentiment analyses. Vaak gaat het dan om specifieke geschreven of gesproken tekst, die niet in traditionele data terug te vinden is. ‘Daarbij kijken we bijvoorbeeld of een CEO een positief beeld schetst naar aanleiding van de jaarresultaten.’
‘Dan komt bij ons de vraag: hoe brengen we het van ruwe data naar relevante informatie en hoe brengen we deze informatie naar de beleggingsteams? Daar zijn we nu volop mee bezig. Zowel het op- en uitbouwen van het onderliggende data platform als het opzetten van het analyse platform is een activiteit waarin we de komende jaren nog verder zullen investeren.’
Ook moet je jezelf organisatorisch en procesmatig op die informatiestroom weten in te richten’, stelt van der Sluis. Processen moeten worden aangepast. Hoe ga je met de dataset om? Hoe decentraliseer je het naar het niveau van beleggingsteams? Je wilt namelijk niet dat alle datastromen langs een centraal punt moeten, want dat maakt de wachtrijen te lang. We zijn daarom een “data mesh” inrichting aan het uitwerken.’
Wat draagt het aan de alpha bij?
De moeder aller vragen bij de selectie van data is de vraag of het bijdraagt aan alpha. ‘Dat is de kritische vraag die je bij iedere dataset moet stellen. Wij vinden op dit moment ESG-data erg belangrijk, omdat wij met onze beleggingen vooral ook impact willen maken. Dus kijken we niet alleen naar de risico-rendementverhouding, maar stellen we ons ook de vraag: wat is de impact die we met deze beleggingen, en dus met deze datasets, hebben’, vertelt van der Sluis. ‘Wat zijn de bedrijven aan het doen waar wij exposure naar hebben? Wat is hun communicatie? Wat is hun footprint? Dat zijn voor ons belangrijke aspecten om in beeld te krijgen.’
Of aanvullende, alternatieve informatie voldoende toevoegt is een essentiële vraag om te beantwoorden. Want dat staat in geen enkele verhouding tot het gigantische aanbod, dat van der Sluis wel 5 tot 10 miljard dollar groot acht. Het is een markt geworden, waarin je als belegger vooral ook moet weten wat je precies zoekt. Maar, voegt van der Sluis eraan toe, als je de goede keuze maakt dan kan het ook alpha-verhogend zijn.
Zo hebben bij voorbeeld hedgefondsen veel betaald voor credit card-gegevens, omdat die op jaarbasis wel 4 procent aan alpha genereerden. Maar het verval was daarin op jaarbasis ook wel groot, omdat het – door zijn succes – een ’’crowded trade’’ werd. Alpha ligt – historisch gezien – dan ook steeds minder voor het oprapen, erkent van der Sluis. Maar daar kan machine learning en kunstmatige intelligentie een positieve rol in spelen, omdat het een voorspellende waarde wordt toegedicht. Modellen moeten bepalen of die aanname ook juist blijkt te zijn.
De volledig data-gedreven organisaties die PGGM en APG in de komende jaren worden, stelt hoge eisen aan de organisaties zelf, maar ook aan de kennis en kunde die men in huis heeft. Het leidt tot de oprichting van agile-teams en het opleiden van medewerkers in de benodigde ‘data science’ technieken – de nieuwe wereld eist dat men andere deskundigheid en ervaring dient samen te brengen.
Hoe zit het met de CO2-voetafdruk?
Er gloort daarbij ook een nieuwe, nog niet volledig uitgedachte uitdaging voor pensioenbeleggers en de pensioenfondsen die zij als klanten hebben: de ongekend sterk toegenomen rekenkracht van de laatste jaren, waar institutionele partijen nu op inspelen in de hoop meer inzicht en rendement voor hun deelnemers te genereren, heeft namelijk ook een prijs: meer datacenters en dus meer energieverbruik, wat gevolgen heeft voor de CO2-voetafdruk.
Herman van der Sluis en de bij het gesprek aanwezige woordvoerder erkennen dat het de CO2-voetafdruk zal kunnen verhogen en dat dat beleggers - die ook de bedrijven waarin ze beleggen op dat punt de maat nemen - tot introspectie dwingt. ‘Inderdaad, fair point, je kunt anderen niet de maat nemen, zonder dat voor onszelf ook te doen.’