60. De kracht van Explore (en Exploit)

de vrije stier • 5 juni 2023

Explore vs. Exploit - Het Mentale Model voor Besluitvorming

Waar ga je eten in een stad die je al een aantal keer eerder hebt bezocht? Ga je terug naar hetzelfde plek waar je vorige keer goed hebt gegeten? Of ga je opzoek naar iets anders in de hoop dat het daar beter is?

Met het ‘explore vs. exploit’ concept uit de computerwetenschappen kunnen we het bovenstaande dilemma vanuit een ander perspectief bekijken. Hoeveel moet je experimenten? Uiteindelijk leert dit concept dat het belangrijk is om beschikbare tijd mee te laten weten, wat we van onze fouten kunnen leren en hoe we het beste spijt kunnen vermijden.

Explore vs. Exploit

Het explore vs. exploit algoritme wordt in de computerwetenschappen vaak gebruikt voor optimalisatieproblemen. Het algoritme probeert een balans te vinden tussen het verkennen van nieuwe opties (explore) en het benutten van de beste bekende opties (exploit).

In de computerwetenschappen wordt het exploit-gedeelte gebruikt op het benutten van de al bekende beste opties. Het algoritme maakt gebruik van de informatie die het heeft verzameld tijdens het verkennen en past deze kennis toe om de beste resultaten te bereiken. Denk bijvoorbeeld aan het YouTube algoritme. Het algoritme van YouTube moet ervoor zorgen dat de aanbevolen video’s passen bij de gebruiker. Als in de afgelopen paar weken veel filmpjes over vastgoed zijn bekeken. Dan weet het algoritme dat dit een goede optie is. Op de YouTube homepage zullen er tientallen filmpjes over vastgoed verschijnen.

Aan de andere kant is het explore-gedeelte erop gericht om actief nieuwe opties te verkennen om te zien of er betere resultaten te behalen zijn. Dit is ook duidelijk te zien op YouTube. Als de YouTube homepage goed bestudeerd wordt, dan zijn er een aantal ‘onlogische’ aanbevelingen. Misschien is er een filmpje te zien over koken, auto’s of beleggen. YouTube verkent hierbij de interesse van de gebruiker om mogelijk nieuwe video’s aan te bevelen.

Het algoritme wordt gebruikt om besluitvormingen te optimaliseren. Het YouTube voorbeeld maakt een besluit over wat de beste aanbevelingen zijn. Maar zoals in de introductie te lezen is, kunnen we persoonlijke besluitvorming ook optimaliseren.

Wat is de beste verhouding tussen explore en exploit?

Dat hangt af van de tijd. De waarde van verkennen daalt met het verstrijken van de tijd. Terwijl de waarde van benutten en genieten stijgt met de tijd.

Dit is goed te zien bij het eten in reeds bezochte stad. Als je maar één dag in deze stad bent, dan kies je voor het restaurant waarvan je weet dat je goed eten krijgt. Als je voor een ander restaurant zou kiezen, dan kan het tegenvallen.

Maar ben je er langer, dan verandert het besluit. Als je er bijvoorbeeld drie dagen bent, dan kan je er zelfs twee dagen voor kiezen om twee dagen te verkennen. Op de laatste dag wil je echter gegarandeerd een goede maaltijd en zal je terugvallen op het beste restaurant. Aan het einde van de trip zal je moeten benutten.

De schrijver van Algorithms to Live By, Brian Christian en Tom Griffiths, wijden een volledig hoofdstuk aan het explore vs. exploit vraagstuk. Aan het einde van dat hoofdstuk vatten zei deze les mooi samen.

“Explore when you will have time to use the resulting knowledge, exploit when you’re ready to cash in.”

Verkennen is altijd leerzaam

Falen is onvermijdbaar tijdens het verkennen. Verkennen is experimenteren. Je begeven op gebieden die nog niet eerder (door jou) zijn ontdekt. Tijdens het verkennen kan je erachter komen dat de gemaakte keuze niet bij jou past. In mijn ogen is dat geen falen, maar erachter komen wie jij bent.

Mislukte pogingen zijn nieuwe informatie zodat we in de toekomst betere explore vs. exploit beslissingen kunnen maken.

Ik ben de man van duizend-en-een onafgemaakte projecten. Ik ben een YouTube-kanaal gestart over persoonlijke financiën. Ik was samen met een vriend een grafisch ontwerpbureautje begonnen. Deze projecten hadden in mijn ogen veel potentie. Niet voor het geld, maar voor het vervullen van mijn deelbare, creatieve stem. Het was een verkenningspoging van mijn creativiteit. Eerst gooide ik mijn creativiteit in video’s. Vervolgens in illustraties. Na al die ‘mislukte’ verkenningen ben ik terecht gekomen bij het geschreven woord. Het medium waar mijn creatieve stem het beste kan communiceren.

Die verkenningen kunnen als falen worden gezien. Maar voor mij was het leerzaam. Ik had mijn stem gevonden.

Als we eenmaal ‘het’ hebben gevonden, gaan we volledig in op exploit. We willen helemaal in gaan op de nieuwe ervaring of activiteit. Maar kijk uit. Wij en onze omgeving ondergaan een constante verandering. Een optie voor volledige benutting van het gevonden ideaal is geen optie. Er is tenslotte ook nog altijd de kans ‘het’ overtroffen kan worden. Daarom het volgende.

Experimenteer eens wat meer nu het nog kan. Zo kom je er echt achter wat bij je past en wie je bent. Als de tijd daar is, kan je all-in gaan. Alleen de tijd is waarschijnlijk later dan je had verwacht.

Blijf denken,

De vrije stier

< Ouder bericht Nieuwer bericht >