Handhaving illegale vakantieverhuur
- Publicatiecategorie
- Impactvolle algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- Buiten gebruik
Algemene informatie
Thema
- Economie
- Ruimte en infrastructuur
Begindatum
Contactgegevens
Verantwoord gebruik
Doel en impact
Het mag bijvoorbeeld maximaal 30 nachten per jaar en aan 4 personen per keer. Het moet gemeld worden bij de gemeente. Niet iedereen houdt zich aan die voorwaarden. De gemeente krijgt soms meldingen van buren die vermoeden dat een woning onterecht verhuurd is. Medewerkers van Toezicht & Handhaving doen daar onderzoek naar. Het algoritme helpt de meldingen te prioriteren zodat de beperkte handhavingscapaciteit efficiënt en effectief ingezet kan worden. Door gegevens te analyseren, schat het algoritme het risico in dat de woning op het gemelde adres illegaal wordt verhuurd. Het algoritme gebruikt daarvoor data uit onrechtmatige vakantieverhuur van de afgelopen 5 jaar. Het gaat om meldingen, gegevens die de gemeente tijdens het werkproces heeft verzameld, persoonsgegevens (Basisregistratie Personen) en gegevens over gebouwen (Basisregistratie Adressen en Gebouwen).
Afwegingen
Menselijke tussenkomst
Er is geen sprake van geautomatiseerde besluitvorming. Als we een adres onderzoeken op het vermoeden van illegale vakantieverhuur komt dit voort uit een melding van bijvoorbeeld een omwonende of een verhuurplatform. Het algoritme helpt de medewerkers van Toezicht & Handhaving te bepalen bij welke meldingen de kans op illegale verhuur het grootst is, zodat die meldingen het eerst onderzocht kunnen worden. De medewerker krijgt een overzicht te zien, die toont op grond van welke criteria het algoritme het risico op illegale vakantieverhuur hoog of laag inschat. Op die manier maken we inzichtelijk waarop het algoritme de risico-inschatting heeft gebaseerd. Of er daadwerkelijk sprake is van illegale vakantieverhuur wordt vastgesteld door de verantwoordelijk toezichthouder en de projecthandhaver. Daarvoor wordt een voor- en buitendienstonderzoek uitgevoerd. Vervolgens wordt het dossier intensief besproken in een debriefing met de medewerkers die tot besluitvorming kunnen overgaan. Het algoritme heeft een wezenlijke invloed op de volgorde waarin we meldingen afhandelen, maar neemt niet zelfstandig de beslissingen of er al dan niet sprake is van illegale vakantieverhuur. Om te voorkomen dat medewerkers teveel vertrouwen in het algoritme hebben, is er iemand aangesteld om het algoritme en de werking daarvan te monitoren. Daarnaast is een werkinstructie opgesteld voor de medewerkers die met dit instrument gaan werken. Daarbij volgen de medewerkers workshop over de kansen en risico’s van het gebruik van algoritmen.
Risicobeheer
Het systeem heeft uiteraard gevolgen voor de mogelijke overtreder. Een melding kan namelijk meer of minder prioriteit krijgen dan zonder het algoritme. We hebben verschillende maatregelen getroffen om ervoor te zorgen dat alle risico-inschattingen van het algoritme niet op toeval berusten. Een belangrijke maatregel is dat we dit algoritme in een pilotfase uitvoerig en voortdurend evalueren op bv. betrouwbaarheid, voordat het wordt geïmplementeerd in de bedrijfsvoering.
Werking
Gegevens
Identiteits- en huisvestingsgegevens (BRP) Een beperkte set gegevens uit de Basisregistratie Personen (BRP) over de identiteit en huisvestingssituatie van de bewoners, namelijk: naam van de geregistreerde bewoners; geboortedatum; vertrekdatum Amsterdam; vertrekdatum adres; vestigingsdatum adres; overlijdensdatum. Gegevens over gebouwen (BAG) Een beperkte set gegevens uit de Basisregistratie Adressen en Gebouwen (BAG) over het gebouw, namelijk: adres, straatcode, postcode; id-adres; omschrijving pand; Amsterdamse BAG-code, landelijke BAG-code; type woning (huur, sociale huur / vrije sector, koop); adresseerbaar BAG-ID aantal kamers; vloeroppervlak; bouwlaag van voordeur appartement; aantal bouwlagen; omschrijving verdieping woonobject. Gegevens uit illegale vakantieverhuurzaak Gegevens uit de melding en eventuele gerelateerde illegale vakantieverhuurzaak, namelijk: zaak id; datum van start van onderzoek / melding; stadium van behandeling van de melding; stadia nummer, omschrijving en id; (meld)code; code overtreding; code (behandelend) medewerker; wel / geen anonieme melder; datum melding; situatieschets; bevindingen onderzoek; gebruiker die melding heeft gecreëerd (met datum), of aangepast (met datum aanpassing); behandelcode (type zaak, indeling in team); resultaat; datum wanneer zaak is afgesloten; reden waarom zaak is afgesloten.
Technische werking
Architectuur van het model Gemeente Amsterdam heeft een algoritme ontwikkeld dat verbanden en patronen kan vinden in grote hoeveelheid informatie over illegale vakantieverhuur. Het algoritme berekent welke informatie vaker in verband kan worden gebracht met illegale vakantieverhuur en welke informatie niet. Het algoritme doet dit door wiskundige berekeningen uit te voeren volgens het kansboom-principe. Dat wil zeggen dat het algoritme op basis van een groot aantal kansberekeningen een gemiddelde neemt. Dit gemiddelde wordt gebruikt om de wiskundige verwachting te genereren van illegale vakantieverhuur op een adres. Het algoritme berekent deze verwachting pas als we een nieuwe melding (bijvoorbeeld van een omwonende of verhuurplatform) ontvangen van mogelijke illegale vakantieverhuur. Dit algoritme wordt een ‘random forest regressie algoritme’ genoemd. Om de door het algoritme gemaakte afwegingen inzichtelijk te maken voor mensen passen we de “SHAP”-methodiek toe (SHapley Additive exPlanations; https://github.com/slundberg/shap). SHAP berekent voor iedere individuele zaak welke indicatoren hebben bijgedragen aan die voorspelling en of dit ervoor zorgde dat de voorspelling hoger of lager werd. Zo kan een medewerker altijd zien waar het algoritme de risico-inschatting op heeft gebaseerd en een afgewogen besluit nemen. Prestatie Het voordeel van een ‘random forest regressie’ is dat het een redelijk complex algoritme is dat de werkelijkheid goed kan benaderen. Maar er is wel een kans op overfitting. Een ‘tree’ met veel lagen perst de data uit om specifieke antwoorden te leveren. Er is onderzocht hoeveel lagen het model nodig heeft om generiek inzetbaar te blijven en dus niet te overfitten. Daarnaast worden continu datapunten gecategoriseerd (gegroepeerd), zodat het model een overzichtelijk aantal mogelijkheden heeft in plaats van een oneindig aantal met continue waarden. Hierdoor is het model beter in staat is om tot een conclusie te komen.
Soortgelijke algoritmebeschrijving
- Om Amsterdam leefbaar en toegankelijk te houden, mag er maar een beperkt aantal auto’s in de stad parkeren.Laatst gewijzigd op 16 december 2024 om 15:21 | Publicatiestandaard 1.0
- Publicatiecategorie
- Impactvolle algoritmes
- Impacttoetsen
- Veld niet ingevuld.
- Status
- In gebruik