FIDIS Workshop 7.15

advertisement
Valorisatiepanel
4 december 2009
10.00 – 12.00
Faculty Club – Universiteit Leiden





Voorstelronde
Presentatie Bart Custers: onderzoeksvoorstel
Presentatie Toon Calders: building classifiers
Presentatie Bart Schermer: legal requirements
Terugkoppeling en discussie
 Vragen over presentaties
 Rol van het valorisatiepanel
 Discussie

Afsluiting en gezamenlijke lunch
2
Information overflow
3
Regressie
Classificatie
Clusteren
4
2 gebruikelijke oplossingen:
Probleem 1:
Vooraf niet alles verzamelen…
Database kan discriminerende gegevens bevatten
Administratieve lasten
 Overzicht raakt verloren
 Beveiligingsproblemen
 Privacyproblemen

… en achteraf analyseren
Niet alleen controle op bekende verdachten
(zwarte lijsten, second offenders)
 Maar ook controle op nieuwe verdachten
(risicoprofielen, first offenders)

Verzamel antecedenten data
Bouw risicoprofielen op
basis van historische data
Probleem 2:
Historische data kunnen echter discriminerende patronen bevatten
5
5

Informatietheorie stelt dat de disseminatie van
informatie onomkeerbaar is:
 Informatie is eenvoudig te vermenigvuldigen
 Informatie is eenvoudig te verspreiden

Klassieke (a priori) focus op toegang tot
informatie beperken werkt dus niet

Beter: (a posteriori) focus op transparantie en
verantwoording
Probleem 3:
Toegangsbeperkingen zijn geen geweldige oplossing
1
6






Ongewenste/verboden selectie
Discriminatie
Stigmatisering bepaalde groepen
Confrontatie met ongewenste info
Eenzijdige info-voorziening
Doelbinding voorbijgaan
Onbetrouwbaarheid (false positives/false negatives)
Stelling:
“Als je niets te verbergen hebt, heb je niets te vrezen”
is onjuist
7
Mogelijke toepassingen
 Terreurfondsen opsporen
 Opsporen fraude/criminaliteit
 Direct marketing/customisation
 Verzekeringen
▪ In VS nu veel mensen onverzekerd vanwege hoge premies door risico

Medische toepassingen
▪ In IJsland grote DNA database aangelegd

Beleid/strategie bepalen
8
Car breakdown
Pizza delivery
http://www.aclu.org/pizza/
9
Probleem:
 We willen wel positieve aspecten
 Overzicht/inzicht grote hoeveelheden data

Maar geen negatieve aspecten
 Discriminatie, privacy, onbetrouwbaarheden, etc.
Oplossing:
 Bouw reeds vooraf in analysemethode ethische en
juridische regels in
10

In hoeverre kunnen we juridische en ethische regels
integreren in data mining algoritmen om
discriminerende effecten te voorkomen?
 Input kan discriminerende data bevatten
 Output kan discriminerende patronen opleveren

Simpelweg verwijderen gevoelige data is geen
oplossing
11

Analyzing the possibilities to translate laws and
rules into a format understandable for computers
that may be verified

Integrating this formalization in the current stateof-the-art algorithms for discovering models

Providing feedback of the technological possibilities
for concrete recommendations for formalizing
legislation.
12
Bart Custers
Toon Calders
Bart Schermer
Sicco Verwer
Vacature
Universiteit Leiden
TU Eindhoven
Universiteit Leiden
TU Eindhoven
Universiteit Leiden
Duur: 1 oktober 2009 – 1 oktober 2010
13
http://wwwis.win.tue.nl/~tcalders/dadm/doku.php
14





Voorstelronde
Presentatie Bart Custers: onderzoeksvoorstel
Presentatie Toon Calders: building classifiers
Presentatie Bart Schermer: legal requirements
Terugkoppeling en discussie
 Vragen over presentaties
 Rol van het valorisatiepanel
 Discussie

Afsluiting en gezamenlijke lunch
15
Download