IBM heeft zonder toestemming van de gefotografeerden een miljoen foto's van fotosite Flickr gebruikt om kunstmatige intelligentie op gezichtsherkenning te trainen, ontdekte nieuwszender NBC. De daaruit voortvloeiende data biedt het Amerikaanse technologiebedrijf aan voor ander onderzoek.
Yahoo, de eigenaar van Flickr, bood in 2014 een pakket van 100 miljoen foto's aan voor onderzoekers. Er zijn veel van dergelijke datasets in de omloop; ze worden veel gebruikt voor onderzoek naar gezichtsherkenning. De gefotografeerden worden lang niet altijd om toestemming gevraagd.
IBM zou de foto's met duidelijke gezichten uit dat aanbod hebben gehaald, zo'n miljoen. Aan die foto's werden bijna tweehonderd mogelijke eigenschappen toegekend, waaronder huidskleur, leeftijd en geslacht.
NBC benaderde verschillende mensen die in de fotodatabase voorkomen. Sommige waren "geschokt en ontdaan" dat hun foto's op deze manier werden gebruikt.
Mensen die in de dataset zitten, kunnen IBM vragen om hun foto's uit het aanbod te verwijderen. IBM maakt het echter niet mogelijk om in te zien óf je in de dataset zit; NBC heeft daarvoor een tool gemaakt.
Diverse gezichten
Foto's die openbaar op Flickr worden geplaatst, vallen onder een Creative Commons-licentie. Sommige versies van deze licentie geven brede toestemming om de foto's te gebruiken.
De fotodata biedt het bedrijf nu aan als onderdeel van de dataset Diversity in Faces. Volgens IBM is de dataset bedoeld om gezichtsherkenningssystemen 'eerlijker' te maken, door netwerken te trainen op meer diverse gezichten.
Eerder deze maand publiceerde Georgia Tech onderzoek waaruit bleek dat zelfrijdende auto's mensen met een zwarte huidskleur minder goed herkennen. Privacywaakhonden maken zich zorgen dat de technologie ook misbruikt kan worden door de politie, bijvoorbeeld voor etnisch profileren.