WiFi-tracking
HVAD
WiFi-tracking gør det muligt, at følge og registrere enheder, som fx smartphones og computere, på et trådløst lokalnetværk (WiFi). Herved kan der opnås faktuel viden om folks færden i fysiske rammer, såvel som deres digitale færden. Denne viden kan bruges til at supplere mavefornemmelser og antropologiske metoder.
Opsamling af data om enheders bevægelser kan give et kvantitativt indblik i hvor brugerne er - og hvornår. Dette kan være med til at tegne et billede af hvordan et hus som Dokk1 bruges.
Ved brug af visual analytics[1] kan der udledes mønstre og sammenhænge i den indsamlede data. Hvis disse ”big data” fra sensorer kombineres med kvalitative studier kan der opnås ”thick data” – altså data med tyngde i, som du faktisk kan bruge til beslutningsstøtte[2].
HVORDAN
Med hjælp fra Alexandra Instituttets IoT-platform[3] foretog vi anonym WiFi-tracking under konferencen Next Library 2017[4]. Der blev skiltet med trackingen ved indgangene:
Vi opsatte 29 Raspberry Pi[5] mini-computere, der skulle benyttes som sensorer til registrering af WiFi-enheder. Sensorerne blev placeret, så de dækkede biblioteksarealerne i Dokk1 bedst muligt:
Den tekniske løsning
Vi benyttede "proximity based” eller afstandsbaseret positionering. Her baseres beregningen af de enkelte enheders position på afstanden mellem sensor og enhed. Forenklet kan man sige, at hver sensor hele tiden måler afstanden til alle de enheder, den kan opfange, hvorefter systemet vælger den nærmeste sensor til at repræsentere enhedens position.
Afstanden mellem sensor og enhed beregnes på baggrund af signalstyrken fra enhederne (fx smartphones, laptops og tablets). Den enkelte sensor måler den såkaldte RSSI-værdi (RSSI = Received Signal Strength Indicator) for hver enkelt enhed, som sensoren kan opfange, og bruger denne værdi som udtryk for afstanden.
Fordelen ved denne type afstandsbaseret positionering er, at den er særdeles robust og ikke stiller krav til selve tracking-infrastrukturen. Ulempen er, at den ikke er voldsomt nøjagtig. Man kan opnå betydeligt højere nøjagtighed, hvis man benytter sig af mere avancerede positioneringsmetoder, som tager sensorernes position med i beregningerne og evt. tager højde for de fysiske omgivelser, så som døre, vægge, bygningsmaterialer osv.
Ground Truth-observationer
Placeringen af de 29 Raspberry Pi-computere, samt materialiteten i rummene er afgørende for de signaler, computerne opfanger. Nogle materialer absorberer signaler, mens andre reflekterer signaler. For at sikre brugbare data havde vi behov for at kalibrere systemet.
Dette valgte vi at gøre vha. Ground Truth-observationer, hvor vi foretog manuelle kontroltællinger i samtlige områder med Raspberry Pi-computere. Kontroltællingerne blev foretaget i et begrænset tidsrum for hvert område (10 minutter); her talte en person hvor mange personer, der befandt sig i området ved tællingens start, og derudover noterede vedkommende hvor mange personer, der henholdsvis forlod området og entrerede området.
Disse data blev registreret vha. af en klikker og noteret i et skema:
De indsamlede data blev sendt til Alexandra Instituttet, som brugte tallene til at kalibrere den bagvedliggende IoT-platform, således at enheder i et specifikt område såvidt muligt blev knyttet til computeren i det område, og ikke en computer placeret i et tilstødende område (fx ovenfor/nedenunder/ved siden af).
Visualisering af tracking i real-tid
Efter kalibrering kunne WiFi-trackingen tages i brug. Under Next Library 2017-Festival 11 - 14 juni 2017 opstillede vi to touch-skærme i et åbent område for deltagerne. På skærmene kunne konferencedeltagerne danne sig overblik de WiFi-enheder, der blev tracket under eksperimentet: Den ene skærm viste i realtid et søjlediagram med antallet af trackede enheder fordelt på Dokk1s publikumsområder. Den anden skærm viste WiFi-enhedernes placering på grundplanskort for Dokk1s to etager.
Vha. skærmene kunne konferencedeltagere danne sig et indtryk af hvor der her og nu var flest - eller færrest - enheder på Dokk1s WiFi:
Visualisering af WiFi-tracking under Next Library
Her kan du se en timelapseoptagelse af WiFi-trackingen under Next Library 2017 vist på et kort:
Om Bluetooth-tracking
Ud over den anonyme WiFi-tracking benyttede vi også de 29 Raspberry Pi-computere til at spore unikke bluetooth-sendere/tags (iBeacons[6]).
250 af deltagerne til Next Library 2017 havde givet skriftligt samtykke ved registrering til festivalen om at de ville deltage i et tracking-eksperiment: Deltagerne fik udleveret et unikt beacon, som var koblet til deres navn. De bar det unikke Bluetooth-beacon i en nøglesnor sammen med deres navneskilt under festivalen.
Bluetooth-tracking adskiller sig fra WiFi-tracking ved bl.a. at være mere præcis – da de enkelte beacons udsender deres signaler meget hyppigere end WiFi og det samtidigt er lettere at afgøre, hvor langt en given beacon er fra en sensor. Dog skal det bemærkes, at deltagerne havde mulighed for at slukke og tænde deres unikke beacon, hvis de ønskede at undgå tracking i en periode.
Visualisering af Bluetooth-tracking
Under festivalen brugte vi realtidsdata fra bluetooth-trackingen til at vise, hvor festivaldeltagere befandt på Dokk1. Herved kunne deltagerne finde hinandens position (og deres egen) på et kort, hvilket var praktisk anvendeligt, da Dokk1 er et stort hus. Samtidig lagde synliggørelsen også op til samtaler og diskussioner omkring overvågning, dataansvar og privatliv. Mere om dette i afsnittet om dataansvar.
Alle trackingdata fra festivalen blev gemt i en database, så de kan analyseres yderligere og fungere som beslutningsstøtte ifm. ledelsesbeslutninger og planlægning af kommende husevents i Dokk1.
Læs mere om Bluetooth-tracking.
Alternativ tracking-løsning: Cisco CMX
På Dokk1 benyttes 220 access points fra Cisco til at skabe WiFi-netværket. Cisco har udviklet et værktøj til WiFi-tracking, som hedder CMX. I sensommeren 2017 fik vi lejlighed til at prøve en 3 måneders testversion. WiFi-tracking med Cisco CMX adskiller sig fra den tracking, vi foretog med hjælp fra Alexandra Instituttet, idet Ciscos løsning tager sensorernes position med i beregningerne. Cisco CMX angiver altså hvor enheden befinder sig, når den befinder sig mellem flere sensorer (Dog med en vis usikkerhedsmargin. Læs mere om nøjagtighed af positionering i afsnittet "Nøjagtighed af positionering: Prober m.m." nedenfor).
CMX-systemet ligner til forveksling en hyldevare, idet man som bruger mødes af et relativt letforståeligt interface, der ud over realtidsoverblik over trackingen, også kan levere rapporter i pdf-format til udvalgte emailadresser med et specificeret tidsrum. På den måde, er det let at overskue hvad der trackes; både her og nu, men også om der er tendenser over tid indenfor udvalgte områder.
Vores erfaringer med CMX er baseret på en relativt kort testperiode, samt et system, der ikke er kalibreret, men brugt som det er.
VORES ERFARING/LÆRING:
Stabilitet VS nøjagtighed
Vores erfaring med WiFi-tracking er baseret på to versioner af afstandsbaseret positionerings-teknologi. Begge løsninger viste sig at være robuste, men ikke voldsomt nøjagtige. Versionen fra Alexandra Instituttet viste ikke hvor enheder befandt sig, men derimod hvilken sensor enhederne befandt sig tættest på. Cisco CMX forsøger derimod at angive hvor enheden befinder sig - dog med en vis usikkerhedsmargin (se afsnittet "Nøjagtighed af positionering: Prober m.m." nedenfor).
Det er muligt, at øge præcisionen en smule ved at kalibrere systemerne yderligere - særligt versionen fra Cisco. Men WiFi-tracking kan ikke levere den præcision, vi kender det fra GPS-positionering. (Mere herom i afsnittet "Nøjagtighed af positionering: Prober m.m.").
Vi oplevede en del "støj" fra enheder, som pga. af deres position blev opfanget af vores sensorer, selv om de eksempelvis befandt sig udenfor, ovenfor eller nedenfor det område, som sensoren dækkede. Teknologien bag de systemer, vi testede, er baseret på signalstyrke. Derfor positioneres en enhed tættest på den sensor, der opfanger den kraftigste signalstyrke fra enheden - også selv om der eksempelvis er en etage imellem sensoren og enheden. Eller selv om enheden befinder sig i en bil i bevægelse, eller i lommen på en cyklist, der passerer forbi.
Hvis systemet kan kalibreres, så "støj" fra forbipasserende kan filtreres fra, kan datakvaliteten muligvis øges.
I mere avancerede systemer, er det også muligt, at tage højde for de fysiske omgivelser, så som døre, vægge, bygningsmaterialer m.m. Herved kan positioneringen af enheder blive endnu mere præcis.
For mere info om datavalidering, se afsnittet Fra data til viden under Anbefalinger.
Bluetooth VS WiFi
Vi oplevede større stabilitet og præcision ved tracking af unikke Bluetooth beacons frem for WiFi-tracking. Dette skyldes, at beacons udsender signaler meget hyppigere end WiFi. Derfor er det lettere at afgøre hvor langt en given beacon er fra en sensor.
Til gengæld kræver tracking af unikke Bluetooth-beacons, at brugerne giver deres samtykke til at lade sig overvåge, samt at de bærer et fysisk beacon med sig rundt. Dette rejser også spørgsmål om, hvorvidt brugerne agerer upåvirket, når de ved de bliver overvåget – og dermed om data fra denne type tracking kan repræsentere brugernes naturlige færden og brug af et hus som Dokk1.
Det er muligt, at spore bluetooth-signaler fra brugernes smartphones og computere, men ofte er disse ikke tændt hele tiden. Dette rejser i så fald spørgsmålet om hvorvidt disse data er repræsentative.
Mindsket datagrundlag pga. Mac-spoofing
Vores forsøg med WiFi-tracking viste, at 30% af alle de registrerede enheder spoofer deres mac-adresse. Dvs. at 30% af de enheder, vi registrerede på vores WiFi, løbende skiftede deres ID. Derfor kunne vi ikke spore dem over tid, da en enhed på et tidspunkt vil have ét ID og senere et andet ID.
Denne funktion ses oftere og oftere på nye enheder for at beskytte brugernes privatliv (privacy). Antallet af enheder, der ikke kan genkendes, vil derfor stige i fremtiden.
Dette gør det svært, at følge brugeres færden fra sted til sted. Øget mac-spoofing betyder også, at antallet af unikke besøgende enheder vil se ud til at stige, og antallet af gentagne besøgende enheder vil falde.
Man kan vælge, at filtrere enheder fra, der spoofer deres MAC-adresse - men herved mindskes datagrundlaget, og det påvirker dataenes repræsentativitet.
WiFi vs GSM: Hvordan tilgår vi internettet i fremtiden?
Det er værd at bemærke, at brugen af WiFi i offentlige rum ændres i takt med udbredelsen af teleselskabernes hurtige GSM-signaler (4G/5G). Det er ikke længere nødvendigt, at koble en enhed på WiFi for at opnå god forbindelse til internettet.
Dette kan betyde, at færre enheder vil benytte WiFi, og dermed også, at datagrundlaget for WiFi-tracking mindskes.
Forholdet mellem antallet af enheder og antallet af mennesker
Ved WiFi-tracking registreres antallet af enheder, som forbinder eller befinder sig i nærheden af de access points, der benyttes til WiFi-netværket. Det er således ikke antallet af personer, der registreres, men derimod antallet af enheder.
Nogle mennesker, fx små børn, har ikke enheder. Andre kan derimod have mere end en enhed; fx både en computer og en smartphone.
Der er altså et ukendt forhold mellem antallet af personer i et område og antallet af enheder i området. Det specifikke forhold er svært at angive nøjagtigt, da det afhænger af området og de mennesker, der benytter det. I et folkebibliotek vil forholdet mellem antallet af enheder og antallet af besøgende muligvis være anderledes end på et universitet eller i en børnehave.
Vores erfaringer tyder på, at forholdet mellem antallet af borgere og antallet af enheder for Dokk1 i 2017 ligger på 70-80%. Dvs. at per 100 besøgende, kan vi registrere mellem 70-80 enheder.
Usikkerheder: Opdateringshastighed
I alle enheder sidder en radio, som enheden benytter, når den skal kommunikere med netværk, så som WiFi. Opdateringsfrekvensen for radioerne afhænger af enhedens status; er enheden tilsluttet et WiFi-netværk? Søger enheden efter et netværk? Eller ligger enheden i dvale - fx i en lomme eller taske?
Hvis enheden er tilsluttet et netværk, eller hvis den forsøger at tilslutte et netværk, opdaterer den oftere end hvis den ligger i dvale.
Dertil kommer at hvert operativsystem (iOS, Android, Windows, OSX, Linux m.m.) har sine unikke indstillinger for hvor ofte enheders radioer skal kommunikere.
Enhedernes synlighed på netværket afhænger altså af deres opdateringshastighed. Og opdateringshastigheden skifter afhængig af hvilken enhed, der er tale om, og hvad dens status er.
Nøjagtighed af positionering: Prober m.m.
Enheder, der er tilsluttet et WiFi-netværk, kommunikerer løbende med netværket, og vil derfor kunne positioneres nogenlunde præcist. Derimod vil enheder, der ikke er tilsluttet netværket eller befinder sig i dvale, registreres mere sjældent. Enheder, der ikke er aktive eller tilsluttet et WiFi-netværk udsender med jævne mellemrum såkaldte prober. Disse signaler forekommer ca. hvert andet minut (Dette afhænger igen af hvilken enhed, der er tale om, samt hvilket operativsystem, den bruger).
Det betyder at tracking af enheder, der ikke er tilsluttet netværket eller som er i dvale, vil blive registreret ca. hvert andet minut. Dette resulterer i huller i datasættene. En enheds position kan fx bestemmes, når proben sendes ud, men umiddelbart kan man ikke se hvor enheden har befundet sig siden sidste probe for to minutter siden.
Et netværk med mange tilsluttede enheder vil derfor give et mere nuanceret billede af enhedernes position og bevægelser end et netværk med få tilsluttede enheder.
Dertil kommer, at en enhed skal være i nogenlunde ro, for at blive registreret på en given lokation. Enheder i bevægelse er svære at positionere. Det er først, når de er i ro i en kortere periode, at deres position kan fastslås nogenlunde nøjagtigt.
Vi har erfaret, at kalibreret og optimeret WiFi-tracking med et system som Cisco CMX, kan angive positionering af enheder med op til 5 m. nøjagtighed. Dette er langt fra den præcision, vi kender fra udendørs satellitbaseret GPS-navigation. WiFi-tracking vil således resultere i en tilnærmet position, snarere end en eksakt position. Det skal bemærkes, at positioneringens usikkerhed på 5 m. gælder i 3 dimensioner, dvs. der er 5 meters usikkerhed i alle retninger (op/ned/højre/venstre).
Hvordan læses resultater af WiFi-tracking?
De ovenstående erfaringer understreger, at data fra WiFi-tracking ikke kan aflæses som absolutte værdier - hverken i dag eller i fremtiden. Man kan derimod læse værdierne relativt - som tendenser. Altså: Hvordan udvikler de registrerede data sig?
Derudover skal man være opmærksom på, at antallet af enheder i et område er ikke ensbetydende med, at der befinder sig et tilsvarende antal personer i området. Så hvis man ønsker en repræsentativ registrering af antallet af mennesker, er WiFi-tracking ikke den bedst egnede løsning.
Dataansvar
Ved WiFi-tracking er der særlige udfordringer i forhold til dataindsamling og -opbevaring i forhold til persondataloven og den kommende Persondataforordning, som er gældende fra maj 2018.
Man skal bl.a. sikre anonymisering af data oplysning af borgere og medarbejdere, som bruger rum med WiFi-sporing. Læs mere om Dataansvar her.
OMKOSTNINGER
Projektet indgik samarbejde med Jakob Langdal Jensen fra Alexandra Instituttet om test af hybride sensorer i Dokk1.
Der var omkostninger til materialer (indkøb af Raspberry Pi) samt programmering og analyse af data. Desuden havde vi interne personaleomkostninger til planlægning, opsætning af sensorer (nogle steder i 6½ meters højde), teknisk test og genstart, udskiftning af defekte SD-kort i ca. 10 sensorer, manuelle "ground truth" tællinger i 29 zoner samt opsamling og vurdering af analyser.
Man kan også trække data af wifi brug i bygningens wifi access points. I Dokk1 er Cisco leverandør. Cisco sælger licens til et CMX system.
POTENTIALE
Vi vurderer, at anonym WiFi-tracking uden samtykke vil blive mindre relevant i fremtiden, da færre enheder vil kunne registreres pga. Mac-spoofing. Dertil kommer, at behovet for at tilgå WiFi-netværk ændres i takt med at flere brugere har adgang til hurtige internetforbindelser via deres teleudbydere (GSM).
Der er stort fokus på privatliv og den nye Persondataforordning anno 2018 gør det sværere end hidtil at arbejde med personhenførbare og personfølsomme data.
[1] https://en.wikipedia.org/wiki/Visual_analytics
[2] https://alexandra.dk/dk/aktuelt/nyheder/2017/facts-om-folks-f-rden-designer-fremtidens-bibliotek
[3] Internet of Things: https://en.wikipedia.org/wiki/Internet_of_things
[4] Konferencen fandt sted 11.-14. juni 2017. Læs mere om Next Library: http://www.library.net
Jakob Langdal explaining the experiment - More about the experiment
[5] https://www.raspberrypi.org/
[6] Også kaldet iBeacons:
[7] https://en.wikipedia.org/wiki/MAC_spoofing
Revideret 30. august 2017 / Mads Lykke, Digital Redaktør, madly@aarhus.dk