Să începem cu o poveste.
Într-o zi un tată intră cu fiica lui la un mare magazin din SUA (numele îmi scapă). Fiecare merge pe culoarul care îl interesează şi face cumpărături. În câteva zile fiica, care era în baza de date, primeşte un pliant cu sfaturi de cumpărături pentru gravide şi tinerele mame. Tatăl este furios (fiica fiind minoră) şi are grijă ca magazinul să afle de furia sa. Peste câteva zile, magazinul primeşte o scrisoare de scuze. Fata chiar era gravidă. Şi nimeni nu ştia. Numai lanţul de magazine a dedus adevărul.
Modul în care algoritmi matematici pot face asemenea speculaţii este prin detectarea unor semnale. Dacă, să zicem, patru produse din şase sunt alese din raft, atunci probabilitatea gravidităţii este de 83.5%. Putem compara algoritmul cu Miss Marple din romanele Agathei Christie, sau orice altă bătrână bârfitoare: punând cap la cap elemente disparate, dar care au mai fost observate în alte ocazii, Miss Marple poate deduce adevăruri invizibile celor din jur.
Există speculaţii, dealtfel, care merg atât de departe încât susţin că principalul scop al Google+ este să rafineze sistemul de semnale al Google. Teoria este probabile exagerată, dar are plauzibilitatea ei. Google Inc. ştie foarte multe despre ce faci, dar foarte puţine despre ce eşti (spre deosebire de Facebook). Google+, chiar dacă eşuează ca reţea socială, permite companiei să aibă o bază cu date reale şi virtuale despre aceleaşi persoane. Analizând baza, se pot găsi semnale care să spună, chiar în lipsa datelor directe. Precum în povestea anterioară, dacă eşti bărbat sau femeie, ce vârstă ai, etc.
Câteva semnale, după cum spuneam, sunt suficiente pentru a pune un om într-o categorie. Câteva zeci de semnale sunt, poate, suficiente pentru a de o identitate unică. Să zicem că aţi descărcat o bibliotecă cu 10 fonturi celebre. Oare câţi în România au exact aceeaşi bibliotecă? Dar oare câţi au aceeaşi bibliotecă şi aceeaşi configuraţie de extensii de browser? La fiecare browser? Browserele oferă surprinzător de multe date despre noi oricărui site pe care îl vizităm. Datele acestea nu spun nimic sau prea putin despre noi ca persoană. Sunt tehnicităţi utile computerelor care dialoghează. Dar, la un moment dat, pot exista secvenţe de dialog unice fiecărui utilizator.
Identitatea unui laptop sau au unui PC mutat în alta locaţie (alt IP) poate fi totuşi problematică. Din „fericire”, această problemă dispare pentru telefoanele mobile şi pentru tabletele cu SIM. Majoritatea fabricanţilor personalizează aceste telefoane printr-un număr IMEI (International Mobile Equipment Identity). Dacă vă schimbaţi sim-ul, faceţi chirugie estetică, locuiţi în SUA fără carnet de conducere şi mergeţi sus în Munţii Stâncoşi pentru a căuta împlinirea spirituală dar nu aruncaţi iPhone-ul, acesta va păstra amintirea identităţii voastre. În ochii algoritmilor de supraveghere, fiecare om este IMEI-ul său.
Notă: tot ce urmează de aici încolo are caracterul unei speculaţii plauzibile. Tehnologiile sunt la îndemână şi accesibile ca preţ, cadrul legal este permisiv. Dar este perfect posibil, ba chiar probabil, ca agenţiile de informaţii să folosească strategii diferite de ce spun eu aici. Tot ce încerc să arăt este cât de departe se poate ajunge cu actualele tehnologii.
Dacă schimbaţi telefonul, ne întoarcem la teoria semnalelor. Fiecare avem, spre exemplu, o rutină spaţială pentru zilele de lucru (acasă, birou, acasă). Această rutină este unică pentru fiecare din noi, în afara cazului în care doi soţi lucrează literalmente în la acelaşi birou. Dacă înlocuiţi un telefon cu GPS cu alt telefon cu GPS, este tehnic posibil să se deducă că cele două IMEIuri aparţin aceleiaşi persoane. De aceea este mai corect să spunem că în ochii algoritmilor suntem o colecţie de IMEIuri sau, şi mai corect, un cluster de ID-uri.
Iar clusterele de IDuri sunt mult mai uşor de urmărit decât oamenii. În sensul clasic, sunt rezonabil de sigur că nici un guvern democratic nu ascultă masiv telefoane. Resursa umană este scumpă, algoritmii de interpretare a vocii discutabili, etc. Să nu mai vorbim de recunoaşterea facială. Limitele supravegherii care are loc în Londra, spre exemplu, sunt date nu de numărul de camere ci de capacitatea umană şi tehnică de a interpreta imaginile. În schimb urma telefoanelor mobile, celebrele metadata, datele anexă convorbirilor, sunt deja digitalizate.
Odată stabilit clusterul, algoritmul poate deduce când posesorul se trezeşte sau când se culcă. Musulmanii ar putea fi clasificaţi ca fiind spirituali (citesc texte religioase), agnostici (consumă entertainment hedonist occidental) sau ipocriţi (fac şi una şi alta). Din deplasări şi achiziţii se poate deduce câştigul şi stilul de consum fără să se obţină acces la conturile bancare. Etc., etc.
În timp între algoritm şi cluster poate apărea o intimitate precum vedem în cărţi sau filme că ar fi între torţionari şi victimele lor. Algoritmul ţi-ar putea spune ce cărţi să cumperi, ce muzică să asculţi sau dacă partenerul de viaţă te înşală. Cu un pic de efort, ar putea fi programat şi să îţi calculeze şansele de a divorţa în următorii cinci ani. Totul punând cap la cap semnale.
Guvernele, însă, au alte priorităţi. Ele caută semnale că ai face ceva rău. De exemplu dacă primeşti telefoane de la IMEI-uri de unică folosinţă. Apoi, probabil, desenează o reţea de relaţii. La început reţeaua este doar o serie de linii. Apoi se pot deduce comportamente. De exemplu, clusterul t83465hg îşi modifică traseul zilnic dacă este sunat de fh985th90f şi manifestă comportament nervos (se învârte prin cameră) înainte să fie vizitat de vfdjs9hf4375ty.
Toate aceste fapte, o descriere a societăţii până la urmă, sunt deduse fără intervenţie umană, ceea ce este nu doar ieftin ci şi elegant din punct de vedere legal. Statul poate spune, fără să mintă, că nici un agent al său nu priveşte în intimitatea cetăţenilor fără mandat. Doar când algoritmii sugerează puternic existenţa unor riscuri sau când apar probe coroborate se trece la urmărirea umană. Într-un sens, monitorizarea anonimizată ar părea compromisul ideal între libertate şi securitate. Doar că…
Doar că datele nu prea se şterg şi, de aici, apar riscuri suplimentare. De exemplu, următorul whistleblower ar putea să divulge date care să poată fi legate de persoane private. Sau guvernul poate decide cu intenţie să le folosească în alt fel. Dacă un Obama, un Băsescu sau un Erdogan întreabă câţi dintr-o lista de posesori de telefoane mobile urmăresc situri porno s-ar putea ca serviciile să se supună şi să afle.
Andrei Tiut