Big Data, zbieranie i analizowanie gigantycznej ilości danych, budzi wiele emocji. Firmy i instytucje widzą w Big Data szanse na podniesienie konkurencyjności i zwiększenie zysków, zaś obywatele cyfrowego świata niepokoją się o swoją prywatność. „Nie należy się bać technologii, tylko trzeba ją poznać” – mówi Kuba Piwowar, analityk w Google, który w wywiadzie dla Strefy Zarządzania tłumaczy, jak nie dać się zwieść medialnemu „mrocznemu” obrazowi Big Data.
Ewa PlutaPorozmawiajmy o mrocznej stronie Big Data.
Kuba PiwowarNie chciałbym poprzez tę rozmowę wpisywać się w aktualny trend, który polega na demonizowaniu Big Data. Ta kwestia jest o wiele bardziej skomplikowana, i mocno zniuansowana. Dane na nasz temat zbieramy stosunkowo od dawna i podstawowy cel, dla którego to robimy, jest lepsze poznanie i opisanie tego, jak funkcjonujemy, jakie tworzymy relacje, jak reagujemy na rzeczywistość, co myślimy i czego potrzebujemy. Jeśli lepiej będziemy siebie rozumieć, to łatwiej przychodzić nam będzie niesienie sobie pomocy.
Jednocześnie, oczywiste zagrożenia związane z przetwarzaniem wielkich zbiorów danych należy rozpatrywać z dwóch stron. Z jednej strony, jako użytkownicy internetu, mamy świadomość, że dane na nasz temat są zbierane, ale nie wiemy, w jaki sposób różne instytucje później je wykorzystują. Z drugiej, zdarzyć się może, że nie zdajemy sobie sprawy, że jakiekolwiek dane o nas w ogóle zostały zebrane.
Odwiedzamy strony internetowe, zaznaczamy zgody dotyczące przetwarzania danych, udostępniamy adresy mailowe, bierzemy udział w konkursach i szukamy odpowiedzi na przykład na pytanie, jaką pizzą dziś jesteśmy. To, bez cienia ironii, cenne informacje dla firm, które te dane zbierają. Potem są one wykorzystywane na wiele sposobów: umożliwiają tworzenie profili klientów, segmentację oraz korelowanie ich zachowań na podstawie danych z wielu źródeł. Dzięki Big Data firmy coraz lepiej diagnozują potrzeby swoich klientów, a reklamodawcy są skuteczniejsi w komunikowaniu produktów i usług. Za możliwość korzystania z części z nich bez opłat wnosimy daninę w postaci informacji o tym, kim jesteśmy i jak się zachowujemy oraz co kupujemy. Dobrze dopasowane do naszych potrzeb produkty i usługi zwyczajnie lepiej się sprzedają, gdyż odpowiadają na to, co aktualnie zajmuje nam czas i uwagę.
Ewa PlutaZgadzamy się na to. Często jednak trudno dotrzeć do informacji na temat dalszych losów danych, które zostawiamy w sieci.
Kuba PiwowarTo, że nie wiemy, w jakim celu są zbierane i przetwarzane nasze dane, niekoniecznie wynika z tego, że firma chce zataić ten fakt. Raczej to my nie chcemy, żeby kontakt ze światem cyfrowym był zapośredniczony przez setki stron umów, które być może powinniśmy czytać. Szybko odhaczamy okienka i przechodzimy do serwisu internetowego. Oczywiście podstawą takiej relacji jest zaufanie: użytkownicy i użytkowniczki internetu ufają, że ich dane przetwarzane są w sposób niezagrażający im, ale ułatwiający kontakt z odwiedzaną stroną lub używaną aplikacją.
Big Data jest jednak potrzebne i wartościowe. Sprawia, że internet czy aplikacje stają się coraz lepiej dopasowane do naszych potrzeb, rozwijane są badania naukowe i trwa postęp, na przykład w medycynie. Myślę tu na przykład o aplikacjach, które zbierają dane na temat zdrowia czy wspierające trening. Aplikacja współpracuje z pulsometrem i umożliwia rejestrację tętna, do którego użytkownik lub użytkowniczka może dostosować tempo biegu.
I znowu, to pozytywne z założenia zjawisko, mające na celu usprawnienie naszych treningów, może rodzić pytania o wrażliwe przecież dane, czyli dotyczące naszego zdrowia. Wiele z nich udostępniamy firmie, o której niespecjalnie dużo wiemy, a która może je wykorzystać nie tylko do stworzenia naszego profilu biegacza, ale też w celach reklamowo-sprzedażowych. Może też szybko wyciągnąć daleko idące wnioski z naszej aktywności. Jeśli często biegamy, prawdopodobnie zostaniemy wrzuceni do segmentu zapalonych biegaczy, do których będą kierowane reklamy droższych akcesoriów sportowych, bo jesteśmy skłonni wydać na nie więcej. Jeśli biegamy rzadziej, dostaniemy ofertę tańszych produktów lub w ogóle nie będziemy jej widzieć.
Przeczytaj także: „To ja, robot”. Wyzwania i zagrożenia sztucznej inteligencji
Ewa PlutaNa ile firmy korzystające z Big Data ingerują w nasze wybory? Dzięki Big Data można rozpoznać nie tylko aktualne potrzeby konsumentów, lecz także przewidzieć przyszłe.
Kuba PiwowarTo jest szerokie pytanie, które dotyczy nie tylko Big Data, lecz marketingu w ogóle. Zapytano kiedyś Henry’ego Forda o źródło sukcesu modelu samochodu Ford T. Odpowiedział: „Nie korzystaliśmy z badań marketingowych – gdybyśmy zapytali klientów, czego potrzebują, to powiedzieliby, że szybszego konia, ponieważ nie wiedzieli, czym właściwie jest samochód”.
Słuszna wydaje mi się idea zbierania i przetwarzania danych po to, by coraz lepiej poznać człowieka, zrozumieć jego motywacje i zachowania. Może gdy będzie potrzebował pomocy, zostanie ona szybko i efektywnie zaoferowana? Najnowsze modele Apple Watch reagują w sytuacji niekontrolowanego upadku (dzięki wbudowanemu w nie akcelerometrowi) i – przy braku reakcji z naszej strony – wysyłają monit do pogotowia. Jeśli jednak pyta mnie pani, jaka część dużych zbiorów danych jest wykorzystywana nieetycznie, to nie potrafię udzielić jednoznacznej odpowiedzi. Mogę się jednak odwołać do badania opublikowanego przez portal Stack Overflow, skupiający deweloperów z całego świata. Zapytano ich o etykę zawodu deweloperskiego, a konkretnie, czy byliby w stanie napisać nieetyczny kod. Czyli taki, który umożliwia wyłudzenie pieniędzy czy wyrządzenie krzywdy drugiej osobie. 5 proc. odpowiedziało, że tak. W środowisku zajmującym się Big Data jest wręcz odwrotne dążenie, mianowicie, by wprowadzić uniwersalny kodeks dobrych praktyk w pracy na dużych zbiorach danych, a przynajmniej uświadamiać i edukować takie osoby o ciążącej na nich odpowiedzialności. Decyzje podejmowane na podstawie analizy danych, to nie żadna abstrakcja, one dotyczą konkretnych ludzi i wpływają na ich losy.
Ewa PlutaCzyli zbiory danych nie są moralnie neutralne?
Kuba PiwowarNie istnieją moralnie neutralne dane. Dane zawsze są zbierane i przetwarzane w określonym celu. Dopiero sposób ich wykorzystania oraz jego konsekwencje można oceniać w kategoriach moralnych. Możemy być przekonani, że przygotowaliśmy świetny produkt, np. aplikację służącą do skanowania i rozpoznawania twarzy, która sprawdza się w systemach monitoringu. Dzięki niej mieszka nam się bezpieczniej. Ale, jak wynika z ostatnich badań, aplikacja ta gorzej radzi sobie z rozpoznawaniem twarzy osób o ciemnym kolorze skóry, zwłaszcza kobiet. I to może rodzić poważne obawy dotyczące skuteczności i aplikacyjności takich systemów. Z jednej strony może doprowadzić to do sytuacji, w której – ze względu na kolor skóry – zostanie do nas dopasowana usługa, która nie jest nam potrzebna lub uznani zostaniemy za kogoś innego niż jesteśmy. Z drugiej strony, udowodniono istnienie uprzedzeń w algorytmach rozpoznających twarz, które faworyzują osoby o jaśniejszym kolorze skóry, a dyskryminują osoby o ciemnej karnacji.
Pamiętajmy, że Big Data jest tylko narzędziem. Rozmowa o zagrożeniach z nim związanych powinna raczej dotyczyć ludzi i instytucji, którzy dzięki dużym zbiorom danych chcą zrealizować nieetyczne cele, i po to umyślnie je zatruwają lub wykorzystują do zdobycia konkretnych korzyści.
Ewa PlutaUżytkownicy i użytkowniczki często obwiniają jednak „złą technologię”.
Kuba PiwowarNieufność względem Big Data w dużym stopniu bierze się z niewiedzy na temat sposobu, w jaki nasze dane są wykorzystywane. Kilka lat temu w USA przeprowadzono badanie, w którym zapytano uczestników, czy wiedzą, w jakim celu zbierane są ich dane. Część z nich uznała, że dane zbierane na ich temat nie wykraczają poza podstawowe cechy demograficzne, a na ich podstawie dokonywane są pewne dalsze założenia (że na przykład reklamę kleju do protez skieruje się do osób starszych). Pozostali domyślali się, że dane są zbierane i grupowane oraz że służą do tworzenia profili klientów na podstawie ich aktywności w sieci. Niewiedza sprawia, że jesteśmy przesadnie podejrzliwi wobec technologii. Lepiej zachować wobec niej zdrowy krytycyzm. Zdobycze technologii są często efektem ciężkiej pracy, która popycha naszą cywilizację do przodu i pomaga rozwiązywać palące aktualnie problemy. Nie należy jednak zapominać o tym, że część z tych osiągnięć służy po prostu zbijaniu kapitału, a oferowane nam przełomowe osiągnięcia bywają co najwyżej marketingową mrzonką. Warto interesować się rozwojem technologii, mądrze ją wykorzystując do ułatwiania sobie życia i urozmaicania go, ale z pełną świadomością kosztów.
Big Data jest tylko narzędziem. Rozmowa o zagrożeniach z nim związanych powinna raczej dotyczyć ludzi i instytucji, którzy dzięki dużym zbiorom danych chcą zrealizować nieetyczne cele, i po to umyślnie je zatruwają lub wykorzystują do zdobycia konkretnych korzyści.
Ewa PlutaCzy zatem na siłę doszukujemy się zagrożeń związanych z Big Data? Czy należy się bać?
Kuba PiwowarParafrazując krążący ostatnio w internecie mem: nie należy się bać technologii, tylko trzeba ją poznać. Jak do każdej nowości technologicznej, tak i do Big Data powinniśmy podchodzić z ostrożnym entuzjazmem. Gdybym miał tworzyć zalecenia, to powiedziałbym, że warto starać się zrozumieć, dlaczego dana technologia powstała, jakie korzyści niesie ze sobą i kto z nich czerpie.
Ekspert
Kuba Piwowar
Kulturoznawca, socjolog. Ekspert z zakresu społecznych i kulturowych aspektów rozwoju technologii, Big Data, etyki i analizy danych. W obszarze jego zainteresowań znajduje się też sposób, w jaki algorytmy regulują nasze odbieranie kultury, relacje międzyludzkie, wybory konsumenckie i polityczne.