Vem samlar in big data och varför?

Hösten 2019 utbröt en skandal med Apple Card-tjänsten: vid registreringen utfärdade den olika kreditgränser för män och kvinnor. Till och med Steve Wozniak hade tur:

Ett år tidigare avslöjades att Netflix-plattformen visar användarna olika affischer och teasers, beroende på deras kön, ålder och nationalitet. För detta anklagades tjänsten för rasism.

Slutligen blir Mark Zuckerberg regelbundet tillrättavisad för att Facebook påstås ha samlat in, sålt och manipulerat sina användares data. Under årens lopp anklagades han och till och med rättad för manipulation under det amerikanska valet, hjälpte de ryska specialtjänsterna, hetsade till hat och radikala åsikter, olämplig reklam, läckte användardata, hindrade utredningar mot pedofiler.

Facebook-inlägg av zuck

Samtidigt publicerar onlinetjänsten Pornhub årligen rapporter om vilken sorts porr människor av olika nationaliteter, kön och ålder letar efter. Och av någon anledning stör detta ingen. Även om alla dessa berättelser liknar varandra: i var och en av dem har vi att göra med big data, som på XNUMXst århundradet kallas "ny olja".

Vad är big data

Big data – de är också big data (eng. Big Data) eller metadata – är en samling data som kommer in regelbundet och i stora volymer. De samlas in, bearbetas och analyseras, vilket resulterar i tydliga modeller och mönster.

Ett slående exempel är data från Large Hadron Collider, som kommer in kontinuerligt och i stora mängder. Med deras hjälp löser forskare många problem.

Men big data på webben är inte bara statistik för vetenskaplig forskning. De kan användas för att spåra hur användare av olika grupper och nationaliteter beter sig, vad de uppmärksammar och hur de interagerar med innehåll. Ibland, för detta, samlas data inte in från en källa, utan från flera, genom att jämföra och identifiera vissa mönster.

Om hur viktig big data är i nätverket började de prata när det var riktigt mycket av det. I början av 2020 fanns det 4,5 miljarder internetanvändare i världen, varav 3,8 miljarder var registrerade i sociala nätverk.

Vem har tillgång till Big Data

Enligt undersökningar tror mer än hälften av våra länder att deras data på nätverket används av tredje part. Samtidigt lägger många upp personlig information, foton och till och med ett telefonnummer på sociala nätverk och applikationer.

Det måste förklaras här: den första personen är användaren själv, som placerar sina data på valfri resurs eller applikation. Samtidigt samtycker han (sätter en bock i avtalet) till behandlingen av dessa uppgifter andra part – det vill säga resursens ägare. En tredje part är de som resursens ägare kan överföra eller sälja användardata till. Ofta skrivs detta i användaravtalet, men inte alltid.

Den tredje parten är statliga myndigheter, hackare eller företag som köper data för kommersiella ändamål. Den förstnämnda kan få uppgifter genom beslut av domstol eller högre myndighet. Hackare använder naturligtvis inga behörigheter – de hackar helt enkelt databaserna som finns lagrade på servrarna. Företag (enligt lag) kan bara komma åt data om du själv har tillåtit dem – genom att kryssa i rutan under avtalet. Annars är det olagligt.

Varför använder företag Big Data?

Big data inom det kommersiella området har använts i decennier, det var bara inte så intensivt som det är nu. Det är till exempel register från övervakningskameror, data från GPS-navigatorer eller onlinebetalningar. Nu, med utvecklingen av sociala nätverk, onlinetjänster och applikationer, kan allt detta kopplas ihop och få den mest kompletta bilden: var potentiella kunder bor, vad de gillar att titta på, vart de åker på semester och vilket bilmärke de har.

Av exemplen ovan är det tydligt att med hjälp av big data vill företag först och främst rikta in annonser. Det vill säga att erbjuda produkter, tjänster eller individuella alternativ endast till rätt målgrupp och till och med anpassa produkten för en specifik användare. Dessutom blir annonsering på Facebook och andra stora plattformar dyrare och dyrare och att visa det för alla i rad är inte alls lönsamt.

Information om potentiella kunder från öppna källor används aktivt av försäkringsbolag, privata kliniker och arbetsgivare. De förstnämnda kan till exempel ändra försäkringsvillkoren om de ser att du ofta söker information om vissa sjukdomar eller läkemedel och arbetsgivare kan bedöma om du är utsatt för konflikter och asocialt beteende.

Men det finns en annan viktig uppgift som har kämpat på de senaste åren: att komma nära den mest solventa publiken. Detta är inte så lätt att göra, även om uppgiften underlättas avsevärt av betaltjänster och elektroniska kontroller genom en enda OFD (fiscal data operator). För att komma så nära som möjligt försöker företag till och med spåra upp och ”fostra” potentiella kunder från barndomen.: genom onlinespel, interaktiva leksaker och utbildningstjänster.

Hur fungerar det?

De största möjligheterna för datainsamling är från globala företag som äger flera tjänster samtidigt. Facebook har nu mer än 2,5 miljarder aktiva användare. Samtidigt äger företaget även andra tjänster: Instagram – mer än 1 miljard, WhatsApp – mer än 2 miljarder och andra.

Men Google har ännu mer inflytande: Gmail används av 1,5 miljarder människor i världen, ytterligare 2,5 miljarder av Androids mobiloperativsystem, mer än 2 miljarder av YouTube. Och då räknas inte apparna Google Sök och Google Maps, Google Play Butik och webbläsaren Chrome. Det återstår att fästa din nätbank – och Google kommer att kunna veta bokstavligen allt om dig. Yandex är förresten redan ett steg före i detta avseende, men det täcker bara den rysktalande publiken.

👍 Först och främst är företag intresserade av vad vi lägger ut och gillar på sociala nätverk. Om banken till exempel ser att du är gift och aktivt gillar tjejer på Instagram eller Tinder, är det mer sannolikt att du godkänner ett konsumtionslån. Och panten i familjen är borta.

Det är också viktigt vilka annonser du klickar på, hur ofta och med vilket resultat.

(le Nästa steg är privata meddelanden: de innehåller mycket mer information. Meddelanden läckte ut på VKontakte, Facebook, WhatsApp och andra snabbmeddelanden. Enligt dem är det förresten lätt att spåra geolokaliseringen vid tidpunkten för meddelandet. Du har säkert märkt: när du diskuterar att köpa något eller bara beställa pizza med någon, dyker relevant reklam direkt upp i flödet.

🚕 Big data används aktivt och "läcks" av leverans- och taxitjänster. De vet var du bor och arbetar, vad du älskar, vad din ungefärliga inkomst är. Uber, till exempel, visar priset högre om du kör hem från baren och uppenbarligen överdriven. Och när du har ett gäng andra aggregatorer på din telefon, tvärtom, kommer de att erbjuda billigare.

(le Det finns tjänster som använder bilder och videor för att samla in så mycket information som möjligt. Till exempel datorseendebibliotek – Google har ett. De skannar dig och din omgivning för att se vilken storlek eller längd du är, vilka märken du bär, vilken bil du kör, om du har barn eller husdjur.

(le De som tillhandahåller SMS-gateways till banker för sina utskick kan spåra dina köp på kortet – att känna till de fyra sista siffrorna och ett telefonnummer – och sedan sälja denna data till någon annan. Därav all denna spam med rabatter och pizza som present.

🤷️️ Slutligen läcker vi själva våra data till vänster tjänster och applikationer. Kom ihåg den där hajpen kring Getcontact, då alla gärna fyllde i sitt telefonnummer för att få reda på hur det skrevs av andra. Och hitta nu deras avtal och läs vad det står om överföringen av dina data (spoiler: ägarna kan överföra dem till tredje part efter eget gottfinnande):

Företag kan framgångsrikt samla in och till och med sälja användardata i flera år, tills det kommer till en rättegång – som hände med samma Facebook. Och då spelades den avgörande rollen av företagets brott mot GDPR – en lag i EU som begränsar användningen av data mycket strängare än den amerikanska. Ett annat färskt exempel är Avast-antivirusskandalen: en av företagets dotterbolagstjänster samlade in och sålde data från 100 till 400 miljoner användare.

Men har allt detta några fördelar för oss?

Hur stor data hjälper oss alla?

Ja, det finns en ljus sida också.

Big data hjälper till att fånga brottslingar och förhindra terroristattacker, hitta försvunna barn och skydda dem från fara.

Med deras hjälp, vi vi får häftiga erbjudanden från banker och personliga rabatter. Tack vare dem vi vi betalar inte för många tjänster och sociala nätverk som tjänar bara på reklam. Annars skulle bara Instagram kosta oss flera tusen dollar i månaden.

Enbart Facebook har 2,4 miljarder aktiva användare. Samtidigt uppgick deras vinst för 2019 till 18,5 miljarder dollar. Det visar sig att företaget tjänar upp till $7,7 per år från varje användare genom reklam.

Slutligen, ibland är det bara bekvämt: när tjänsterna redan vet var du är och vad du vill ha, och du inte behöver leta efter den information du behöver själv.

Ett annat lovande område för tillämpningen av Big Data är utbildning.

På ett av de amerikanska universiteten i Virginia genomfördes en studie för att samla in data om studenter i den så kallade riskgruppen. Det är de som studerar dåligt, missar lektioner och är på väg att hoppa av. Faktum är att i delstaterna varje år dras cirka 400 personer av. Det är dåligt både för universiteten, som får sänkta betyg och minskade anslag, och för studenterna själva: många tar lån för utbildning, som efter avdrag fortfarande måste betalas tillbaka. För att inte tala om förlorad tid och karriärmöjligheter. Med hjälp av big data är det möjligt att identifiera de som släpar efter i tid och erbjuda dem en handledare, ytterligare klasser och annan riktad assistans.

Detta är förresten också lämpligt för skolor: då kommer systemet att meddela lärare och föräldrar – de säger, barnet har problem, låt oss hjälpa honom tillsammans. Big Data hjälper dig också att förstå vilka läroböcker som fungerar bättre och vilka lärare som lättare förklarar materialet.

Ett annat positivt exempel är karriärprofilering.: det är när tonåringar får hjälp att bestämma sig för sitt framtida yrke. Här låter big data dig samla in information som inte kan erhållas med traditionella tester: hur användaren beter sig, vad han uppmärksammar, hur han interagerar med innehållet.

I samma USA finns ett karriärvägledningsprogram – SC ACCELERATE. Den använder bland annat CareerChoice GPS-teknik: de analyserar data om elevernas natur, deras böjelser för ämnen, styrkor och svagheter. Uppgifterna används sedan för att hjälpa tonåringar att välja rätt högskolor för dem.

Prenumerera och följ oss på Yandex.Zen — teknik, innovation, ekonomi, utbildning och delning i en kanal.

Kommentera uppropet