Sino ang nangongolekta ng malaking data at bakit?

Noong taglagas ng 2019, isang iskandalo ang sumiklab sa serbisyo ng Apple Card: kapag nagparehistro, naglabas ito ng iba't ibang mga limitasyon sa kredito para sa mga kalalakihan at kababaihan. Kahit si Steve Wozniak ay wala sa swerte:

Isang taon bago nito, ipinahayag na ang Netflix platform ay nagpapakita sa mga user ng iba't ibang poster at teaser, depende sa kanilang kasarian, edad at nasyonalidad. Para dito, ang serbisyo ay inakusahan ng rasismo.

Sa wakas, si Mark Zuckerberg ay regular na pinapagalitan dahil sa diumano'y pagkolekta, pagbebenta at pagmamanipula ng data ng mga gumagamit nito sa pamamagitan ng Facebook. Sa paglipas ng mga taon, siya ay inakusahan at kahit na sinubukan para sa pagmamanipula sa panahon ng halalan sa Amerika, pagtulong sa mga espesyal na serbisyo ng Russia, pag-uudyok ng poot at radikal na pananaw, hindi naaangkop na advertising, pagtagas ng data ng gumagamit, humahadlang sa mga pagsisiyasat laban sa mga pedophile.

Facebook post ni zuck

Kasabay nito, taunang inilalathala ng online na serbisyo ng Pornhub ang mga ulat sa kung anong uri ng porno na mga tao na may iba't ibang nasyonalidad, kasarian at edad ang hinahanap. At sa ilang kadahilanan hindi ito nakakaabala sa sinuman. Kahit na ang lahat ng mga kuwentong ito ay magkatulad: sa bawat isa sa kanila ay nakikitungo tayo sa malaking data, na sa ika-XNUMX siglo ay tinatawag na "bagong langis".

Ano ang malaking data

Big data – ang mga ito ay malaking data din (eng. Big Data) o metadata – ay isang hanay ng data na dumarating nang regular at sa malalaking volume. Kinokolekta, pinoproseso at sinusuri ang mga ito, na nagreresulta sa malinaw na mga modelo at pattern.

Ang isang kapansin-pansing halimbawa ay ang data mula sa Large Hadron Collider, na dumarating nang tuluy-tuloy at sa malalaking dami. Sa kanilang tulong, nalulutas ng mga siyentipiko ang maraming problema.

Ngunit ang malaking data sa web ay hindi lamang mga istatistika para sa siyentipikong pananaliksik. Magagamit ang mga ito upang subaybayan kung paano kumikilos ang mga user ng iba't ibang grupo at nasyonalidad, kung ano ang kanilang binibigyang pansin at kung paano sila nakikipag-ugnayan sa nilalaman. Minsan, para dito, ang data ay kinokolekta hindi mula sa isang pinagmulan, ngunit mula sa ilan, paghahambing at pagtukoy ng ilang mga pattern.

Tungkol sa kung gaano kahalaga ang malaking data sa network, nagsimula silang mag-usap noong talagang marami ito. Sa simula ng 2020, mayroong 4,5 bilyong gumagamit ng Internet sa mundo, kung saan 3,8 bilyon ang nakarehistro sa mga social network.

Sino ang may access sa Big Data

Ayon sa mga survey, higit sa kalahati ng ating mga bansa ang naniniwala na ang kanilang data sa network ay ginagamit ng mga third party. Kasabay nito, marami ang nagpo-post ng personal na impormasyon, mga larawan, at kahit isang numero ng telepono sa mga social network at application.

Sino ang nangongolekta ng malaking data at bakit?
Sino ang nangongolekta ng malaking data at bakit?
Sino ang nangongolekta ng malaking data at bakit?
Sino ang nangongolekta ng malaking data at bakit?

Kailangan itong ipaliwanag dito: ang unang tao ay ang gumagamit mismo, na naglalagay ng data nito sa anumang mapagkukunan o aplikasyon. Kasabay nito, sumasang-ayon siya (naglalagay ng tsek sa kasunduan) sa pagproseso ng data na ito pangalawang partido - iyon ay, ang mga may-ari ng mapagkukunan. Ang isang third party ay ang mga kung kanino maaaring ilipat o ibenta ng mga may-ari ng mapagkukunan ang data ng user. Kadalasan ito ay nakasulat sa kasunduan ng gumagamit, ngunit hindi palaging.

Ang ikatlong partido ay mga ahensya ng gobyerno, hacker o kumpanya na bumibili ng data para sa mga layuning pangkomersyo. Ang una ay maaaring makakuha ng data sa pamamagitan ng desisyon ng korte o ng mas mataas na awtoridad. Ang mga hacker, siyempre, ay hindi gumagamit ng anumang mga pahintulot - na-hack lang nila ang mga database na nakaimbak sa mga server. Maa-access lang ng mga kumpanya (ayon sa batas) ang data kung ikaw mismo ang nagpapahintulot sa kanila – sa pamamagitan ng paglalagay ng check sa kahon sa ilalim ng kasunduan. Kung hindi, ito ay labag sa batas.

Bakit gumagamit ng Big Data ang mga kumpanya?

Ang malaking data sa larangan ng komersyal ay ginamit sa loob ng mga dekada, hindi lang ito kasing matindi gaya ng ngayon. Ito ay, halimbawa, mga talaan mula sa mga surveillance camera, data mula sa mga GPS navigator o mga online na pagbabayad. Ngayon, sa pag-unlad ng mga social network, mga serbisyo sa online at mga application, lahat ng ito ay maaaring konektado at makuha ang pinaka kumpletong larawan: kung saan nakatira ang mga potensyal na customer, kung ano ang gusto nilang panoorin, kung saan sila pumunta sa bakasyon at kung anong tatak ng kotse ang mayroon sila.

Mula sa mga halimbawa sa itaas, malinaw na sa tulong ng malaking data, ang mga kumpanya, una sa lahat, ay gustong mag-target ng mga ad. Iyon ay, upang mag-alok ng mga produkto, serbisyo o indibidwal na mga pagpipilian lamang sa tamang madla at kahit na i-customize ang produkto para sa isang partikular na user. Bilang karagdagan, ang pag-advertise sa Facebook at iba pang malalaking platform ay nagiging mas mahal, at ang pagpapakita nito sa lahat ng magkakasunod ay hindi kumikita.

Ang impormasyon tungkol sa mga potensyal na customer mula sa mga bukas na mapagkukunan ay aktibong ginagamit ng mga kompanya ng seguro, pribadong klinika at employer. Ang dating, halimbawa, ay maaaring baguhin ang mga tuntunin ng seguro kung nakikita nila na madalas kang naghahanap ng impormasyon tungkol sa ilang mga sakit o gamot, at maaaring masuri ng mga employer kung ikaw ay madaling kapitan ng mga salungatan at antisosyal na pag-uugali.

Ngunit may isa pang mahalagang gawain na nahihirapan nitong mga nakaraang taon: upang mapalapit sa pinakamahuhusay na madla. Ito ay hindi napakadaling gawin, kahit na ang gawain ay makabuluhang pinadali ng mga serbisyo sa pagbabayad at mga elektronikong tseke sa pamamagitan ng isang solong OFD (fiscal data operator). Upang maging mas malapit hangga't maaari, sinusubukan ng mga kumpanya na subaybayan at "pangalagaan" ang mga potensyal na customer mula pagkabata.: sa pamamagitan ng mga online na laro, mga interactive na laruan at mga serbisyong pang-edukasyon.

Paano ito gumagana?

Ang pinakamalaking pagkakataon para sa pangongolekta ng data ay mula sa mga pandaigdigang korporasyon na nagmamay-ari ng ilang serbisyo nang sabay-sabay. Ang Facebook ay mayroon na ngayong higit sa 2,5 bilyong aktibong gumagamit. Kasabay nito, ang kumpanya ay nagmamay-ari din ng iba pang mga serbisyo: Instagram - higit sa 1 bilyon, WhatsApp - higit sa 2 bilyon at iba pa.

Ngunit ang Google ay may higit na impluwensya: Ang Gmail ay ginagamit ng 1,5 bilyong tao sa mundo, isa pang 2,5 bilyon sa Android mobile OS, higit sa 2 bilyon ng YouTube. At hindi iyan ibinibilang ang paghahanap sa Google at mga Google Maps app, ang Google Play store, at ang Chrome browser. Ito ay nananatiling i-fasten ang iyong online na bangko – at malalaman ng Google ang lahat ng bagay tungkol sa iyo. Sa pamamagitan ng paraan, ang Yandex ay isang hakbang nang maaga sa bagay na ito, ngunit ito ay sumasaklaw lamang sa madla na nagsasalita ng Ruso.



👍 Una sa lahat, interesado ang mga kumpanya sa kung ano ang nai-post at gusto namin sa mga social network. Halimbawa, kung nakita ng bangko na ikaw ay may asawa at aktibong nagkakagusto sa mga babae sa Instagram o Tinder, mas malamang na aprubahan mo ang isang consumer loan. At wala na ang sangla sa pamilya.

Mahalaga rin kung anong mga ad ang na-click mo, gaano kadalas at kung anong resulta.

(Ie Ang susunod na hakbang ay mga pribadong mensahe: naglalaman ang mga ito ng higit pang impormasyon. Ang mga mensahe ay na-leak sa VKontakte, Facebook, WhatsApp at iba pang instant messenger. Ayon sa kanila, madaling masubaybayan ang geolocation sa oras ng pagpapadala ng mensahe. Tiyak na napansin mo: kapag tinalakay mo ang pagbili ng isang bagay o nag-order lang ng pizza sa isang tao, agad na lilitaw ang nauugnay na advertising sa feed.

🚕 Ang malaking data ay aktibong ginagamit at "na-leak" ng mga serbisyo ng paghahatid at taxi. Alam nila kung saan ka nakatira at nagtatrabaho, kung ano ang gusto mo, kung ano ang iyong tinatayang kita. Ang Uber, halimbawa, ay nagpapakita ng mas mataas na presyo kung nagmamaneho ka pauwi mula sa bar at halatang sumobra. At kapag mayroon kang isang grupo ng iba pang mga aggregator sa iyong telepono, sa kabaligtaran, mag-aalok sila ng mga mas mura.

(Ie May mga serbisyo na gumagamit ng mga larawan at video upang mangolekta ng mas maraming impormasyon hangga't maaari. Halimbawa, ang mga library ng computer vision – mayroon ang Google. Ini-scan ka nila at ang iyong paligid upang makita kung anong sukat o taas mo, kung anong mga tatak ang iyong isinusuot, kung anong sasakyan ang iyong minamaneho, kung mayroon kang mga bata o mga alagang hayop.

(Ie Ang mga nagbibigay ng SMS gateway sa mga bangko para sa kanilang mga pagpapadala ay maaaring subaybayan ang iyong mga pagbili sa card – alam ang huling 4 na digit at isang numero ng telepono – at pagkatapos ay ibenta ang data na ito sa ibang tao. Kaya lahat ng spam na ito na may mga diskwento at pizza bilang regalo.

🤷️️ Sa wakas, kami mismo ang naglalabas ng aming data sa kaliwang mga serbisyo at application. Tandaan ang hype na iyon sa Getcontact, nang ang lahat ay masaya na punan ang kanilang numero ng telepono upang malaman kung paano ito isinulat ng iba. At ngayon hanapin ang kanilang kasunduan at basahin kung ano ang sinasabi nito tungkol sa paglilipat ng iyong data (spoiler: maaaring ilipat sila ng mga may-ari sa mga ikatlong partido sa kanilang paghuhusga):

Sino ang nangongolekta ng malaking data at bakit?

Ang mga korporasyon ay maaaring matagumpay na mangolekta at magbenta ng data ng user sa loob ng maraming taon, hanggang sa ito ay dumating sa isang demanda - tulad ng nangyari sa parehong Facebook. At pagkatapos ang mapagpasyang papel ay ginampanan ng paglabag ng kumpanya sa GDPR – isang batas sa EU na naghihigpit sa paggamit ng data nang mas mahigpit kaysa sa American. Ang isa pang kamakailang halimbawa ay ang Avast antivirus scandal: isa sa mga subsidiary na serbisyo ng kumpanya ay nakolekta at nagbebenta ng data mula 100 hanggang 400 milyong mga gumagamit.

Ngunit lahat ba ng ito ay may anumang mga pakinabang para sa atin?

Gaano nakakatulong ang malaking data sa ating lahat?

Oo, mayroon ding maliwanag na panig.

Nakakatulong ang malaking data na mahuli ang mga kriminal at maiwasan ang mga pag-atake ng terorista, hanapin ang mga nawawalang bata at protektahan sila mula sa panganib.

Sa tulong nila, tayo nakakatanggap kami ng mga cool na alok mula sa mga bangko at mga personal na diskwento. Salamat sa kanila tayo hindi kami nagbabayad para sa maraming serbisyo at social network na kumikita lamang sa advertising. Kung hindi, ang Instagram lamang ay gagastos sa amin ng ilang libong dolyar sa isang buwan.

Ang Facebook lamang ay mayroong 2,4 bilyong aktibong gumagamit. Kasabay nito, ang kanilang kita para sa 2019 ay umabot sa $18,5 bilyon. Lumalabas na kumikita ang kumpanya ng hanggang $7,7 sa isang taon mula sa bawat user sa pamamagitan ng advertising.

Sa wakas, kung minsan ay maginhawa lang: kapag alam na ng mga serbisyo kung nasaan ka at kung ano ang gusto mo, at hindi mo na kailangang hanapin ang impormasyong kailangan mo mismo.

Ang isa pang promising area para sa aplikasyon ng Big Data ay ang edukasyon.

Sa isa sa mga unibersidad sa Amerika sa Virginia, isang pag-aaral ang isinagawa upang mangolekta ng data sa mga mag-aaral ng tinatawag na risk group. Ito ang mga hindi nag-aaral ng mahina, lumiliban sa mga klase at malapit nang mag-drop out. Ang katotohanan ay sa mga estado bawat taon ay humigit-kumulang 400 katao ang ibinabawas. Masama ito kapwa para sa mga unibersidad, na ibinaba ang kanilang mga rating at pinutol ang kanilang pondo, at para sa mga mag-aaral mismo: marami ang kumukuha ng mga pautang para sa edukasyon, na, pagkatapos ng bawas, ay kailangan pa ring bayaran. Hindi banggitin ang nawalang oras at mga prospect sa karera. Sa tulong ng malaking data, posibleng matukoy ang pagkahuli sa oras at mag-alok sa kanila ng tutor, karagdagang mga klase at iba pang naka-target na tulong.

Ito, sa pamamagitan ng paraan, ay angkop din para sa mga paaralan: pagkatapos ay aabisuhan ng sistema ang mga guro at magulang - sinasabi nila, ang bata ay may mga problema, tulungan natin siya. Tutulungan ka rin ng Big Data na maunawaan kung aling mga textbook ang mas gumagana at kung aling mga guro ang nagpapaliwanag ng materyal nang mas madali.

Ang isa pang positibong halimbawa ay ang pag-profile sa karera.: ito ay kapag tinutulungan ang mga teenager na magdesisyon sa kanilang magiging propesyon. Dito, binibigyang-daan ka ng malaking data na mangolekta ng impormasyon na hindi makukuha gamit ang mga tradisyunal na pagsubok: kung paano kumilos ang gumagamit, kung ano ang kanyang binibigyang pansin, kung paano siya nakikipag-ugnayan sa nilalaman.

Sa parehong USA, mayroong isang career guidance program – SC ACCELERATE. Ito, bukod sa iba pang mga bagay, ay gumagamit ng CareerChoice GPS na teknolohiya: sinusuri nila ang data tungkol sa kalikasan ng mga mag-aaral, ang kanilang mga hilig sa mga paksa, kalakasan at kahinaan. Pagkatapos ay gagamitin ang data upang matulungan ang mga kabataan na pumili ng mga tamang kolehiyo para sa kanila.


Mag-subscribe at sundan kami sa Yandex.Zen — teknolohiya, inobasyon, ekonomiya, edukasyon at pagbabahagi sa isang channel.

Mag-iwan ng Sagot