logo

Analýza sociálních sítí: Jak začít?

Není datová analýza jako datová analýza. Čím víc dat se produkuje a že se jich produkuje nadmíru, o čemž svědčí i celý koncept tzv. „big data“, tím víc směrů v jejich průzkumu můžete vzít. Moje specializace je analýza sociálních sítí, což je na hony vzdálené od business intelligence nebo prediktivnímu modelování cesty zákazníka po webové stránce, což se využívá například u e-shopů. I tak se tím dá uživit, dá se to dokonce i studovat a od samotného Facebooku až po univerzity se na tomhle poli dělá bezpočet výzkumů.

Ale kde začít, když byste se chtěli analýze sociálních sítí věnovat? Čtěte dál…

Co to je analýza sociálních sítí

Ve zkratce jde o analytické získávání informací a dat ze sociálních sítí. No shit, Sherlock! Důležitá část v tomhle všem je pojem sítě. Jejich teorie spadá pod tzv. teorii grafů, která spadá pod teorii systémů. Všechno tohle je vlastně jen snaha matematiky o vypracování uchopitelného modelu libovolného systému. V praxi to znamená, že máme-li skupinu lidí, mezi kterými jsou nějaké vazby, vztahy či interakce a dokážeme-li tuhle skupinu zakreslit do jednoduchého grafu, můžeme je i jejich vzájemné interakce analyzovat. Jednotlivcům v tomhle případě říkáme uzle (nodes) a vazbám mezi nimi hrany (edges). Co je mezi nimi, je pak pole působnosti právě analýzy sociálních sítí (social network analysis, dále SNA).

Co není analýza sociálních sítí

…a je to problém hlavně u nás. V českém prostředí se totiž dost často stává, že se pletou pojmy sociální síť a sociální médium. A hoďte si kamenem, kdo jste bez viny. Pokud k tomu ještě přidáte z angličtiny převzatou platformu sociální sítě, jste se všema termitama (sic!) už úplně v háji.

Často se potkávám s tím, že hlavně lidi z online marketingu, vypracují analýzu, jak se značka XY prezentuje na Facebooku a napíšou, že je to analýza sociálních sítí značky XY. Není. Jde jen o analýzu marketingu značky XY na sociálním médiu jménem Facebook, jehož podstata je krom jiného i podpořit tvorbu sociálních sítí mezi jeho uživateli. Ano, je v tom rozdíl.

Je to oser používat správnou terminologii, když světu vládne bulshit bingo, co?

K čemu se používá

K analýze sociálních sítí :) A teď vážně… Můžete s její pomocí zjistit tok informací – od koho, přes koho a kam, najdete největší influencery v síti a danou síť si budete umět rozdrobit na menší. Dokážete si i vydedukovat největší pravděpodobnost, kudy informace poteče atd. Konkrétně pro značky je to pak dobrá sonda do toho, co za lidi se jim mezi fanoušky pohybuje a čím a jak je oslovit. Americká vláda (kromě sbírání metadat o všech a o všem…) síťovou analýzu využila třeba i pro hledání (a úspěšné nalezení!) Usámy bin Ladina.

Rozklíčovat kdo je kdo a kdo se s kým zná v teroristické buňce? Může být.

A pro inspiraci si někdy přečtěte něco o Edwardu Snowdenovi vs NSA, případně se podívejte na seriál Person of Interest nebo seriál Minority Report. Poslední dva zmiňované seriály jsou sice sci-fi, ale i tyhle legrace se dají s analýzou sítí taky zvládnout.

Dovednosti, co se hodí mít

Paradoxem je, že nemusíte mít vystudovanou matematiku. Respektive i tady záleží, do jak velké míry se chcete analýze sociálních sítí věnovat. Různě po světě jsou laborky, firmy a školy, kde k SNA přistupují zcela matematicky přes výpočty algoritmů, frekvencí, snaží se vypočítat prediktivní modely a denodenně řeší strojové učení. Pro mě osobně je tohle už hardcore verze (nemám na to buňky…), takže se sneseme o pár úrovní níž, kde funguju já.

Bakalářský titul mám z divadelní teorie a kritiky z DAMU. To se nechci chlubit, jen vám tím chci říct, že SNA může dělat klidně i cvičená opice. Vzhledem k tomu, že sociální sítě (i média) jsou multikulti prostor, hodí se kromě technických znalostí mít i ty humanitně zaměřené. A to na jakékoliv úrovni. Josef Šlerka v tomhle rozhovoru tvrdí (a já s ním souhlasím, neb vím, odkud to má…), že život na sítích se až tolik neliší od toho reálného. Já k tomu jen dodám, že je až na mírnou amplifikaci stejný. Proto se zaměřte na sociologii, základy psychologie, zajímejte se o různé věkové skupiny a styl jejich života, ať se jedná o mainstream nebo subkultury. Cestujte, poznávejte lidi, tradice a kulturní zvyklosti a byť je to často dost nepříjemné, vylezte ze své sociální bubliny. Čím víc životů poznáte, tím lepší v analýze budete.

Z těch technických disciplín se ponořte do skriptovacího jazyka R nebo do Pythonu a SQL. Nemusíte být nutně programátor, ale pokud nechcete stát smutně v koutě, když si ostatní budou hrát s daty, naučte se rozumět kódu a umějte ho aspoň z části napsat( nebo na to mějte lidi…). Po internetu existuje bezpočet kurzů Rka i Pythonu přímo postavených pro datové analytikyDatacamp, Coursera, Codeschool, stačí si vybrat. Není se třeba ničeho bát, v případě krize je po ruce vždycky Stack Overflow nebo tutoriály. Mimochodem, jak jsem říkala, že nemusíte mít vystudovanou matematiku… Pořád to platí, ale jděte na Khan Academyzopákněte si statistiku, pravděpodobnost a základy lineární algebry a naučte se číst grafy. Pro jistotu, víte jak…

Je to řehole, ale počkejte, až si zkusíte svou první analýzu… ^_^

Co dál? Pokud se vrtnete online směrem síťové analýzy, naučte se rozumět pojmům, na kterých stojí a pracují technologičtí giganti a aktivně sledujte vývoj sociálních médií, online prostředí a zvyků, jak se na nich lidi chovají. Sledujte zprávy z VentureBeat, Wired, Gizmodo, MIT Technology Review, ale do záložek si dejte i vývojařské blogy Googlu, Facebooku, Twitteru, LinkedInu a Netflixu. A čtěte studie, které o social network analysis obecně vycházejí. A že jich je.

A určitě nezapomínejte na pravidelný průzkum toho, jaká data které weby a sociální média poskytují veřejně. Třeba Facebook je v tomhle dost specifický, protože zachází s osobními daty, na která se vztahuje hned několik mezinárodních stanov, proto svou API osekává co to jde. Na druhou stranu si můžete ale postahovat a analyzovat data ze Spotify, IMDB či Last.fm a na ně se žádné restrikce nevztahují. A pokud chcete být hodně odvážní, můžete koneckonců i leccos vyscrapovat. Ale kdyby se někdo ptal, já vám to neporadila…

Nástroje, které používám

Pro stahování dat R Studio. Kde beru skripty? Něco mám od Josefa, něco jsem si sesmolila sama, zbytek hledám na Githubu a zkouším, zkouším a zkouším až do zblbnutí. Co ohledně čištění a unifikace dat nezvládám v Rku (a že toho je), s tím si pomůžu v Open Refine, případně v Excelu, ale do něj lezu strašně nerada. Vizualizace dat pak řeším v Gephi, geolokační data dávám do CartoDB (přejmenované na CARTO) a poslední dobou se snažím naučit i v Tableau.

Stejně jako znám lidi, kteří všechno (i včetně vizualizace) dělají v Rku, znám lidi, kteří mají na každý krok práce s daty jiný nástroj. Doporučuju vyzkoušet všechno, k čemu se dostanete, protože si stejně sami nejlíp vyzkoušíte, co vám sedí nejlíp.

Co si pro začátek přečíst

Doufám, že umíte anglicky, protože bez toho se daleko nehnete. Je to škoda, ale pro téma analýzy sociálních sítí toho v češtině snad kromě diplomových a bakalářských prací a krátkých článků moc není. Co ale mít pro začátek v knihovničce, pokud to bere aspoň trochu vážně?

Pro nás všechny dummies je tu díkybohu edice for Dummies…

Pár užitečných rad na konec

Začněte pomalu. Nikam nespěchejte. Nevzdávejte to. Pokud vám není úplně vlastní matematické myšlení, ale rádi řešíte problémy a snažíte se přijít na to, jak něco funguje, máte i tak všechno do základu toho, co je potřeba. Zbytek se dá časem, tréninkem a hlavně praxí naučit. Hodně zdaru! A kdybyste se chtěli na něco zeptat, napište.

Pokračování příště…

Published by

Leni

Data-driven & social media researcher girl going places🚀 🤓 Geek, nerdy & tech news about social media, digital marketing, books & movies, and R programming. 💻 📚 Czech globe-trotter in love with Sweden. 🌍

Leave a reply

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

This site uses Akismet to reduce spam. Learn how your comment data is processed.