logo

Analýza sociálních sítí: Jak se učit s Rkem?

Existuje spousta způsobů, jak si poradit s daty, které ze sociálních médií (nebo odkudkoliv jinde) posbíráte. Někdo volí cestu obarvování excelových políček, jiní data rovnou hodí do některého z mnoha nástrojů, které na přechroupání dat slouží a pak si s nimi hrají. Říká se, že rozdíl mezi datovým analytikem a datovým vědcem je pouze v tom, že datový vědec k manipulaci s daty používá i programování. Podle mě ta rozdělující čára není rozhodně takhle jednoduchá, ale je pravda, že umět pracovat s kódem se hodí a ulehčuje to život. Na běžnou datovou hygienu je to ideální.

Proto tu jsou i tací, co si tímhle způsobem rádi komplikují život, najdete je někde na pomezí dvou předchozích případů a tráví dlouhá odpoledne psaním skriptů a ještě delší večery hledáním chyb, které v nich mají :) V téhle skupině lidí se pravděpodobně setkáte se dvěma hlavními tábory – Rkaři a Pythonisty. Každý jazyk má svoje, každá skupina vám bude zcela určitě říkat, že jejich jazyk je ten lepší, ale pravda bude někde mezi. Pokud vás to zajímá o něco hlouběji, což by čistě pro přehled mohlo, podívejte se na celou tuhle infografiku z Datacamp, kousek z ní máte i tady:

Ještě v dobách, kdy jsem začínala pracovat v Socialbakers, mě Josef naučil pracovat s Rkem a doteď ho učí jako hlavní nástroj datové analýzy i na StuNoMe. R je skriptovací jazyk využívaný hlavně pro statistickou manipulaci s daty. Přesto díky komunitě, která ho obklopuje, postupně bobtná do stavu, kdy s ním můžete dělat i mapové vizualizace, 3D zobrazení grafů nebo třeba řešit, kdo měl větší pravděpodobnost přežít havárii Titanicu. Ale můžete si s nimi (a s Gephi, o které napíšu příště) udělat i tyhle parády:

Upřímně jsem se ale v Rku zas až o takový kus znalostí od svých začátků neposunula – dost často používám pořád ten samý skript a knihovny, navíc jsem na docela dlouhou dobu vyměnila konzoly za marketingové domněnky, takže jsem toho spoustu taky zapomněla. A narozdíl od studentů statistiky jsem nikdy neměla možnost se v Rku dlouhodobě a systematicky zlepšovat. Ovšem ale! Na tyhle případy je tu online svět a možnosti, kterých není zrovna málo. Pokud se chcete začít učit Rko od základů, poradím vám pár kurzů, které mi přijdou nejlepší.

Swirl

Hned zkraje se dostávám k záležitosti pro fajnšmekry, co se chtějí naučit pohybovat přímo v prostředí R Studia, kde se veškerá legrace s Rkem odehrává. Jsou tu sice pak ještě dotyční, kteří tuhle hru hrají na úplně největší obtížnost a stačí jim jen konzole bez přívětivého uživatelského prostředí, ale nebudeme po sobě chtít hnedka zázraky. Že jo? Swirl je balíček, který si stáhnete, spustíte a píšete dle zadání, které vám R Studio píše přímo do konzole. Spousta muziky za hodně málo peněz (čti: zadarmo) a na pár dnů vás to spolehlivě zabaví.

Když jsem na swirl sáhla poprvé, což bylo hodně zkraje mého styku s Rkem, přišla jsem si jako hacker, jen ta kapucka přes čelo mi chyběla. Ten pocit dost rychle přešel, ale jako jeden z prvních způsobů, jak se s kódem seznámit, na něj nedám dopustit.

Datacamp & career tracks

Moje alfa a omega všeho, co se Rka a dat momentálně týče. Dlouhodobě z něj mám nejlepší pocit a přijde mi, že mi to s jeho pomocí i nejlépe leze do hlavy. Nedávno navíc představil tzv. tracks, ve kterých procházíte postupně všemi kurzy, které by vám měly pomoct následovat cestu k povolání datového analytika v Rku, datového vědce s Pythonem a dalších. Pokud vás nezajímá celá cesta za konkrétním povoláním, můžete si procvičit i jen konkrétní oblast jako je například vizualiazace dat, statistika, strojové učení nebo dovednosti jako importování a čištění dat a podobně.

Pokud znáte jazykové Duolingo nebo převážně matematickou Khan Academy a princip, jak fungují, jedná se o podobnou záležitost. Procházíte cvičeními, sledujete vysvětlovací videa a pak můžete denně procvičovat různé části toho, co už jste prošli, abyste nic nezapomněli. Já se postupně prokousávám cestou Data Analyst with R. Kurz obsahuje 16 sekcí od základů Rka až po práci s relativně složitými úkoly, na které narazíte v praxi. Problémem může pro někoho být, že kromě kurzů, které jsou zadarmo celé, vás Datacamp pustí jen k první lekci prémiových kurzů a pak musíte platit.

Code School & Try R

Legrácka z dílny Code School, která ale další kurzy na tohle téma nenabízí, je ideální pro osahání si prostředí Rka přímo v prohlížeči, tj. nemusíte vůbec nic nikam instalovat. Pokud si někdo pamatujete Try Ruby, je to cvičení postavené na podobném principu. V sedmi lekcích (zdarma) si projdete ty nejnutnější základy Rka, kdy je všechno postavené na příběhu o pirátech a tom, co, kde a v jakém množství uloupili.

Zabere to celé i se sledováním videí kolem 2 – 3 hodin, ale stojí to rozhodně za to. Celé prostředí má navíc tématicky vyvedenou pirátskou grafiku, takže pokud jste hračička jako já, oceníte asi i tenhle aspekt:

 R for Data Science

Vypadá to, že Rko je holt pro všechny a pro všechno. Hadley Wickham, krom toho, že stojí za vývojem R Studia, sepsal s G. Grolemundem tuhle učebnici základů Rka, která je dostupná zdarma v plné verzi online. A jak už to tak u edice O’Reilly bývá, je skvěle postavená. Nejdřív se dozvíte teorii, projdete si pár příkladů a každá sekce končí příklady, které máte za úkol vypracovat. Najdete tam i otázky typu „co by se stalo, kdyby tahle řádka kódu byla napsaná takhley“, což vám ještě o kousek víc protočí mozkové závity ohledně syntaxe kódu Rka a jak funguje.

R for Dummies

Pokud sháníte referenční příručku, do které sem tam nakouknete, když nevíte, tohle se hodí mít po ruce. Ne, že bych vás chtěla navádět, ale pdf verze se dá stáhnout z internetu.

R for cats

A nebyl by to internet, kdyby neexistoval kurz Rka, kde jsou kočičky. Tenhle kurz není interaktivní, ale nabízí možnost is stáhnout brožuru s úplnými základy Rka. A ano, je to i s kočičkama a o kočičkách a pejscích.

Poznámka na konec

Říká se, že pro zvládnutí programování byste měli každý den něco v kódu napsat, vyřešit, prostě si s tím denně hrát. A taky se říká, že pokud si chcete něco opravdu zapamatovat, je žádoucí si to sepsat v ruce. Mozek to má prostě uzpůsobený tak, že co se k němu dostane psaním a zároveň čtením, to uchovává lépe. Pokud by vám někdy přišlo divný vypisovat si ke kurzům programování poznámky na papír, vězte, že to možná není normální, ale pro lepší mentální uchopení některých zákonitostí kódu se to hodí. Já si takhle rozepisuju pro lepší pochopení stavbu některých funkcí, protože v případě krize to vždycky zmatlám. Z vlastní praxe mi dlouhodobě plyne, že pokud dáte dohromady denně pár minut na kurz a vypíšete si to, co vám nejvíc vrtá hlavou, je to lepší než tupě dělat jednu a tu samou pasáž dokola, aniž byste chápali, proč to ne/funguje, nebo na to úplně kašlat.

Další rada primárně mířená pro děvčata: Co jsem vypozorovala hlavně u slečen (náhoda? nevím…), spousta z nich se zasekne v jednom bodě a snad z ostychu nebo bezmoci se nikoho nikde nezeptá a zůstane stát na mrtvém bodě a celá snaha programovat jde do háje. Nedělejte to. Když se zaseknete, ptejte se! Programátorů je habaděj, když sami začínali, taky si tímhle museli projít. Pokud žádného neznáte osobně, googlete, případně se zeptejte na Stack Overflow nebo v RStudio Community. Pokud dokážete zformulovat, co vám nejde, všichni jsou většinou velmi nápomocní.

Published by

Leni

Data-driven & social media researcher girl going places🚀 🤓 Geek, nerdy & tech news about social media, digital marketing, books & movies, and R programming. 💻 📚 Czech globe-trotter in love with Sweden. 🌍

2 thoughts on “Analýza sociálních sítí: Jak se učit s Rkem?”

  1. Moc hezký blog. I když nedělám analýzu sítí, ale dat o kvalitě ovzduší, prošel jsem si podobnými vývojem. Excel jsem omezil na minimum, základ je v R, datacamp a stack overflow k ruce. Nutno říci, že mě analýza dat hodně chytla a pořád se snažím rozšiřovat si obzory. Takže dík za názory a tipy ;-)

    • Díky za komentář, jsem ráda, že se blog líbí. A jsem ráda, že takhle virtuálně poznávám dalšího člověka s podobným data-osudem :) Ať se daří!

Leave a reply

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

This site uses Akismet to reduce spam. Learn how your comment data is processed.