Apžvalga: „Udacity Data Analyst Nanodegree“ programa

„Udacity“ duomenų analitiko programa „Nanodegree“ buvo viena pirmųjų duomenų mokslo internete programų per internetinę švietimo revoliuciją. Jo tikslas - „užtikrinti, kad įvaldytumėte tikslius įgūdžius, reikalingus kurti duomenų mokslo karjerą“. Ar jis pasiekia savo tikslą? Ar tai geriausias pasirinkimas?

Baigiau programą 2016 m. Rudenį. Naudodamas įkvėpimą iš „Class Central“ atvirojo kodo peržiūros šablono, pateikiu „Udacity“ duomenų analizės programos „Nanodegree“ apžvalgą.

ATNAUJINIMAS: „Data Analyst Nanodegree“ programa buvo atnaujinta nauju turiniu ir studentų paslaugomis 2017 m. Rugsėjo mėn. Išsami informacija čia. Taip pat buvau pakviestas į laivą, kad padėčiau atkurti dalį šio naujo turinio. Dauguma šios apžvalgos nepakito. Faktiniai atnaujinimai žymimi kursyvu.

Papildoma informacija

Kas privertė mane apsispręsti dalyvauti šioje programoje?

2016 metų pradžioje pradėjau kurti savo duomenų mokslo magistro programą naudodamas internetinius išteklius. (Apie tai galite perskaityti čia.) Įstojau į „Data Analyst Nanodegree“ programą dėl kelių priežasčių:

  • Norėjau įvado į duomenų mokslą vadovo.
  • Norėjau darnios programos, o ne atskirų įvairių paslaugų teikėjų kursų.
  • Jis sulaukė žvaigždžių atsiliepimų.
  • Anksčiau buvau išklausęs keletą „Udacity“ kursų ir buvau jų mokymo stiliaus gerbėjas.

Kokie buvo mano tikslai?

Nors programa gali būti tiltas į darbą (apie tai vėliau), aš norėjau naudoti programą kaip pažangesnės medžiagos įžangą. Ši „pažangesnė medžiaga“ taikoma tiek dalykams, kuriems taikoma programa, tiek dalykams, kurie nėra.

Kas yra „Udacity Nanodegree“ programa?

„Udacity“ yra viena iš pirmaujančių internetinių švietimo paslaugų teikėjų. Sebastianas Thrunas, buvęs Stanfordo profesorius ir „Google X“ įkūrėjas, įkūrė įmonę ir daugiausia dėmesio skiria inovacijoms „Udacity“, būdamas prezidentu ir pirmininku. Vishas Makhijani yra generalinis direktorius.

Nanodegree programos yra internetiniai prisijungimo duomenys, kuriuos teikia „Udacity“. Tai yra „Udacity“ kursų rinkiniai (kai kuriuos galima įsigyti nemokamai, kitus - ne), prie kurių pridedami projektai, kuriuos peržiūri „Udacity“ apmokami projektų apžvalgininkai. Jie taip pat ateina su krūva studentų paslaugų.

„Slack“ yra naudojamas kaip bendruomenės įrankis, kuriame „Udacity“ studentai gali bendrauti su kitais studentais, taip pat su savo programos instruktoriais ir kitais „Udacity“ darbuotojais. Daugumoje programų studentai paskyrė mentorius ir bendrauja su jais per privatų pokalbių kanalą, kuris visada pasiekiamas „Udacity“ klasėje.

„Data Analyst Nanodegree“ programa iš pradžių buvo išleista 2014 m. Tai buvo antroji „Udacity“ programa „Nanodegree“. Nors per metus ji pasikeitė, programos esmė yra nepakitusi.

Kas yra instruktoriai ir kokia jų kilmė?

Kadangi „Data Analyst Nanodegree“ programa yra „Udacity“ kursų rinkinys (vėlgi vieni vieni nemokami, kiti ne), yra keli instruktoriai. Jų gyvenimo aprašymai dažnai apima prestižinius vaidmenis pagrindinėse technologijų kompanijose ir aukštesnių JAV mokyklų laipsnius.

Jie patys savaime nėra „instruktoriai“, tačiau „Udacity“ projektų apžvalgininkai, mentoriai ir studentų patirties darbuotojai (kurie stebi „Slack“ kartu su instruktoriais) yra tie žmonės, su kuriais dažniausiai bendraujate. Jie tokie, tokie naudingi. Apie tai vėliau.

Kaina

Programa yra padalinta į du terminus. Pirmasis terminas kainuoja 499 USD. Antroji kadencija kainuoja 699 USD. Jei gerai suvokiate per pirmąją kadenciją mokomus įgūdžius, galite jų praleisti, baigti tik antrąją kadenciją ir vis tiek gauti pažymėjimą.

Rekomenduojamos prielaidos

1 terminui „Udacity“ rekomenduoja studentams susipažinti su aprašomąja statistika ir turėti tam tikros patirties dirbant su skaičiuoklių ar SQL duomenimis.

Kalbant apie 2 terminą, studentai turėtų turėti patirties analizuojant duomenis naudojant „Python“, taip pat gerai išmanyti išvestinę statistiką ir jos taikomąsias programas.

Mano kilmė / įgūdžiai įstojus į programą

Programą pradėjau 2016 m. Gegužės mėn., Kai turėjau keletą mėnesių programavimo patirties, daugiausia „C“ ir „Python“. Didžioji šios patirties dalis buvo iš mano duomenų mokslo magistro programos jungiamojo modulio, kuriame perėmiau Harvardo CS50: įvadas į kompiuterių mokslą ir „Udacity“ įvadą į programavimo nanodegree programą.

Taip pat buvau baigusi bakalauro chemijos inžinerijos programą ir turėjau 24 mėnesių su kvantais susijusios darbo patirties. Tai reiškė, kad lankiau kelis statistikos kursus ir man buvo patogu naudotis duomenimis.

Programa

Struktūra

„Data Analyst Nanodegree“ programa yra padalinta į dvi dalis. Kiekvieną terminą sudaro trys kursai ir keturi projektai (papildomas projektas yra intro projektas, padedantis priprasti prie „Udacity“ mokymosi aplinkos). Mat Leonardas, vadovaujantis programos mokymo programai atnaujinimo metu, dalyvauja visoje programoje, kai jis pristato kiekvieną kursą, jo paskirtį programoje ir savo instruktorių (-us).

Kurso turinį sudaro vaizdo įrašų, teksto ir viktorinų derinys. Vaizdo įrašai paprastai svyruoja nuo 30 sekundžių iki penkių minučių, atsižvelgiant į „Udacity“ stilių. Šiuos trumpus vaizdo įrašus dažnai seka automatiškai įvertintos viktorinos. Šios viktorinos paprastai yra kelių pasirinkimų, užpildymo tuščios arba mažos programavimo užduotys. Įsigijus „CloudLabs“, šios programavimo užduotys dabar atliekamos „Jupyter Notebook“ ir „SQL“ kodavimo aplinkose „Udacity“ klasėje.

Vėlgi, kiekviename skyriuje yra įvertintas projektas. Šie projektai ir mokamų „Udacity“ recenzentų atsiliepimai yra tai, kur studentams yra didelė vertė.

Programa

Mano programos leidimą sudarė septynios dalys:

  • P1: Aprašomoji ir išvadinė statistika
  • P2: Duomenų analizės įvadas (naudojant „NumPy“ ir „pandas“)
  • P3: Duomenų sąveika su „MongoDB“ (arba SQL)
  • P4: Tiriamoji duomenų analizė (su R)
  • P5: Įvadas į mašininį mokymąsi
  • P6: Duomenų vizualizavimas naudojant D3.js
  • P7: Sukurkite A / B testą

Pirmasis naujosios programos terminas vadinamas „ Data Analysis with Python“ ir „SQL“ . Kursai ir projektai apima:

  • Įvadinis projektas: tyrinėkite orų tendencijas. Temperatūros duomenims analizuoti ir vizualizuoti naudojami SQL ir skaičiuoklės (arba „Python / R“, jei jau esate susipažinę).
  • Kursas: „ Python“ įvadas. Projektas: Naršykite JAV „Bikeshare“ duomenis.
  • Kursas: Duomenų analizės įvadas, apimantis duomenų analizės procesą ir SQL duomenų analizei. Projektas: Ištirkite duomenų rinkinį.
  • Kursas: praktinė statistika. Projektas: išanalizuokite A / B bandymų rezultatus.

Antrasis terminas vadinamas Išplėstinė duomenų analizė . Kursai ir projektai apima:

  • Įvadinis projektas: išbandykite suvokimo fenomeną. Apskaičiuokite aprašomąją statistiką ir atlikite statistinį duomenų rinkinio testą, pagrįstą psichologiniu reiškiniu, vadinamu „Stroop“ efektu.
  • Kursas: duomenų rišimas (su Python). Projektas: ginčytis ir analizuoti duomenis. Tai yra mano sukurtas kursas ir projektas. ?
  • Kursas: tiriamoji duomenų analizė (su R). Projektas: Naršykite ir apibendrinkite duomenis.
  • Kursas: duomenų pasakojimas (su „Tableau“). Projektas: sukurkite „Tableau“ istoriją.

Dideli pokyčiai su visa išsamia informacija, aprašyta šiame tinklaraščio įraše:

  • Dabar Python mokoma programoje.
  • Mašinų mokymasis ir A / B testavimas dabar įtrauktas kaip neprivaloma medžiaga ir jiems nebereikalaujama baigti programos. Pagrindimas: „Šios programos tikslas yra paruošti jus duomenų analitiko darbams. Mūsų tyrimai rodo, kad mašininis mokymasis nėra reikalavimas daugumai duomenų analitikų pozicijų “. A / B testavimo pagrindai dabar aptarti naujuose praktinės statistikos kursuose, suteikiant studentams poveikį, kurio jiems reikės darbe.
  • Nauji kursai ir projektai. Tiksliau, įvadas į duomenų analizę (kuri apima „Python“ duomenų analizei ir „SQL“ duomenų analizei), praktinę statistiką (moko Sebastianas Thrunas) ir duomenų rišimą.

Vertinimas

Projektai vertinami pagal patvirtintą / nesėkmingą (oficialiai „atitinka specifikacijas“ ir „reikalauja pakeitimų“) principą pagal unikalią rubriką. Jūsų projektas turi atitikti visus rubrikos skyrius. Jei visi jūsų projektai atitinka specifikacijas, jūs baigsite studijas. Tai reiškia, kad automatiškai įvertinamos viktorinos neįskaičiuojamos į jūsų pažymį.

Jei norint pateikti projektą reikia atlikti pakeitimus, projekto apžvalgininkas pateiks jums atsiliepimus. Įdiegę šiuos pakeitimus, galite pateikti iš naujo. Pateikimo limito nėra.

Mano patirtis

Laiko juosta

Apskaičiuotas „Udacity“ programos „Data Analyst Nanodegree“ programos laikas buvo 378 valandos, kai pradėjau, o tai reiškia, kad studentai vidutiniškai užtruko 6–7 mėnesius. Pasak „Toggl“ (laiko stebėjimo programa), visa programa man užtruko 369 valandas per penkis mėnesius. Šioje laiko juostoje reikėjo skirti daug laiko tam, kad mano projektai taptų kokybiški, o ne minimalus, kad atitikčiau patenkinamų / neišlaikytų rubriką.

Programa buvo sutrumpinta atnaujinant 2017 m. Rudenį. Numatoma nauja laiko juosta yra 260 valandų . Kiekvieno termino tempas yra 10 valandų per savaitę per 13 savaičių, nors studentams suteikiama 19 savaičių kiekvienam terminui užbaigti.

Koks buvo kurso turinys?

Mano programos leidime P1 (Statistika), P2 (Įvadas į duomenų analizę), P4 (Tiriamoji duomenų analizė), P5 (Mašininis mokymasis) ir P7 (A / B testavimas) kurso turinys gauna penkias žvaigždes penki nuo manęs. P3 (duomenų raizgymas) ir P6 gauna tris su puse žvaigždžių.

Tiriamųjų duomenų analizės turinys su „Facebook“ darbuotojais (P4) buvo toks šviečiantis. Įvadas į mašininio mokymo kursus su Sebastianu Thrunu ir Katie Malone (P5) buvo smagiausias, kokį turėjau bet kuriame internetiniame kurse. A / B testavimo turinys su „Google“ darbuotojais (P7) yra toks unikalus. Jei galėčiau, šiems trims kursams suteikčiau šešias žvaigždes.

SQL ir „Data Wrangling“ turinys (P3) nebuvo nuostabus. Tas pats ir su duomenų vizualizavimo turiniu (P6), nors tikriausiai taip buvo todėl, kad D3.js yra labai sunku išmokyti „JavaScript“ naujokų. Remiantis „Class Central“ tų kursų apžvalgomis, šios nuomonės nėra retos. Patikrinkite juos čia ir čia.

Šis „neįtikėtinas“ turinys iš senosios programos buvo pašalintas atnaujinant 2017 m. Rudenį. Dabar įtraukiamas atnaujintas turinys, skirtas duomenų analizei, SQL, statistikai, duomenų tvarkymui ir duomenų vizualizavimui. Praktinės statistikos turinys orientuotas į išvestinę statistiką, o aprašomoji statistika yra būtina sąlyga ir mokoma „Data Foundations Nanodegree“ programoje. Duomenų vizualizavimo kursas dabar mokomas su „Tableau“, o ne „D3.js“.

Kaip sekėsi projektai?

Vėlgi, projektuose „Udacity“ išsiskiria iš kitų internetinių švietimo platformų. Jie investuoja į savo projekto peržiūros procesą ir tai pasiteisina. „Data Analyst Nanodegree“ programa nebuvo išimtis.

Visi projektai sustiprina turinį, kurį išmokote vaizdo įrašuose. Projekto apžvalgininkai žino savo dalykus. Jie nurodo, kur jums pasisekė ir kur yra jūsų klaidos ir (arba) praleidimai. Prižiūrėtas mokymasis. Tai veikia.

Forumai ir forumo mentoriai yra ypač naudingi, kai užstringa. Ieškokite forumuose, kad sužinotumėte, ar jūsų problema yra įprasta (dažniausiai taip yra). Nesėkmė? Išsiųskite naują klausimą patys. Yra vienas forumo mentorius Mylesas Callanas, kuris, atrodo, viską žino apie viską ir atsako per kelias valandas. Man kyla abejonių, kad jis miega.

Nors forumai vis dar egzistuoja ir veikia, „Slack“ ir „Classroom“ mentoriai yra rekomenduojami palaikymo būdai. Studentai gali skelbti klausimus, o atsakymai pateikiami tuo pačiu ar didesniu skubumo lygiu (per kelias valandas ir dažnai greičiau). „Slack“ bendruomenę prižiūri „Udacity“ instruktoriai ir jų studentų patirties darbuotojai, kurie užtikrina, kad studentų klausimai, komentarai ir pan. Būtų sprendžiami laiku. Garsusis Mylesas Callanas dabar yra mentorius.

Jei norite sužinoti, kaip atrodo šie projektai, peržiūrėkite šią „Github“ saugyklą.

Kaip sunku buvo?

Statistikos turinys man buvo lengvas, nes buvau išklausęs kelis statistikos kursus undergrade. Tai tikriausiai pasakytina apie kiekvieną „Nanodegree“ programos temą, jei turėtumėte išankstinės patirties joje.

Aš priskirčiau didžiąją programos dalį kaip tarpinį sunkumą. Paskaitų turinys, kuriame nėra daug viktorinų (vis dėlto dažnai būna), gali būti vėjelis, o tai nebūtinai yra blogas dalykas. Projektai mankština smegenis. Kiekvienas tikriausiai užtruks daugiau nei dvidešimt valandų, jei norite būti kruopštus.

Tiriamųjų duomenų analizės projektas buvo sunkiausiai įveikiamas. Man reikėjo 3,5 pateikimo. Peržiūrėkite šią „Twitter“ giją, jei norite sužinoti daugiau.

Ar galite kreiptis dėl darbo iškart po studijų?

Tu gali. Jei į tai žiūrite rimtai, programa turėtų suteikti jums reikalingų įgūdžių pradinio lygio duomenų analitiko vaidmeniui. Eli Kastelein yra puikus to pavyzdys. Daugiau apie jo istoriją galite perskaityti žemiau.

Kaip sukurti karjerą technikos srityje be CS laipsnio

2014 m. Pavasarį buvau nauja kurso studentė kurtų autobuse, kuris ypač nekeliavo niekur. medium.com

Taip pat galite tęsti aukštesnio lygio kursus, skirtus tiek programoje numatytiems dalykams, tiek kitiems dalykams. Tai aš nusprendžiau padaryti.

Paskutinės mintys

Ar aš vėl imčiausi programos, žinodamas tai, ką žinau dabar?

Kažkur programos pabaigoje pradėjau kurti „Class Central“ duomenų mokslo karjeros vadovą. Tai reikalavo ištirti kiekvieną internetinį kursą, siūlomą kiekvienam duomenų mokslo dalykui.

Nors man patiko dauguma „Nanodegree“ programos kursų (atnaujinimas: nauji kursai pakeitė tuos kursus, kurie man nepatiko) , yra kitų paslaugų teikėjų kursų, kurie geriau vertina tam tikrus dalykus. Pavyzdžiui, statistika. Jei pradėdamas turėčiau prieigą prie savo vadovo, svarsčiau atskirą kiekvieno dalyko kursą. Tačiau „Udacity“ studentų paslaugos ir projektų peržiūros procesas yra tokie veiksmingi, kad mokyčiausi „Data Analyst Nanodegree“ programos.

Jei esate tas žmogus, kuris nori 100% individualaus internetinio mokymo patirties, tačiau norite pasinaudoti „Udacity“ projektais ir paslaugomis, tyrinėkite mėgstamus kiekvieno dalyko kursus (rekomenduoju naudoti „Class Central“), tada užsiregistruokite „Nanodegree“ programoje projektus verta apsvarstyti.

Alternatyvos

Tai yra penkios alternatyvios programos, kurias svarstiau įstodamas į „Data Analyst Nanodegree“ programą:

  • Johns Hopkins universiteto duomenų mokslo specializacija Coursera
  • „Microsoft“ profesionalus programos duomenų sertifikatas „edX“
  • Wesleyan universiteto duomenų analizės ir aiškinimo specializacija „Coursera“
  • „DataCamp“ Python ir R takeliai
  • „Dataquest“ duomenų analitiko ir duomenų mokslininko keliai

Pastaba: pašalinau savo komentarus apie šias programas dėl „Udacity“ politikos, susijusios su kitų teikėjų komentavimu.

Išvada

„Udacity“ duomenų analizės programa „Nanodegree“ suteikia jums pagrindinius įgūdžius, kurių reikia duomenų mokslų karjerai. Baigę studijas, galėsite nukreipti savo stipriąsias ir silpnąsias puses ir prireikus papildyti savo mokymąsi. Be to, jūs išvyksite su keletu projektų, paruoštų portfeliui.

Man patiko, kaip ir kitiems.

★★★★ ¾