Kaip sumažinti AI hype ir tapti mašinų mokymosi inžinieriumi

Esu įsitikinęs, kad esate girdėję apie neįtikėtinas dirbtinio intelekto programas - pradedant programomis, kurios gali įveikti geriausius pasaulio „Go“ žaidėjus, ir savarankiškų automobilių.

Problema ta, kad dauguma žmonių susigaudo dirbtinio intelekto ažiotaže, maišydami technines diskusijas su filosofinėmis diskusijomis.

Jei norite sumažinti AI ažiotažą ir dirbti su praktiškai įdiegtais duomenų modeliais, treniruokitės link duomenų inžinieriaus ar mašinų mokymosi inžinieriaus pozicijos.

Neieškokite įdomių dirbtinio intelekto programų dirbtinio intelekto straipsniuose. Jų ieškokite duomenų inžinerijos ar mašininio mokymo programose.

Tai žingsniai, kurių ėmiausi sukūręs šį įdomų mažą grandiklį, kurį sukūriau analizuodamas lyčių įvairovę skirtingose ​​kodavimo įkrovos programose. Tai kelias, kurį nuėjau, norėdamas atlikti „Springboard“ naujos internetinės įkrovos stovyklos „AI / ML“ tyrimus su darbo garantija.

Čia pateikiamas nuoseklus vadovas, kaip patekti į mašinų mokymosi erdvę, prie kiekvienos pridedant kritinį išteklių rinkinį.

1. Pradėkite tobulinti savo „Python“ ir programinės įrangos kūrimo praktiką

Pirmiausia norėsite apimti „Python“, pasirinktą kalbą daugumai mašinų mokymosi inžinierių.

Patogi scenarijų kalba yra pasirinkimo įrankis daugumai duomenų inžinierių ir duomenų mokslininkų. Dauguma duomenų įrankių buvo sukurti „Python“ arba turi API prieigą, kad būtų lengva pasiekti „Python“.

Laimei, „Python“ sintaksę palyginti lengva paimti. Kalba turi daugybę dokumentų ir mokymo išteklių. Tai taip pat apima visų rūšių programavimo paradigmų palaikymą nuo funkcinio programavimo iki objektinio programavimo.

Vieną dalyką, kurį gali būti šiek tiek sunku paimti, yra žymėjimas tarpais ir tarpai, reikalingi kodui sutvarkyti ir suaktyvinti. „Python“ erdvėje iš tikrųjų svarbu.

Kaip mašinų mokymosi inžinierius, jūs dirbtumėte komandoje kurdami sudėtingas, dažnai kritiškai svarbias programas. Taigi, dabar tinkamas laikas atsinaujinti ir programinės įrangos inžinerijos srityje.

Išmokite naudoti tokius bendradarbiavimo įrankius kaip „Github“. Įpraskite rašyti išsamius vieneto testus savo kodui naudodami testavimo sistemas, tokias kaip „nosis“. Išbandykite savo API naudodami tokius įrankius kaip „Postman“. Naudokite CI sistemas, tokias kaip „Jenkins“, kad įsitikintumėte, jog jūsų kodas nenutrūksta. Išsiugdykite gerus kodų peržiūros įgūdžius, kad galėtumėte geriau bendradarbiauti su būsimais techniniais kolegomis.

Vienas dalykas, kurį reikia perskaityti : kas yra geriausias duomenų mokslui skirtas „Python IDE“? Greitai perskaitykite, kad galėtumėte suprasti, kokį įrankių rinkinį norite naudoti, kad įdiegtumėte „Python“ duomenų rinkiniuose.

Aš pats naudoju „Jupyter Notebook“, nes jis yra iš anksto įdiegtas su daugeliu svarbių duomenų mokslo bibliotekų, kurias naudosite. Jame yra lengva, švari interaktyvi sąsaja, leidžianti redaguoti kodą skriejant.

„Jupyter Notebook“ taip pat yra su plėtiniais, leidžiančiais lengvai pasidalinti rezultatais su visu pasauliu. Sukurtus failus taip pat labai lengva naudoti „Github“.

Vienas dalykas, kurį reikia padaryti : „Pandas Cookbook“ leidžia jums susipažinti su tiesioginiais „Pandas“ sistemos pavyzdžiais, viena iš galingiausių duomenų tvarkymo bibliotekų. Galite greitai išnagrinėti pavyzdį, kaip žaisti naudojant duomenų rinkinį.

2. Pažvelkite į mašininio mokymosi pagrindus ir teoriją

Kai žaidi su „Python“ ir praktikuoji su juo, laikas pradėti nagrinėti mašininio mokymosi teoriją.

Sužinosite, kokius algoritmus naudoti. Turėdami pagrindines žinias apie mašininio mokymosi teoriją, galėsite lengvai įgyvendinti modelius.

Vienas dalykas, kurį reikia perskaityti : Dešimt geriausių mašininio mokymosi naujokų algoritmų apžvalga padės jums pradėti nuo pagrindų. Sužinosite, kad nėra „nemokamų pietų“. Nėra algoritmo, kuris duotų jums optimalų kiekvieno nustatymo rezultatą, todėl turėsite pasinerti į kiekvieną algoritmą.

Vienas dalykas, kurį reikia padaryti : žaiskite naudodamiesi interaktyviu nemokamu mašininio mokymosi „Python“ kursuose - lavinkite savo „Python“ įgūdžius ir pradėkite diegti algoritmus.

3. Pradėkite dirbti su duomenų rinkiniais ir eksperimentuoti

Jūs turite įrankius ir teoriją po savo diržu. Turėtumėte pagalvoti apie mažų mini projektų, kurie gali padėti patobulinti savo įgūdžius, atlikimą.

Vienas dalykas, kurį reikia perskaityti : Pažvelkite į 19 nemokamų viešųjų duomenų rinkinių, skirtų jūsų pirmajam duomenų mokslo projektui, ir pradėkite ieškoti, kur internete galite rasti įvairių duomenų rinkinių, su kuriais galėtumėte žaisti.

Vienas dalykas, kurį reikia padaryti : „Kaggle“ duomenų rinkiniai leis jums dirbti su daugybe viešai prieinamų duomenų rinkinių. Puikiausia šioje kolekcijoje yra tai, kad galite pamatyti, kiek populiarūs tam tikri duomenų rinkiniai. Taip pat galite pamatyti, kokie kiti projektai buvo sukurti naudojant tą patį duomenų rinkinį.

4. Sumažinkite savo duomenų įgūdžius naudodami „Hadoop“ arba „Spark“

Dabar, kai praktikuojate mažesnius duomenų rinkinius, norėsite sužinoti, kaip dirbti su „Hadoop“ ar „Spark“. Duomenų inžinieriai dirba su srautiniu, realaus laiko gamybos lygio duomenimis terabaitų, o kartais ir petabaitų mastu. Išmokite išmokti savo kelią per didelių duomenų sistemą.

Vienas dalykas, kurį reikia perskaityti : šis trumpas straipsnis Kaip „Hadoop“ ir „Spark“ kaupiasi? padės jums pereiti tiek „Hadoop“, tiek „Spark“ ir jų tarpusavio palyginimą bei kontrastą.

Vienas dalykas, kurį reikia padaryti : jei norite pradėti dirbti su didžiųjų duomenų sistema iš karto, „Databricks“ priglobti „Spark Jupyter“ užrašų knygelės siūlo pamokos lygio įvadą į sistemą ir leidžia jums praktikuotis su gamybos lygio kodų pavyzdžiais.

5. Dirbkite su gilia mokymosi sistema, tokia kaip „TensorFlow“

Jūs baigėte tyrinėti mašininio mokymosi algoritmus ir dirbti su įvairiais ten esančiais didžiųjų duomenų įrankiais.

Dabar atėjo laikas imtis tokio galingo mokymosi, kuris buvo naujų pažangos akcentas. Išmokite „TensorFlow“ sistemą ir būsite mašininio mokymosi pažangiausiose srityse.

Vienas dalykas, kurį reikia perskaityti : perskaitykite, kas yra „TensorFlow“? ir suprasti, kas vyksta žemiau, kai kalbama apie šią galingą giluminio mokymosi sistemą.

Vienas dalykas, kurį reikia padaryti : „TensorFlow“ ir „Deep Learning“ be daktaro laipsnio yra „Google“ sukurtas interaktyvus kursas, kuris sujungia į skaidres pateikiamą teoriją su praktinėmis laboratorijomis su kodu.

6. Pradėkite dirbti su dideliais gamybos lygio duomenų rinkiniais

Dabar, kai dirbote su giluminėmis mokymosi sistemomis, galite pradėti kurti didelius gamybos lygio duomenų rinkinius.

Būdami mašinų mokymosi inžinieriumi, priimsite sudėtingus inžinerinius sprendimus tvarkydami didelį duomenų kiekį ir diegdami savo sistemas.

Tai apims duomenų rinkimą iš API ir žiniatinklio grandymą, SQL + NoSQL duomenų bazes ir, kai juos naudosite, naudosite dujotiekio sistemas, tokias kaip „Luigi“ ar „Airflow“.

Diegdami programas, galite naudoti talpyklų sistemas, tokias kaip „Docker“, kad būtų galima keisti mastelį ir patikimumą, ir įrankius, pvz., „Flask“, kad sukurtumėte API savo programai.

Vienas dalykas, kurį reikia perskaityti : „7 būdai, kaip tvarkyti didelius duomenų failus mašininiam mokymuisi“ yra puikus teorinis pratimas, kaip elgtis su dideliais duomenų rinkiniais, ir gali būti naudingas taktikos kontrolinis sąrašas.

Vienas dalykas, kurį reikia padaryti : Viešai prieinami didelių duomenų rinkiniai yra vietų, kuriose galite gauti labai didelius duomenų rinkinius - pasirengę praktikuoti savo naujai rastus duomenų inžinerijos įgūdžius, sąrašas.

7. Praktikuokis, praktikuokis, praktikuokis, kurk savo darbą ir ieškok darbo

Pagaliau jūs pasiekėte tašką, kur galite sukurti veikiančius mašininio mokymosi modelius. Kitas žingsnis į priekį tobulinant mašininio mokymosi karjerą yra susirasti darbą įmonėje, turinčioje tuos didelius duomenų rinkinius, kad kiekvieną dieną galėtumėte pritaikyti savo įgūdžius pažangiausioms mašininio mokymosi problemoms spręsti.

Vienas dalykas, kurį reikia perskaityti : 41 esminis mašininio mokymosi interviu klausimas (su atsakymais) padės jums praktikuoti žinias, reikalingas mašininio mokymosi interviu.

Vienas dalykas, kurį reikia padaryti : eikite ir raskite susitikimų, kurie skirti mašininiam mokymuisi ar duomenų apdorojimui „Meetup“ - tai puikus būdas susitikti su bendraamžiais erdvėje ir potencialiais samdymo vadovais.

Tikimės, kad ši pamoka padėjo sumažinti protą dėl AI dėl praktiško ir pritaikyto, kurį galite naudoti. Jei jaučiate, kad jums reikia šiek tiek daugiau, įmonė, su kuria dirbu, „Springboard“ siūlo karjeros bėgių pradžios stovyklą, skirtą dirbtiniam intelektui ir mašininiam mokymuisi, su darbo garantija ir mašininio mokymosi ekspertų mentoryste 1: 1.