Kaip apskaičiuoti sąrašo vidurkį - statistika ir „Python“ vidutinė funkcija, paaiškinta išsamiai

Matematika ir programavimas eina koja kojon. Jei esate programuotojas, tam tikru momentu turėsite naudoti matematiką.

Duomenų mokslas, mašininis mokymasis, dirbtinis intelektas ir kriptovaliutos remiasi sudėtingais matematikos principais.

Tačiau matematikos funkcijų naudojimas neturi būti sudėtingas! „Python“ apibendrina viską, todėl, kai suprasite sąvokas, jums nereikės suprasti išsamios įgyvendinimo informacijos.

Matematika neturi būti baisi

Yra daug matematinių funkcijų, su kuriomis susidursite. Jei dirbate su duomenimis ar analitika, svarbu suprasti kai kuriuos matematikos principus ir funkcijas.

Viena iš tokių funkcijų, kurias turite suprasti, yra meanfunkcija.

Negalima atbaidyti nuo vardo - mean„Python “ funkcijoje nėra nieko, kas reiškia (kalambūras) .

Šis įrašas yra savarankiškas, tačiau tikiuosi, kad turite šiek tiek patirties dirbant su „Python“ ir žinote, kas yra „Python“ sąrašas. Jei ne, prieš eidami perskaitykite šį straipsnį.

Kai baigsite, grįžkite ir prisijunkite prie manęs, kad įsigilintumėte į meanfunkciją.

Statistika

Taigi norite sužinoti apie meanfunkciją. Tai puiku! Tačiau prieš pažvelgus į šią funkciją, svarbu pažvelgti į discipliną, iš kurios ji kyla: statistiką.

Aukščiau esančiame paveikslėlyje matome grafiką. Grafikas yra vaizdinis pavaizdavimas, parodantis vieno kintamojo santykį su kitu.

Grafikai yra naudingi, nes jie leidžia mums sutvarkyti duomenis taip, kad galėtume greitai pamatyti duomenų tendencijas ir ryšius. Grafikas yra tik vienas įrankis, kurį galime naudoti vizualizuodami ir analizuodami duomenis.

Statistika yra matematikos šaka, leidžianti sistemingai klasifikuoti, analizuoti ir interpretuoti duomenis. Tai svarbu, nes turėdami statistiką, turime paruoštų įrankių rinkinį kiekvienam iš šių dalykų atlikti.

Įsivaizduokite, jei jums kaskart reikia išradinėti pjūklą, kai reikia iškirpti medienos gabalą. Mes norėtume, kad daugelis žmonių pavadintų pjūklus skirtingais pavadinimais, nors jie daro tą patį. Kad išvengtume šios problemos, pjūklui suteikėme pavadinimą, kuriuo visi gali jį nurodyti.

Tas pats nutinka statistikoje - mes turime visiems gerai žinomus įrankius. Viena tokių priemonių yra vidutinė.

Režimas, Vidutinis ir Vidutinis

Nors vidurkis puikiai sugeba atsistoti vienas, jis paprastai mokomas kaip trio dalis, apimanti režimą, medianą ir vidurkį.

Pažvelkime į skaičių grupę, kad suprastumėte, kas čia vyksta. Įsivaizduokite, kad turite šiuos numerius:

1, 2, 3, 3, 4, 6, 9

Tarkime, kad norėjome išreikšti, kuris skaičius įvyksta daugiausiai kartų. Tai būtų 3, o pavadinimas, kurį mes suteikiame šiai savybei, yra režimas. Režimas yra skaičius, kuris yra dažniausias mūsų tiriamame rinkinyje.

Skaičius, esantis sutvarkyto rinkinio viduryje, vadinamas mediana. Norėdami surasti skaitinio rinkinio medianą, išdėstykite skaičius nuo mažiausio iki didžiausio, tada pažiūrėkite į viduryje esantį skaičių. Aukščiau esantis skaičių rinkinys jau išdėstytas nuo mažiausio iki didžiausio, todėl medianinis skaičius taip pat yra 3.

Pagaliau vidurkis yra dar vienas būdas nurodyti aibės vidurkį. Norėdami rasti vidurkį, tiesiog susumuokite visus skaičius ir padalykite jį iš bendro elementų skaičiaus rinkinyje. Aukščiau pateiktų skaičių atveju, jei mes susumuosime juos visus kartu, gausime 28. Bendras elementų skaičius rinkinyje yra 7, taigi mūsų vidurkis yra 4.

Kodėl mums reikia vidurkio?

Taigi šiuo metu jums gali kilti klausimas, kodėl mums vis tiek reikėtų rasti skaičiaus vidurkį.

Reikalas tas, kad net pati statistika yra suskirstyta į kelias grupes. Kaip ir jūs turite įrankių, naudojamų dirbant su medžiu, o kitų - su metalu, kai kurie statistikos įrankiai yra suskirstyti į klases, nes jie naudojami panašiam tikslui.

Viena tokių statistikos grupių vadinama suvestine statistika. Vienas iš statistikos dalykų yra duomenų aprašymas, o suvestinė statistika yra tam tikslui naudojamų priemonių rinkinys. Vienas iš tos klasės įrankių yra vidutinis.

Vidurkis yra svarbus, nes jis padeda mums analizuoti vadinamąjį paskirstymą. Statistikoje paskirstymas yra metodas, kurį mes naudojame norėdami sužinoti kintamąjį, apie kurį norime informacijos. Naudodami skirstinį, mes apžvelgsime šio kintamojo reikšmes ir tai, kaip dažnai jis įvyksta.

Jei renkame duomenis, įprastas pasiskirstymo tipas yra įprastas pasiskirstymas, kuris yra varpo kreivės forma:

Tai reiškia, kad kintamasis turės bendrą vertę, link kurios jis linkęs, taip pat pradinį ir galutinį taškus.

Tai reiškia, kad tai leidžia mums paimti tokį paskirstymą ir pažvelgti į centrinę kintamojo tendenciją, kuri yra ta vieta, kur kintamojo reikšmės linksta į klasterius.

Taigi galime pasakyti, kad vidurkis apibūdina centrinę skirstinio tendenciją.

Skaičiuojant vidurkį „Python“

Mes galime rankiniu būdu apskaičiuoti vidurkį, jei turime mažą skaitinių duomenų rinkinį, kurį turime naudoti su keliomis reikšmėmis. Tačiau kai duomenų rinkinyje turime šimtus ar tūkstančius reikšmių, tampa neįmanoma jų apskaičiuoti rankomis.

Kadangi „Python“ yra „į baterijas įtraukta“ kalba, tai galime padaryti naudodami „ meanPython“ statistikos modulio funkciją.

Naudokime meanfunkciją, norėdami apskaičiuoti anksčiau įraše pateiktų skaitinių duomenų rinkinio vidurkį:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Mūsų kodas susideda iš 4 žingsnių sekos, kurią galime naudoti vidurkiui apskaičiuoti:

  1. Importuojame statistikos modulį, kuriame yra mūsų vidutinė funkcija
  2. Sukuriame „Python“ sąrašą, kuriame yra skaitinių duomenų rinkinys, kurio vidurkį norėtume apskaičiuoti
  3. Mes apskaičiuojame vidurkį ir išsaugome rezultatą kintamajame, calc_mean
  4. Mes pateikiame apskaičiuotą vidurkį, kad galėtume gauti vizualinį grįžtamąjį ryšį

Vykdydami kodą gausime šią išvestį:

Programa pateikia tą pačią vertę kaip ir mūsų rankiniai skaičiavimai. Kai dirbame su dideliais duomenų rinkiniais, ši funkcija galės keisti mastelį, kad galėtume tvarkyti viską, ką galime į ją išmesti.

Apvyniojimas

Šiame įraše mes pažvelgėme į „ meanPython “ funkciją. Pradėjome aptarinėdami statistiką kaip visumą, tada giliai pasinėrėme į prasmę.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Bekodės duomenų struktūros ir algoritmai - sužinokite DSA nerašydami vienos kodo eilutės Armstrongas Subero | „Apress“ Ši knyga suteikia jums naują požiūrį į algoritmus ir duomenų struktūras, visiškai be kodų. Sužinokite daugiau apie duomenų struktūros algoritmus (DSA) niekada neatidarę kodo rengyklės, nenaudodami kompiliatoriaus ar žiūrėdami į integruotą kūrimo aplinką (IDE) .... „Armstrong Subero“ paieškos meniu krepšelis V Jūsų krepšelis šiuo metu tuščias. Prisijungimo sąskaitaKnygų lentyna Prisijunkite prie „Apress Access“