Het gemiddelde berekenen met Python
Python is uitermate geschikt voor het bewerken van data. Het berekenen van het gemiddelde is een veel voorkomende handeling om te verrichten op een dataset. Het berekenen van het gemiddelde is een basishandeling binnen de statistiek. Een gemiddelde kan namelijk erg veel zeggen over een groep. Of je nu de gemiddelde leeftijd binnen een groep mensen wilt achterhalen of de gemiddelde prijs voor een aandeel probeert te herleiden. Er zijn verschillende manieren mogelijk om deze waarde te achterhalen. In de onderstaande voorbeelden maken we gebruik van de volgende dataset:dataset = [4, 15, 15, 12, 20, 3, 7, 6]
Zo bereken je het gemiddelde in Python
Het gemiddelde in een dataset bereken je door alle getallen bij elkaar op te tellen gedeeld door het aantal getallen in de set. De formule voor het berekenen van het gemiddelde ziet er als volgt uit:
Gemiddelde = (de som van de getallen)/het aantal getallen
Gemiddelde = (3 + 4 + 6 + 7 + 12 + 15 + 15 + 20)/8 = 10.25
Wanneer je de som vertaalt naar Python kun je gebruik maken van de in Python standaard ingebouwde Len()
en Sum()
methods. De Len()
method is een afkorting van ‘length’ en telt het aantal aantal elementen in een lijst. In het onderstaande voorbeeld wordt de variable 'lengte'
gelijk aan 8
omdat de Len()
method 8 verschillende getallen ziet in de dataset. De sum() method in Python telt alle waarden van de getallen in een lijst bij elkaar op. Door deze twee functies met elkaar te combineren kunnen we het gemiddelde eenvoudig berekenen.
dataset = [4, 15, 15, 12, 20, 3, 7, 6]
lengte = len(dataset)
som = sum(dataset)
gemiddelde = som / lengte
print("Het gemiddelde is: " + str(gemiddelde))
Let op, om het gemiddelde uiteindelijk te kunnen printen dienen we het eerst te converteren naar een string dmv de str()
method. Bovenstaande is overzichtelijk en schaalbaar. Dat wil zeggen dat we in zo min mogelijk lijnen code een oplossing hebben gevonden die werkt ongeacht het aantal getallen in de lijst.
Het gemiddelde berekenen met de Statistics Library
Een eenvoudige manier om het gemiddelde te bepalen is door gebruik te maken van de Statistics library. In deze library kun je gebruikmaken van de mean functie. Door de dataset in de parameter mee te geven kun je gewenste getallen herleiden.
import statistics
dataset = [4, 15, 15, 12, 20, 3, 7, 6]
mean = statistics.mean(dataset)
print("Het gemiddelde is: " + str(mean))
Benieuwd naar meer populaire bewerkingen op een dataset? Lees hier over het vinden van de mediaan of de modus. Ook hebben we een artikel geschreven over het afronden van getallen.
Oefenen op echte datasets? Ga aan de slag met de public data sets van Google.