First page Back Continue Last page Overview Image

Fehlende Daten

Ein häufiges Problem bei der Datenanalyse besteht in unvollstädnigen Daten.

>>> import pandas as pd

>>> cities = {"London": 8615246, "Berlin": 3562166, "Madrid": 3165235, "Rome": 2874038, "Paris": 2273305}

>>> my_cities = ["London", "Paris", "Zurich", "Berlin", "Stuttgart", "Hamburg"]

>>> my_city_series = pd.Series(cities, index=my_cities)

>>> my_city_series

London 8615246.0

Paris 2273305.0

Zurich NaN

Berlin 3562166.0

Stuttgart NaN

Hamburg NaN dtype: float64

Städte, die nicht im Dictionary vorkommen, erhalten NaN zugewiesen.

NaN steht für "not a number". Man kann es auch als "missing" oder „fehlend“ verstehen.