Teil 11: Module und Packages

In Python sind Module und Packages zentrale Werkzeuge, um Code zu strukturieren, wiederzuverwenden und zu organisieren. Sie ermöglichen es, fertige Funktionen und Bibliotheken zu nutzen, z. B. für Data Science: Pandas, NumPy oder Matplotlib. In diesem Teil lernst du, wie Module und Packages funktionieren, wie man sie importiert und eigene erstellt.


1. Was ist ein Modul?

Ein Modul ist eine Datei mit Python-Code (.py), die Funktionen, Klassen oder Variablen enthält. Module helfen dabei, Code zu strukturieren und wiederzuverwenden.

Beispiel: Ein eigenes Modul

Erstelle eine Datei mathe_tools.py:

# mathe_tools.py

def addiere(a, b):
    return a + b

def multipliziere(a, b):
    return a * b

Jetzt kannst du das Modul in einem anderen Skript verwenden:

import mathe_tools

print(mathe_tools.addiere(5, 3))       # 8
print(mathe_tools.multipliziere(5, 3)) # 15

2. Importieren von Modulen

Python bietet mehrere Möglichkeiten, Module zu importieren:

  1. Ganz importieren
import math
print(math.sqrt(16))  # 4.0
  1. Bestimmte Funktion importieren
from math import sqrt
print(sqrt(25))  # 5.0
  1. Alias verwenden
import pandas as pd
data = pd.DataFrame()
  • Aliase sparen Tipparbeit, z. B. pd für Pandas, np für NumPy

3. Standardmodule

Python kommt mit vielen Standardmodulen, die keine Installation erfordern:

  • math – mathematische Funktionen
  • random – Zufallszahlen
  • datetime – Datum und Zeit
  • os – Betriebssystem-Operationen
  • sys – Systeminformationen

Beispiele

import random
print(random.randint(1, 10))  # Zufallszahl 1-10

from datetime import datetime
jetzt = datetime.now()
print(jetzt)

4. Packages

Ein Package ist eine Sammlung von Modulen in einem Verzeichnis mit einer __init__.py Datei. Packages ermöglichen größere Projekte zu organisieren.

Struktur eines Packages

mein_package/
    __init__.py
    modul1.py
    modul2.py
  • __init__.py markiert das Verzeichnis als Package
  • Module können importiert werden:
from mein_package import modul1

5. Installation von Drittanbieter-Paketen

Für Data Science nutzen wir Pakete, die nicht standardmäßig installiert sind, z. B. Pandas, NumPy, Matplotlib.

Mit pip installieren

pip install pandas
pip install numpy matplotlib
  • Pip ist der Python Package Installer
  • Virtuelle Umgebungen sind sinnvoll, um Pakete projektspezifisch zu installieren

Installation prüfen

import pandas as pd
import numpy as np

print(pd.__version__)
print(np.__version__)

6. Praxisbeispiele: Nützliche Module in Data Science

NumPy – numerische Berechnungen

import numpy as np

array = np.array([1, 2, 3, 4])
print(array.mean())   # 2.5
print(array.sum())    # 10

Pandas – Datenanalyse

import pandas as pd

data = pd.DataFrame({
    "Name": ["Anna", "Ben", "Clara"],
    "Alter": [28, 35, 22]
})

print(data.describe())  # Statistische Übersicht

Matplotlib – Visualisierung

import matplotlib.pyplot as plt

x = [1, 2, 3, 4]
y = [10, 20, 25, 30]

plt.plot(x, y)
plt.title("Beispielgrafik")
plt.show()

7. Eigene Module in Data Science

In größeren Projekten empfiehlt es sich, eigene Module zu erstellen, z. B.:

  • daten_cleaning.py – Funktionen zur Datenbereinigung
  • visualisierung.py – Plot-Funktionen
  • berechnungen.py – Berechnungen für KPIs

Beispiel:

# daten_cleaning.py
import pandas as pd

def fehlende_werte_auffuellen(df, spalte, wert):
    df[spalte].fillna(wert, inplace=True)
    return df

Import im Hauptskript:

import daten_cleaning as dc

df = pd.DataFrame({"Alter": [28, None, 22]})
df = dc.fehlende_werte_auffuellen(df, "Alter", 30)
print(df)

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert