In Python sind Module und Packages zentrale Werkzeuge, um Code zu strukturieren, wiederzuverwenden und zu organisieren. Sie ermöglichen es, fertige Funktionen und Bibliotheken zu nutzen, z. B. für Data Science: Pandas, NumPy oder Matplotlib. In diesem Teil lernst du, wie Module und Packages funktionieren, wie man sie importiert und eigene erstellt.
1. Was ist ein Modul?
Ein Modul ist eine Datei mit Python-Code (.py), die Funktionen, Klassen oder Variablen enthält. Module helfen dabei, Code zu strukturieren und wiederzuverwenden.
Beispiel: Ein eigenes Modul
Erstelle eine Datei mathe_tools.py:
# mathe_tools.py
def addiere(a, b):
return a + b
def multipliziere(a, b):
return a * b
Jetzt kannst du das Modul in einem anderen Skript verwenden:
import mathe_tools
print(mathe_tools.addiere(5, 3)) # 8
print(mathe_tools.multipliziere(5, 3)) # 15
2. Importieren von Modulen
Python bietet mehrere Möglichkeiten, Module zu importieren:
- Ganz importieren
import math
print(math.sqrt(16)) # 4.0
- Bestimmte Funktion importieren
from math import sqrt
print(sqrt(25)) # 5.0
- Alias verwenden
import pandas as pd
data = pd.DataFrame()
- Aliase sparen Tipparbeit, z. B.
pdfür Pandas,npfür NumPy
3. Standardmodule
Python kommt mit vielen Standardmodulen, die keine Installation erfordern:
math– mathematische Funktionenrandom– Zufallszahlendatetime– Datum und Zeitos– Betriebssystem-Operationensys– Systeminformationen
Beispiele
import random
print(random.randint(1, 10)) # Zufallszahl 1-10
from datetime import datetime
jetzt = datetime.now()
print(jetzt)
4. Packages
Ein Package ist eine Sammlung von Modulen in einem Verzeichnis mit einer __init__.py Datei. Packages ermöglichen größere Projekte zu organisieren.
Struktur eines Packages
mein_package/
__init__.py
modul1.py
modul2.py
__init__.pymarkiert das Verzeichnis als Package- Module können importiert werden:
from mein_package import modul1
5. Installation von Drittanbieter-Paketen
Für Data Science nutzen wir Pakete, die nicht standardmäßig installiert sind, z. B. Pandas, NumPy, Matplotlib.
Mit pip installieren
pip install pandas
pip install numpy matplotlib
- Pip ist der Python Package Installer
- Virtuelle Umgebungen sind sinnvoll, um Pakete projektspezifisch zu installieren
Installation prüfen
import pandas as pd
import numpy as np
print(pd.__version__)
print(np.__version__)
6. Praxisbeispiele: Nützliche Module in Data Science
NumPy – numerische Berechnungen
import numpy as np
array = np.array([1, 2, 3, 4])
print(array.mean()) # 2.5
print(array.sum()) # 10
Pandas – Datenanalyse
import pandas as pd
data = pd.DataFrame({
"Name": ["Anna", "Ben", "Clara"],
"Alter": [28, 35, 22]
})
print(data.describe()) # Statistische Übersicht
Matplotlib – Visualisierung
import matplotlib.pyplot as plt
x = [1, 2, 3, 4]
y = [10, 20, 25, 30]
plt.plot(x, y)
plt.title("Beispielgrafik")
plt.show()
7. Eigene Module in Data Science
In größeren Projekten empfiehlt es sich, eigene Module zu erstellen, z. B.:
daten_cleaning.py– Funktionen zur Datenbereinigungvisualisierung.py– Plot-Funktionenberechnungen.py– Berechnungen für KPIs
Beispiel:
# daten_cleaning.py
import pandas as pd
def fehlende_werte_auffuellen(df, spalte, wert):
df[spalte].fillna(wert, inplace=True)
return df
Import im Hauptskript:
import daten_cleaning as dc
df = pd.DataFrame({"Alter": [28, None, 22]})
df = dc.fehlende_werte_auffuellen(df, "Alter", 30)
print(df)
Schreibe einen Kommentar