Teil 6: Einführung in Python – Installation & Setup

Python ist eine der beliebtesten Programmiersprachen für Data Science – und das aus gutem Grund: Sie ist einfach zu lernen, vielseitig und leistungsstark. In diesem Teil der Serie zeigen wir, wie man Python installiert, welche Tools und Umgebungen sinnvoll sind und wie du deine erste Python-Umgebung startklar machst.


Warum Python für Data Science?

Python ist ideal für Data Science, weil es:

  • Einsteigerfreundlich ist: Die Syntax ist klar und leicht verständlich
  • Große Bibliotheken für Datenanalyse und Machine Learning bietet (z. B. Pandas, NumPy, Scikit-Learn)
  • Vielseitig einsetzbar ist – von Datenanalyse über Webentwicklung bis hin zu KI
  • Eine große Community hat, sodass Probleme schnell gelöst werden können

Kurz gesagt: Python ist die perfekte Grundlage, um Daten zu verstehen, zu analysieren und Modelle zu bauen.


1. Python installieren

Schritt 1: Python-Version auswählen

Für Data Science empfiehlt sich die aktuelle stabile Version von Python 3 (z. B. Python 3.12). Python 2 wird nicht mehr unterstützt.

Schritt 2: Python herunterladen

Schritt 3: Installation unter Windows

  1. Installer ausführen
  2. Wichtig: Haken setzen bei „Add Python to PATH“
  3. Installation starten und warten, bis sie abgeschlossen ist
  4. Überprüfen, ob Python installiert ist: python --version oder py --version

Schritt 4: Installation unter macOS

  1. Über Homebrew installieren (empfohlen): brew install python
  2. Version prüfen: python3 --version

Schritt 5: Installation unter Linux

  • Bei Ubuntu/Debian: sudo apt update sudo apt install python3 python3-pip
  • Version prüfen: python3 --version

2. Python IDEs und Entwicklungsumgebungen

Eine IDE (Integrated Development Environment) erleichtert das Programmieren erheblich. Beliebte Optionen:

  1. VS Code
    • Kostenlos, flexibel, viele Extensions
    • Unterstützt Python, Jupyter Notebooks und Git
  2. PyCharm
    • Professionelle IDE mit vielen Funktionen
    • Community Edition kostenlos
  3. Jupyter Notebook / JupyterLab
    • Interaktive Umgebung, ideal für Data Science
    • Code-Zellen, Visualisierungen und Markdown in einem Dokument
  4. Anaconda Distribution
    • Python + über 150 Data-Science-Pakete
    • Enthält Jupyter Notebook, Spyder, Pandas, NumPy, Matplotlib

3. Erste Schritte in Python

Python-Konsole starten

  • Windows: python oder py in der Eingabeaufforderung
  • macOS/Linux: python3 im Terminal
>>> print("Hello, Python!")
Hello, Python!

Erste Python-Datei erstellen

  1. Datei erstellen: hello.py
  2. Inhalt: print("Hallo Data Science!")
  3. Ausführen: python hello.py

4. Virtuelle Umgebungen vorbereiten

Für Data-Science-Projekte empfiehlt es sich, virtuelle Umgebungen zu nutzen. Sie isolieren Pakete, sodass unterschiedliche Projekte nicht in Konflikt geraten.

Erstellen einer virtuellen Umgebung

python -m venv mein_projekt_env

Aktivieren der Umgebung

  • Windows: mein_projekt_env\Scripts\activate
  • macOS/Linux: source mein_projekt_env/bin/activate

Pakete installieren

pip install pandas numpy matplotlib scikit-learn

Deaktivieren der Umgebung

deactivate

5. Installation von Jupyter Notebook

Jupyter Notebook ist das Herzstück vieler Data-Science-Projekte. Installation:

pip install notebook

Starten:

jupyter notebook
  • Browser öffnet sich automatisch
  • Neue Notebooks erstellen: Python 3 auswählen
  • Code-Zellen ausführen: Shift + Enter

6. Praxisbeispiel: Erste Datenanalyse in Python

import pandas as pd

# CSV-Datei einlesen
df = pd.read_csv("beispiel_daten.csv")

# Erste fünf Zeilen anzeigen
print(df.head())

# Grundlegende Statistik
print(df.describe())
  • Hier siehst du sofort Mittelwerte, Standardabweichung, Min/Max-Werte
  • Ein einfacher Einstieg in die Datenanalyse mit Python

7. Tipps für Einsteiger

  1. Regelmäßig üben – Python lernt man am besten durch praktische Projekte
  2. Kommentare nutzen – erkläre deinen Code mit #
  3. Dokumentation lesen – offizielle Python-Dokumentation ist sehr hilfreich
  4. Kleine Schritte – beginne mit einfachen Aufgaben, bevor du komplexe Analysen machst

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert