Kategorie: Data Science

  • Teil 11: Module und Packages

    In Python sind Module und Packages zentrale Werkzeuge, um Code zu strukturieren, wiederzuverwenden und zu organisieren. Sie ermöglichen es, fertige Funktionen und Bibliotheken zu nutzen, z. B. für Data Science: Pandas, NumPy oder Matplotlib. In diesem Teil lernst du, wie Module und Packages funktionieren, wie man sie importiert und eigene erstellt. 1. Was ist ein Modul?…

  • Teil 12: Fehlerbehandlung & Exceptions

    In Python können beim Programmieren Fehler auftreten, z. B. durch falsche Eingaben, fehlende Dateien oder unerwartete Daten. In Data Science ist das besonders relevant, da Datensätze unvollständig oder fehlerhaft sein können. Mit Fehlerbehandlung und Exceptions wird dein Code robust, stabil und sicher. 1. Was sind Exceptions? Eine Exception ist ein Fehler, der während der Programmausführung auftritt.…

  • Teil 13: Arbeiten mit Dateien (txt, csv)

    In Data Science sind Dateien das Herzstück der Datenbeschaffung. Ob CSVs, Textdateien oder Excel-Tabellen – der Umgang mit Dateien ist essenziell, um Daten zu laden, zu analysieren und zu speichern. In diesem Teil lernst du, wie man in Python Text- und CSV-Dateien effizient bearbeitet. 1. Grundlegender Umgang mit Dateien In Python gibt es die eingebaute…

  • Teil 14: Python-Kommentare, Docstrings und Best Practices

    In Python ist lesbarer, gut dokumentierter Code entscheidend – besonders in Data Science, wo Teams häufig zusammenarbeiten und große Projekte betreuen. Kommentare und Docstrings helfen, den Code klar zu strukturieren und verständlich zu machen. Außerdem zeigen wir Best Practices, um sauberen, wartbaren und effizienten Python-Code zu schreiben. 1. Kommentare in Python Kommentare sind Text im…

  • Teil 15: Virtuelle Umgebungen & pip

    In Python-Projekten ist es entscheidend, Abhängigkeiten sauber zu verwalten. Virtuelle Umgebungen ermöglichen es, verschiedene Projekte isoliert zu betreiben, sodass Pakete und Versionen nicht miteinander in Konflikt geraten. pip ist das Standardwerkzeug, um Python-Pakete zu installieren und zu verwalten. In diesem Teil lernst du, wie du virtuelle Umgebungen erstellst, aktivierst und Pakete installierst. 1. Warum virtuelle…

  • Teil 16: Einführung in Jupyter Notebooks

    Jupyter Notebooks sind eines der wichtigsten Werkzeuge für Data Science. Sie ermöglichen es, Code, Text, Visualisierungen und Formeln in einem interaktiven Dokument zu kombinieren. Notebooks sind ideal, um Daten zu analysieren, Ergebnisse zu dokumentieren und Erkenntnisse zu präsentieren. 1. Was ist ein Jupyter Notebook? Ein Jupyter Notebook ist eine webbasierte Anwendung, die Python-Code (oder andere…

  • Teil 17: Arbeiten mit Pandas Series

    In Data Science ist Pandas eine der wichtigsten Bibliotheken, um Daten zu analysieren und zu transformieren. Eine der grundlegenden Datenstrukturen in Pandas ist die Series – eine ein-dimensionale, beschriftete Liste, die sowohl Werte als auch Indizes enthält. In diesem Teil lernst du, wie man Series erstellt, manipuliert und analysiert. 1. Was ist eine Pandas Series?…

  • Teil 18: Arbeiten mit Pandas DataFrames

    Ein DataFrame ist die zentrale Datenstruktur in Pandas und wird für die Analyse und Verarbeitung von tabellarischen Daten verwendet. Man kann es sich wie ein Excel- oder SQL-Table vorstellen: Zeilen entsprechen Datensätzen, Spalten den Attributen. In diesem Teil lernst du, wie man DataFrames erstellt, bearbeitet, filtert und analysiert. 1. DataFrame erstellen Aus einem Dictionary Ausgabe:…

  • Teil 19: Daten laden: CSV, Excel, SQL

    Ein zentraler Schritt in jedem Data-Science-Projekt ist das Laden von Daten. Daten kommen aus verschiedenen Quellen wie CSV-Dateien, Excel-Tabellen oder SQL-Datenbanken. In diesem Teil lernst du, wie man verschiedene Datenquellen mit Python und Pandas einliest, überprüft und für Analysen vorbereitet. 1. CSV-Dateien laden CSV (Comma Separated Values) ist eines der häufigsten Formate für tabellarische Daten.…

  • Teil 20: Daten speichern: CSV, Excel, SQL

    In Data-Science-Projekten ist es nicht nur wichtig, Daten zu laden, sondern auch ergebnisse zu speichern. Dies kann nach der Datenanalyse, nach Berechnungen oder nach Machine-Learning-Prozessen notwendig sein. Python und Pandas bieten dafür einfach zu nutzende Funktionen, um Daten in CSV-, Excel- oder SQL-Datenbanken zu speichern. In diesem Teil lernst du, wie man Daten effizient speichert…