Selbst ausführen#

Das Buch ist so geschrieben, dass nicht nur alle Quelltextbeispiele vorhanden sind. Es ist sogar möglich, sich das komplette Buch herunterzuladen und alles selbst auszuführen, anzupassen und mit den Beispielen zu experimentieren. Hier ist eine kurze Erklärung, wie das unter Linux (getestet mit Ubuntu 20.04) geht. Windows-Nutzer müssen entweder Python unter Windows installieren oder – wie ich selbst – mit dem Windows Subsystem for Linux (WSL) arbeiten 1:

  1. Wir beginnen mit dem Installieren der benötigten Linuxpakete. Python sollte bereits installiert sein (mindestens Version 3.6). Wir brauchen noch eine virtuelle Umgebung für Python (venv genannt). Außerdem wird noch Graphviz benötigt, je-doch nur für das Zeichnen der Struktur des neuronalen Netzes in Kapitel 7.

    sudo apt-get update
    sudo apt-get install python3-venv graphviz
    
  2. Jetzt können wir Inhalte herunterladen, entpacken und in den Ordner wechseln.

    cd ~
    wget https://github.com/sherbold/data-science-crashkurs/archive/refs/heads/main.zip
    unzip main.zip
    cd data-science-crashkurs-main
    
  3. Jetzt können wir uns in diesem Ordner eine virtuelle Python-Umgebung erstellen, aktivieren und die benötigten Python-Pakete installieren.

    python3 -m venv venv
    source venv/bin/activate
    pip install -r requirements.txt
    
  4. Jetzt muss noch das Jupyter Lab gestartet werden.

    cd content
    jupyter-lab
    
  5. Fertig! Jetzt können wir das Jupyter Lab im Browser öffnen (der Link wird ja angezeigt) und sehen die Jupyter Notebooks für alle Kapitel, mit denen wir alles selbst ausprobieren können. Die Daten für die Übungen sind auch direkt mitgeliefert.

Wenn wir fertig sind, können wir die Notebooks einfach schließen und mit Strg+C das Jupyter Lab im Terminal beenden. Beim nächsten Starten müssen wir nur in den Ordner wechseln, die venv aktivieren und können dann direkt das Jupyter Lab starten.

cd ~
cd data-science-crashkurs-main/content
source venv/bin/activate
jupyter-lab

1

https://ubuntu.com/wsl