Selbst ausführen

Selbst ausführen#

Das Buch ist so geschrieben, dass nicht nur alle Quelltextbeispiele vorhanden sind. Es ist sogar möglich, sich das komplette Buch herunterzuladen und alles selbst auszuführen, anzupassen und mit den Beispielen zu experimentieren. Hier ist eine kurze Erklärung, wie das unter Linux (getestet mit Ubuntu 20.04) geht. Windows-Nutzer müssen entweder Python unter Windows installieren oder – wie ich selbst – mit dem Windows Subsystem for Linux (WSL) arbeiten [1]:

Wir beginnen mit dem Installieren der benötigten Linuxpakete. Python sollte bereits installiert sein (mindestens Version 3.6). Wir brauchen noch eine virtuelle Umgebung für Python (venv genannt). Außerdem wird noch Graphviz benötigt, je-doch nur für das Zeichnen der Struktur des neuronalen Netzes in Kapitel 7.
```
sudo apt-get update
sudo apt-get install python3-venv graphviz
```

Jetzt können wir Inhalte herunterladen, entpacken und in den Ordner wechseln.

cd ~
wget https://github.com/sherbold/data-science-crashkurs/archive/refs/heads/main.zip
unzip main.zip
cd data-science-crashkurs-main

Jetzt können wir uns in diesem Ordner eine virtuelle Python-Umgebung erstellen, aktivieren und die benötigten Python-Pakete installieren.
```
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
```
Jetzt muss noch das Jupyter Lab gestartet werden.
```
cd content
jupyter-lab
```
Fertig! Jetzt können wir das Jupyter Lab im Browser öffnen (der Link wird ja angezeigt) und sehen die Jupyter Notebooks für alle Kapitel, mit denen wir alles selbst ausprobieren können. Die Daten für die Übungen sind auch direkt mitgeliefert.

Wenn wir fertig sind, können wir die Notebooks einfach schließen und mit Strg+C das Jupyter Lab im Terminal beenden. Beim nächsten Starten müssen wir nur in den Ordner wechseln, die venv aktivieren und können dann direkt das Jupyter Lab starten.

cd ~
cd data-science-crashkurs-main/content
source venv/bin/activate
jupyter-lab