Werkzeuge
- die Tools, die ich nutze -
Die Programmiersprache R
Während meiner Zeit als Doktorand bin ich schnell dazu übergegangen, die Statistiken und Grafiken ausschließlich mit Open-Source Tools zu erstellen. Üblicherweise werden hier Statistik-Programme wie SPSS, Sigmaplot oder Graphpad Prism benutzt, bei denen sich der Nutzer durch eine gegebene Auswahl an Auswertungs- und Darstellungsmöglichkeiten durchklicken kann. Im Sinne der Reproduzierbarkeit und Transparenz der Analysen bietet die Programiersprache R aus meiner Sicht klare Vorteile. Hier "programmiert" man die einzelnen Schritte
- Einlesen der Daten
- Veränderung der Formatierung der Daten
- Berechnung von statistischen Werten
- Visualisierung
wobei der Programm-Code für jeden nachvollziehbar das gesamte Prozedere exakt widerspiegelt und man so eine Analyse mit leicht veränderten oder aktualisierten Daten schnell wiederholen kann. Außerdem bietet R die Möglichkeit, die Basisfunktionalitäten über sogenannte Zusatzpakete vielfältig zu erweitern.
Bei meinen Analysen und Visualisierungen nutze ich u.a. folgende Zusatzpakete:
| Paket | Beschreibung |
|---|---|
| Daten bekommen/auslesen: | |
| tibble | Repräsentation der Datentabelle als Datenstruktur (Alternative zum "dataframe" mit übersichtlicher print-Funktion u.a. Anpassungen) |
| readr | Einlesen von Daten aus csv u.a. textbasierten Datendateien |
| readxl | Einlesen von Daten aus Excel |
| pdftools | Texte aus pdf-Dateien einlesen |
| rvest | Daten aus Webseiten auslesen |
| eurostat | Daten aus der Eurostat Datenbanken auslesen |
| Daten umformen: | |
| x | x |
| x | x |
| x | x |
| x | x |
| x | x |
| x | x |
| Visualisierungen: | |
| x | x |
| x | x |
| x | x |
| x | x |
| x | x |
| x | x |
| x | x |
| x | x |
| Statistik: | |
| x | x |
| x | x |
| x | x |
| Finanzanalysen: | |
| tidyquant | Sammeln and Analysieren von Finanzdaten nach "tidy"-Art |
| quantmod | Quantitatives Finanzmodelliierungs- & Trading-Framework für R |
| PerformanceAnalytics | Performance und Risikoanalyse |
| zoo | Zeitreihen |
| xts | Zeitreihen |
| TTR | technische Indikatoren |
| Durchflusszytometrie: | |
| openCyto | Auswertung von Durchflusszytometrie-Daten mittels automatisiertes regelbasiertes Gating |
| ggcyto | Visualisierung von Durchflusszytometrie-Daten |
| flowSOM | Clustering |
| flow*-Familie | Basisfunktionalität für die Auswertung von Durchflusszytometrie-Daten, Clustering, Annotation, Kontrolle der Datenqualität etc. |
Inkscape
Ein Vektorzeichenprogramm, dass ich nutze um ggf. Kleinigkeiten an den Grafiken per Hand anzupassen.
Gimp
Für den Fall, dass ich Fotos bearbeiten muss.