Werkzeuge
- die Tools, die ich nutze -
Die Programmiersprache R
Während meiner Zeit als Doktorand bin ich schnell dazu übergegangen, die Statistiken und Grafiken ausschließlich mit Open-Source Tools zu erstellen. Üblicherweise werden hier Statistik-Programme wie SPSS, Sigmaplot oder Graphpad Prism benutzt, bei denen sich der Nutzer durch eine gegebene Auswahl an Auswertungs- und Darstellungsmöglichkeiten durchklicken kann. Im Sinne der Reproduzierbarkeit und Transparenz der Analysen bietet die Programiersprache R aus meiner Sicht klare Vorteile. Hier "programmiert" man die einzelnen Schritte
- Einlesen der Daten
- Veränderung der Formatierung der Daten
- Berechnung von statistischen Werten
- Visualisierung
wobei der Programm-Code für jeden nachvollziehbar das gesamte Prozedere exakt widerspiegelt und man so eine Analyse mit leicht veränderten oder aktualisierten Daten schnell wiederholen kann. Außerdem bietet R die Möglichkeit, die Basisfunktionalitäten über sogenannte Zusatzpakete vielfältig zu erweitern.
Bei meinen Analysen und Visualisierungen nutze ich u.a. folgende Zusatzpakete:
Paket | Beschreibung |
---|---|
Daten bekommen/auslesen: | |
tibble | Repräsentation der Datentabelle als Datenstruktur (Alternative zum "dataframe" mit übersichtlicher print-Funktion u.a. Anpassungen) |
readr | Einlesen von Daten aus csv u.a. textbasierten Datendateien |
readxl | Einlesen von Daten aus Excel |
pdftools | Texte aus pdf-Dateien einlesen |
rvest | Daten aus Webseiten auslesen |
eurostat | Daten aus der Eurostat Datenbanken auslesen |
Daten umformen: | |
x | x |
x | x |
x | x |
x | x |
x | x |
x | x |
Visualisierungen: | |
x | x |
x | x |
x | x |
x | x |
x | x |
x | x |
x | x |
x | x |
Statistik: | |
x | x |
x | x |
x | x |
Finanzanalysen: | |
tidyquant | Sammeln and Analysieren von Finanzdaten nach "tidy"-Art |
quantmod | Quantitatives Finanzmodelliierungs- & Trading-Framework für R |
PerformanceAnalytics | Performance und Risikoanalyse |
zoo | Zeitreihen |
xts | Zeitreihen |
TTR | technische Indikatoren |
Durchflusszytometrie: | |
openCyto | Auswertung von Durchflusszytometrie-Daten mittels automatisiertes regelbasiertes Gating |
ggcyto | Visualisierung von Durchflusszytometrie-Daten |
flowSOM | Clustering |
flow*-Familie | Basisfunktionalität für die Auswertung von Durchflusszytometrie-Daten, Clustering, Annotation, Kontrolle der Datenqualität etc. |
Inkscape
Ein Vektorzeichenprogramm, dass ich nutze um ggf. Kleinigkeiten an den Grafiken per Hand anzupassen.
Gimp
Für den Fall, dass ich Fotos bearbeiten muss.