Webinar: Data Analysis Bootcamp mit R
Startdaten und Startorte
computer Online: Zoom 7. Okt 2024 bis 11. Okt 2024 |
Beschreibung
Unser 5-tägiger Data Analysis Bootcamp vermittelt in einzeln buchbaren Modulen Grundkenntnisse in R (Modul 1), praktisches Wissen zur deskriptiven Datenanalyse, der statisischen Inferenz und Modellierung in R (Modul 2), sowie fortgeschrittene Kenntnisse zur effizienten Nutzung von R (Modul 3). Für die Anwendungsbeispiele und praktische Übungsaufgaben kommt die statistische Software R zum Einsatz.
Die einzelnen Themenblöcke können auf unserer Webseite auch separat als eigenständige Kurse gebucht werden.
Modul 1 (1-tägig): R Crashkurs - Erste Schritte der Datenanalyse
An diesem Kurstag erlernen Teilnehmer den Umgang mit der statistischen Software R und erste Schritte um mit R einfache Analy…
Frequently asked questions
Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
Unser 5-tägiger Data Analysis Bootcamp vermittelt in einzeln buchbaren Modulen Grundkenntnisse in R (Modul 1), praktisches Wissen zur deskriptiven Datenanalyse, der statisischen Inferenz und Modellierung in R (Modul 2), sowie fortgeschrittene Kenntnisse zur effizienten Nutzung von R (Modul 3). Für die Anwendungsbeispiele und praktische Übungsaufgaben kommt die statistische Software R zum Einsatz.
Die einzelnen Themenblöcke können auf unserer Webseite auch separat als eigenständige Kurse gebucht werden.
Modul 1 (1-tägig): R Crashkurs - Erste Schritte der Datenanalyse
An diesem Kurstag erlernen Teilnehmer den Umgang mit der statistischen Software R und erste Schritte um mit R einfache Analysen durchführen. Die hier vermittelten R Grundlagen helfen dabei die Anwendungsbeispiele und praktische Übungsaufgaben der nachfolgenden Kurstage besser zu verstehen. Der Kurstag ist sowohl für R Anfänger als auch für Teilnehmer gedacht, die R Kenntnisse in einer strukturierten Einführung erlernen oder auffrischen möchten. Wer bereits ausreichende R Kenntnisse besitzt, kann auf diesen Tag verzichten.
Modul 2 (2-tägig): Praktische Datenanalyse in R
Kursteilnehmer sollen mit den wichtigsten Konzepten und Begriffen in Data Science, Statistik und der Datenanalyse vertraut gemacht werden und lernen erste explorative Analysen in verschiedenen Datensituationen durchzuführen.
Themenschwerpunkte Teil 1: Grundlagen der Statistik und Datenanalyse in R
-
Definition von Data Science und weiterer Grundbegriffe
-
Einführung in ggplot2 zur Visualisierung von Daten
-
Univariate Deskriptive Statistik und Datenvisualisierung in R: Häufigkeitstabellen, Balkendiagramme, Histogramme, Kerndichteschätzung, Boxplots, Dichten und Verteilungen, QQ-Plots, etc.
-
Multivariate Deskriptive Statistik und Datenvisualisierung in R: Kreuztabellen, Scatter-Plots, Korrelation
Themenschwerpunkte Teil 2: Statistische Inferenz und Modellierung in R
-
Einführung in die statistische Inferenz: Punktschätzung, Intervallschätzung und Konfidenzintervalle
-
Statistische Hypothesentests:
-
Motivation und Übersicht: Einstichproben vs. zweistichproben Test, einseitiger vs. zweiseitiger Test, gepaarter vs. ungepaarter Tests
-
Interpretation der Ergebnisse und Begriffserklärung: Signifikanzniveau, p-Wert, Teststatistik, etc.
-
Behandelte Tests: t-Test, Welch-Test (Test auf Mittelwertunterschiede), Mann-Whitney-U-Test bzw. Wilcoxon-Rangsummentest, Shapiro-Wilk-Test (Test auf Normalverteilung), Kolmogoroff-Smirnow-Test (Test auf beliebige Verteilungen)
-
Multiples Testen: Probleme und Lösungsansätze (z.B. Bonferroni Korrektur)
-
-
Statistische Modellierung:
-
Das lineare Regressionsmodell mit Erweiterungen wie multipler Regression und Verwendung von kategorischen Einflussgrößen.
-
Modellevaluation und Modelldiagnose: MSE, R-squared, QQ-plots und Residuenanalyse
-
Ausblick: Generalisierte lineare Modelle (engl. generalized linear models) mit Fokus auf logistische Regression
-
Modul 3 (2-tägig): Effiziente Datenverarbeitung und Programmierung in R
Datenmanipulation und Verarbeitung kann oft eine der zeitaufwendigsten Tätigkeiten in einer statistischen Analyse sein. In diesem Kurs werden Fähigkeiten vermittelt um effizient auch mit größeren Datenmengen in R arbeiten zu können. Nach dem Kurs sollen Teilnehmer in der Lage sein effizient in R arbeiten zu können, sowie Datenvorverarbeitung klarer, einfacher und schneller durchführen zu können.
Themenschwerpunkte Teil 1: Effiziente Datenverarbeitung in R
-
Kurzer Überblick wichtiger R packages für fortgeschrittene Datenanalyse
-
Schnelle und intuitive Datenmanipulation mit dem dplyr Package:
Wenn viele Datenvorverarbeitungsschritte nacheinander durchgeführt werden, wird Programmcode schnell unübersichtlich und ineffizient (z.B. durch abspeichern unnötiger Zwischenschritte). Das dplyr Package erlaubt sog. chaining-Operatoren, womit R Code wesentlich effizienter und übersichtlicher dargestellt werden kann. -
Split / Apply / Combine in R: Allgemeinen Vorgang einen Datensatz in kleine Teildatensätze aufzuteilen, auf jedem Teildatensatz Operationen auszuführen und die Ergebnisse wieder zusammenzufügen.
-
Datenbanken in R
-
Einführung in das DBI package und der Nutzung von SQL Anfragen direkt in R
-
Vereinfachte Datenbankanbindung mit dplyr und dbplyr
-
Kurzer Ausblick zu weiteren R Paketen für spezielle Datenbanken
-
-
Automatisierte Berichterstellung, Reporting und literate Programming
-
Einführung in die Markdown Syntax mit Hilfe der Erweiterungspakete rmarkdown bzw. knitr.
-
Automatisierte Erstellung von dynamischen Berichten und Präsentationen, um wiederkehrende Analysen zeitsparend zu produzieren und voll reproduzierbar zu gestalten.
-
Professionelle Präsentation von Analyseergebnissen durch das gleichzeitige Einbinden von Grafiken, Tabellen und R-Code in Berichten ohne Copy & Paste, z.B. in Dateiformate wie PDF, Word oder HTML.
-
Themenschwerpunkte Teil 2: Fortgeschrittene R Programmierung
-
Programming with R: Basics
-
Anwenden von Kontrollstrukturen (if, else) für bedingte Anweisungen (sog. WENN-DANN-SONST Funktionalität).
-
Anwenden von Schleifen (for, while) und apply Funktionen für das effiziente Ausführen von repetitiven und iterativem R-Code.
-
Debugging, Exception und Error Handling
-
Einführung in die objektorientierte Programmierung mit R mit den beiden beliebtesten Klassensystemen S3 und R6.
-
-
Effizientes Arbeiten mit tabularen Daten und dem data.table Package: Filtering, Selecting, Grouping, Reshaping.
-
Effiziente Datenverarbeitung mit funktionaler Programmierung und dem purrr Package: Arbeiten mit Listen und genesteten Datenstrukturen.
-
Parallelisierung von R Code
Schreiben Sie eine Bewertung
Haben Sie Erfahrung mit diesem Webinar? Schreiben Sie jetzt eine Bewertung und helfen Sie Anderen dabei die richtige Weiterbildung zu wählen. Als Dankeschön spenden wir € 1,00 an Stiftung Edukans.Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!