Webinar: Data Analysis Bootcamp mit R

Niveau
Dauer
Ausführung
Online
Startdatum und Ort

Webinar: Data Analysis Bootcamp mit R

Essential Data Science Training
Logo von Essential Data Science Training

Sie möchten an dieser Veranstaltung teilnehmen? Melden Sie sich hier an!

Startdaten und Startorte

computer Online: Zoom
7. Okt 2024 bis 11. Okt 2024

Beschreibung

Unser 5-tägiger Data Analysis Bootcamp vermittelt in einzeln buchbaren Modulen Grundkenntnisse in R (Modul 1), praktisches Wissen zur deskriptiven Datenanalyse, der statisischen Inferenz und Modellierung in R (Modul 2), sowie fortgeschrittene Kenntnisse zur effizienten Nutzung von R (Modul 3). Für die Anwendungsbeispiele und praktische Übungsaufgaben kommt die statistische Software R zum Einsatz.

Die einzelnen Themenblöcke können auf unserer Webseite auch separat als eigenständige Kurse gebucht werden.

Modul 1 (1-tägig): R Crashkurs - Erste Schritte der Datenanalyse

An diesem Kurstag erlernen Teilnehmer den Umgang mit der statistischen Software R und erste Schritte um mit R einfache Analy…

Gesamte Beschreibung lesen

Frequently asked questions

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Noch nicht den perfekten Kurs gefunden? Verwandte Themen: Data science mit R., Big Data, Data Science, Data Mining und Data Analytics.

Unser 5-tägiger Data Analysis Bootcamp vermittelt in einzeln buchbaren Modulen Grundkenntnisse in R (Modul 1), praktisches Wissen zur deskriptiven Datenanalyse, der statisischen Inferenz und Modellierung in R (Modul 2), sowie fortgeschrittene Kenntnisse zur effizienten Nutzung von R (Modul 3). Für die Anwendungsbeispiele und praktische Übungsaufgaben kommt die statistische Software R zum Einsatz.

Die einzelnen Themenblöcke können auf unserer Webseite auch separat als eigenständige Kurse gebucht werden.

Modul 1 (1-tägig): R Crashkurs - Erste Schritte der Datenanalyse

An diesem Kurstag erlernen Teilnehmer den Umgang mit der statistischen Software R und erste Schritte um mit R einfache Analysen durchführen. Die hier vermittelten R Grundlagen helfen dabei die Anwendungsbeispiele und praktische Übungsaufgaben der nachfolgenden Kurstage besser zu verstehen. Der Kurstag ist sowohl für R Anfänger als auch für Teilnehmer gedacht, die R Kenntnisse in einer strukturierten Einführung erlernen oder auffrischen möchten. Wer bereits ausreichende R Kenntnisse besitzt, kann auf diesen Tag verzichten.

Modul 2 (2-tägig): Praktische Datenanalyse in R

Kursteilnehmer sollen mit den wichtigsten Konzepten und Begriffen in Data Science, Statistik und der Datenanalyse vertraut gemacht werden und lernen erste explorative Analysen in verschiedenen Datensituationen durchzuführen. 

Themenschwerpunkte Teil 1: Grundlagen der Statistik und Datenanalyse in R

  • Definition von Data Science und weiterer Grundbegriffe

  • Einführung in ggplot2 zur Visualisierung von Daten

  • Univariate Deskriptive Statistik und Datenvisualisierung in R: Häufigkeitstabellen, Balkendiagramme, Histogramme, Kerndichteschätzung, Boxplots, Dichten und Verteilungen, QQ-Plots, etc.

  • Multivariate Deskriptive Statistik und Datenvisualisierung in R: Kreuztabellen, Scatter-Plots, Korrelation

Themenschwerpunkte Teil 2: Statistische Inferenz und Modellierung in R

  • Einführung in die statistische Inferenz: Punktschätzung, Intervallschätzung und Konfidenzintervalle

  • Statistische Hypothesentests: 

    • Motivation und Übersicht: Einstichproben vs. zweistichproben Test, einseitiger vs. zweiseitiger Test, gepaarter vs. ungepaarter Tests

    • Interpretation der Ergebnisse und Begriffserklärung: Signifikanzniveau, p-Wert, Teststatistik, etc.

    • Behandelte Tests: t-Test, Welch-Test (Test auf Mittelwertunterschiede), Mann-Whitney-U-Test bzw. Wilcoxon-Rangsummentest,  Shapiro-Wilk-Test (Test auf Normalverteilung), Kolmogoroff-Smirnow-Test (Test auf beliebige Verteilungen)

    • Multiples Testen: Probleme und Lösungsansätze (z.B. Bonferroni Korrektur)

  • Statistische Modellierung:

    • Das lineare Regressionsmodell mit Erweiterungen wie multipler Regression und Verwendung von kategorischen Einflussgrößen.

    • Modellevaluation und Modelldiagnose: MSE, R-squared, QQ-plots und Residuenanalyse

    • Ausblick: Generalisierte lineare Modelle (engl. generalized linear models) mit Fokus auf logistische Regression

Modul 3 (2-tägig): Effiziente Datenverarbeitung und Programmierung in R

Datenmanipulation und Verarbeitung  kann oft eine der zeitaufwendigsten Tätigkeiten in einer statistischen Analyse sein. In diesem Kurs werden Fähigkeiten vermittelt um effizient auch mit größeren Datenmengen in R arbeiten zu können. Nach dem Kurs sollen Teilnehmer in der Lage sein effizient in R arbeiten zu können, sowie Datenvorverarbeitung klarer, einfacher und schneller durchführen zu können.

Themenschwerpunkte Teil 1: Effiziente Datenverarbeitung in R

  • Kurzer Überblick wichtiger R packages für fortgeschrittene Datenanalyse 

  • Schnelle und intuitive Datenmanipulation mit dem dplyr Package:
    Wenn viele Datenvorverarbeitungsschritte nacheinander durchgeführt werden, wird Programmcode schnell unübersichtlich und ineffizient (z.B. durch abspeichern unnötiger Zwischenschritte). Das dplyr Package erlaubt sog. chaining-Operatoren, womit R Code wesentlich effizienter und übersichtlicher dargestellt werden kann.

  • Split / Apply / Combine in R: Allgemeinen Vorgang einen Datensatz in kleine Teildatensätze aufzuteilen, auf jedem Teildatensatz Operationen auszuführen und die Ergebnisse wieder zusammenzufügen.

  • Datenbanken in R

    • Einführung in das DBI package und der Nutzung von SQL Anfragen direkt in R

    • Vereinfachte Datenbankanbindung mit dplyr und dbplyr

    • Kurzer Ausblick zu weiteren R Paketen für spezielle Datenbanken

  • Automatisierte Berichterstellung, Reporting und literate Programming

    • Einführung in die Markdown Syntax mit Hilfe der Erweiterungspakete rmarkdown bzw. knitr.

    • Automatisierte Erstellung von dynamischen Berichten und Präsentationen, um wiederkehrende Analysen zeitsparend zu produzieren und voll reproduzierbar zu gestalten.

    • Professionelle Präsentation von Analyseergebnissen durch das gleichzeitige Einbinden von Grafiken, Tabellen und R-Code in Berichten ohne Copy & Paste, z.B. in Dateiformate wie PDF, Word oder HTML.

Themenschwerpunkte Teil 2: Fortgeschrittene R Programmierung

  • Programming with R: Basics

    • Anwenden von Kontrollstrukturen (if, else) für bedingte Anweisungen (sog. WENN-DANN-SONST Funktionalität).

    • Anwenden von Schleifen (for, while) und apply Funktionen für das effiziente Ausführen von repetitiven und iterativem R-Code.

    • Debugging, Exception und Error Handling

    • Einführung in die objektorientierte Programmierung mit R mit den beiden beliebtesten Klassensystemen S3 und R6.

  • Effizientes Arbeiten mit tabularen Daten und dem data.table Package: Filtering, Selecting, Grouping, Reshaping.

  • Effiziente Datenverarbeitung mit funktionaler Programmierung und dem purrr Package: Arbeiten mit Listen und genesteten Datenstrukturen.

  • Parallelisierung von R Code

Es wurden noch keine Bewertungen geschrieben.

Schreiben Sie eine Bewertung

Haben Sie Erfahrung mit diesem Webinar? Schreiben Sie jetzt eine Bewertung und helfen Sie Anderen dabei die richtige Weiterbildung zu wählen. Als Dankeschön spenden wir € 1,00 an Stiftung Edukans.

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!