Data Science Crash Course mit R

Niveau
Dauer
Ausführung
Vor Ort, Online
Startdatum und Ort

Data Science Crash Course mit R

DHL Data Science Seminare GmbH
Logo von DHL Data Science Seminare GmbH

Tipp: Haben Sie Fragen? Für weitere Details einfach auf "Kostenlose Informationen" klicken.

Startdaten und Startorte
placeHeidenheim an der Brenz
22. Jun 2026 bis 26. Jun 2026
computer Online: Zoom
22. Jun 2026 bis 26. Jun 2026
placeHeidenheim an der Brenz
7. Dez 2026 bis 11. Dez 2026
computer Online: Zoom
7. Dez 2026 bis 11. Dez 2026
Beschreibung

Mehr als 500 Teilnehmer/-innen empfehlen unsere Trainings:
https://www.provenexpert.com/dhl-data-science-seminare-gmbh/

In dem Kurs Data Science Crash Course mit R erhalten Sie eine fundierte und modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische Daten als auch für Textdaten. (auch mit Nutzung von ChatGPT). Das Training besteht aus drei Teilkursen, die auch einzeln gebucht werden können.

Im ersten Teilkurs Künstliche Intelligenz mit R erhalten Sie einen Überblick über das spannende Thema Künstliche Intelligenz mit vielen Praxisbeispielen. Zudem werden Sie in der Programmiersprache R so weit fit gemacht, dass Sie Ihr erstes Data-Science-Projekt vom Einlesen der Daten bis hin zur Speicherung der Modelle zur weiteren …

Gesamte Beschreibung lesen

Frequently asked questions

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Noch nicht den perfekten Kurs gefunden? Verwandte Themen: Data science mit R., Data Science, Big Data, Data Mining und Data Analytics.

Mehr als 500 Teilnehmer/-innen empfehlen unsere Trainings:
https://www.provenexpert.com/dhl-data-science-seminare-gmbh/

In dem Kurs Data Science Crash Course mit R erhalten Sie eine fundierte und modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische Daten als auch für Textdaten. (auch mit Nutzung von ChatGPT). Das Training besteht aus drei Teilkursen, die auch einzeln gebucht werden können.

Im ersten Teilkurs Künstliche Intelligenz mit R erhalten Sie einen Überblick über das spannende Thema Künstliche Intelligenz mit vielen Praxisbeispielen. Zudem werden Sie in der Programmiersprache R so weit fit gemacht, dass Sie Ihr erstes Data-Science-Projekt vom Einlesen der Daten bis hin zur Speicherung der Modelle zur weiteren Verwendung eigenhändig umsetzen können.

Das zweite Teilkurs Machine Learning mit R geht nun einen Schritt weiter. Hier erhalten Sie einen Einblick in die unterschiedlichen Algorithmen des Maschinellen Lernens. Die Theorie dahinter wird dabei anhand von Praxisübungen aus den Bereichen Clustering, Virtuelle Sensoren und Zeitreihenvorhersage vermittelt. In diesem Modul werden Sie sich hauptsächlich mit der Anwendung des Machine Learning auf numerischen Daten beschäftigen.

Abgerundet wird der Data Science Crash Course durch den dritten Teilkurs Natural Language Processing (NLP) mit R, bei dem Sie sich mit der Anwendung des Maschinellen Lernens im Kontext der natürlichen Sprachverarbeitung auseinandersetzen. Im Gegensatz zum Teilkurs Machine Learning mit R werden jetzt Wörter und Textdaten – so wie es auch ChatGPT macht – und nicht mehr numerische Daten verarbeitet. Zusätzlich behandeln wir in diesem Modul das wichtige Thema der Datenbeschaffung – und eine mögliche Option bietet hier das Web Scraping bzw. Crawling, das Sie anhand einer Praxisübung selbst umsetzen.

Dauer

  • 5 Tage mit 40 Stunden Unterricht (täglich 8 Stunden, 9-17 Uhr)
  • Aufteilung Theorie/Praxis: 40 % Theorie + 60 % Praxis mit Übungen

Inhalte

Künstliche Intelligenz mit R (2 Tage)

  • Überblick, Grundlagen und Praxisbeispiele
    • Künstliche Intelligenz
    • Data Science
    • Maschinelles Lernen
    • Herausforderungen bei der Umsetzung eines Data Science/KI Projekts
    • Praxisbeispiele zu den Themen: Natural Language Processing (NLP), Bilderkennung, Predictive Maintenance, Prozessindustrie, Logistik
  • Intensivkurs R mit RStudio
    • Einführung in R: Datenstrukturen (Listen, Vektoren und Data Frames), Kontrollstrukturen (Fallunterscheidungen, Schleifen und benutzerdefinierte Funktionen) und Erstellung von Diagrammen (ggplot2, plotly)
    • Relevante R-Pakete: Tidyverse, Caret und Keras/Tensorflow
    • Data Science mit R: Statistiken, Korrelationen, Vorverarbeitung
    • Praxis-Übung: Datenzugriff, Datenexplorierung und Visualisierung
  • Methoden des Maschinelles Lernen
    • Überwachtes Lernen/Supervised Learning
    • Unüberwachtes Lernen/Unsupervised Learning
    • Reinforcement Learning
    • Praxis-Übung: Selektion der richtigen Features
  • Data-Science-Zyklus
    • Datenverständnis und Vorbereitung
    • Aufsetzen des Data-Science-Zyklus: Train-Test-Split, Pipelines, Kreuzvalidierung/Crossvalidaton, Hyperparameter-Optimierung
    • Implementierung eines Machine Learning Algorithmus (Learning Vector Quantization)
    • Evaluation des Algorithmus
    • Praxis-Übung: Clustering und Klassifikation

Machine Learning mit R (2 Tage)

  • Praxis-Beispiel I (Clustering)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung I: Dimensionalitätsreduzierung mit einer Principal Components Analysis (PCA)
    • Praxis-Übung II: Kategorie-Einteilung von Service-Einsätzen mittels KMeans und Density-Based Spatial Clustering of Applications with Noise (DBSCAN)
  • Praxis-Beispiel II (Virtueller Sensor)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung: Vorhersage eines (meistens nicht direkt messbaren) Wertes anhand vorhandener Variablen/Merkmale mittels Decision Trees, Random Forest und XGBoost und Evaluation mittels Feature Importance
  • Praxis-Beispiel III (Trendvorhersage)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung I: Zeitreihenvorhersage mittels Random Forest, XGBoost und Neuronalen Netzen
    • Praxis-Übung II: Mulitvariate Zeitreihenvorhersage mittels Long-Short-Term-Memory (LSTM) inkl. eiterführende Python-Bibliotheken: keras, tensorflow

Natural Language Processing (NLP) mit R (1 Tag)

  • Web Scraping und Crawling
    • Kommerzielle und ethische Gesichtspunkte, auch im Kontext von ChatGPT
    • Scrapen einer Webseite: requests, robots.txt, html, regex
    • Praxis-Übung: Scrapen einer Webseite
  • Vorverarbeitung von Text
    • Parsing: Tokenizer, Stopwords, Stemming, n-grams
    • Praxis-Übung: Parsen von Data-Science-Texten
  • Praxis-Beispiel I (Topic Clustering)
    • Kurze Einführung in den Kontext und die Zielsetzung
    • Praxis-Übung: Unüberwachtes Lernen/Unsupervised Learning (DBSCAN)
  • Praxis-Beispiel II (Sentiment Analysis)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Überwachtes Lernen/Supervised Learning (Neuronale Netze)
  • Praxis-Beispiel III (Sentence Completion)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Ausblick auf die Technologie der Transformer (Architektur von ChatGPT)
    • Praxis-Übung: Symbolische Zeitreihenvorhersage (Long-Short-Term-Memory/LSTM und Embedding)

Ziele

Am Ende des Data Science Crash Course mit R werden Sie:

  • die aktuelle Berichterstattung zu Künstliche Intelligenz, Maschinellem Lernen, Reinforcement Learning und Data Science sowie deren Anwendungspotential in verschiedenen Bereichen wie Logistik, Predictive Maintenance oder Chatbots inhaltlich einordnen und bewerten können,
  • vorhandene Daten mit R und Methoden des Maschinellen Lernens für Ihren Bereich nutzbar machen können (unter Einsatz der R-Pakete Tidyverse, Caret und Keras/Tensorflow),
  • die Programmiersprache R und den wissenschaftlichen Rechenstapel von R zur Implementierung von Maschinellen Lernalgorithmen kennengelernt haben, um zu wissen, welche Daten für die erfolgreiche Umsetzung einer Fragestellung aus Ihrem Bereich (noch) notwendig sind,
  • ein vollständigen Data-Science-Zyklus umgesetzt haben und damit wissen, was hierfür notwendig ist und welche Herausforderungen auf Sie zukommen werden,
  • eine Kategorien-Einteilung/Clustering mit Unüberwachtem Lernen/Unsupervised Learning (PCA, k-Means, DBSCAN) durchführen können,
  • eine Trendvorhersage mit Überwachtem Lernen/Supervised Learning (Neuronale Netze, XGBoost, LSTM) durchführen können,
  • einen Virtuellen Sensor mit Überwachtem Lernen/Supervised Learning (Decision Tree, Random Forest, XGBoost) entwickeln können,
  • wissen, was Sie beachten müssen, wenn Sie Daten aus dem Internet ziehen (Web Scraping und Web Crawling) – und wie Sie Daten von einer Seite “scrapen” und vorverarbeiten können,
  • wie Sie Texte mittels Tokenizer, Stopwords, Stemming und n-grams vor-verarbeiten bzw. parsen können und
  • einen praktischen Einblick erhalten, wie Sie Topic Clustering, eine Sentiment Analyse und Satz-Vervollständigung mittels Unsupervised und Supervised Learning durchführen können.

Zielgruppe

  • Beschäftigte aus operativen Bereichen, R&D und IT mit grundlegenden Programmierkenntnissen, welche die Potenziale von Data Science, Künstlicher Intelligenz und Maschinellem Lernen kennenlernen und hautnah erfahren möchten und
  • Anwender, Studenten, Doktoranden und Forscher aus den mathematischen, statistischen, naturwissenschaftlichen, ingenieurwissenschaftlichen, informationstechnologischen, medizinischen, pharmazeutischen, betriebs-, wirtschafts-, markt- und sozialwissenschaftlichen Bereichen

Voraussetzungen

Für den Data Science Crash Course mit R sind Grundverständnisse der Linearen Algebra (Vektoren, Matrizen) und ein Basiswissen in der Statistik (wie Korrelationen, Signifikanztests, lineare Regression) sehr empfehlenswert. Sie sollten Grundkenntnisse in einer Programmiersprache besitzen, am besten wäre eine Skriptsprache wie Python, R oder Matlab. Liegen keine Programmierkenntnisse vor, können Sie den dafür entwickelten Vorbereitungskurs Einführung in die Programmierung mit R besuchen.

Hinweise zur Teilnahme

Teilnahme am Online-Seminar: Sie benötigen zur Teilnahme an unseren Online-Seminaren einen Computer mit Internetzugang (empfohlene Bandbreite 1-2 MBit/s). Sie erhalten nach der Anmeldung eine detaillierte Installationsanleitung für die erforderliche Statistik- und Videokonferenz-Software (die Teilnahme ist auch mit einem Browser möglich). Bei Bedarf können Sie einen Fernzugang zu einem Schulungscomputer mit der erforderlichen Software erhalten.

Teilnahme am Präsenz-Seminar: Bitte bringen Sie einen Laptop mit der erforderlichen Software mit (Sie erhalten im Vorfeld eine Installationsanleitung für R, RStudio und erforderlichen R-Paketen).

Förderung

Bildungsurlaub, Weiterbildungsstipendium (kein Bildungsgutschein)

Werden Sie über neue Bewertungen benachrichtigt
Es wurden noch keine Bewertungen geschrieben.
Schreiben Sie eine Bewertung
Haben Sie Erfahrung mit diesem Training? Schreiben Sie jetzt eine Bewertung und helfen Sie Anderen dabei die richtige Weiterbildung zu wählen. Als Dankeschön spenden wir € 1,00 an Stiftung Edukans.

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Bitte füllen Sie das Formular so vollständig wie möglich aus.

(optional)
(optional)
(optional)
(optional)
(optional)
(optional)
(optional)

Anmeldung für Newsletter

Damit Ihnen per E-Mail oder Telefon weitergeholfen werden kann, speichern wir Ihre Daten und teilen sie ggf. mit DHL Data Science Seminare GmbH. Mehr Informationen dazu finden Sie in unseren Datenschutzbestimmungen.