Data Science Business Akademie | Data Science Know-how fürs Business

Explorer Practitioner Expert Special Alle Seminare

Köln 5 Tage Practitioner

12. März 2025

Praxiswoche – Data Science mit R und RStudio

Den Teilnehmern wird der Umgang mit der statistischen Programmiersprache R interaktiv näher gebracht. Die erlernten Fähigkeiten werden regelmäßig an einem kursbegleitenden Projekt angewandt und dadurch gefestigt.

Nach erfolgreichem Abschluss, besitzen die Kursteilnehmer Grundkenntnisse im Umgang mit R, die es ihnen ermöglichen, statistische Fragestellungen eigenständig zu bearbeiten, analysieren und auszuwerten.

Neben den Grundlagen in R, werden insbesondere Themen wie die effiziente Aufbereitung und Verarbeitung von Daten, deren visuelle Analyse, sowie die Anwendung gängiger Techniken des maschinellen Lernens vermittelt.

Jetzt Buchen

Köln 3 Tage Special

7. September 2019

Python für Programmiereinsteiger

Mit der 3-tägigen Schulung fällt der Einstieg für Programmiereinsteiger mit Python leicht. Der Kurs startet mit einer Einführung in Python, geht über die Syntax von Python zu vielen Übungen zur Programmlogik, behandelt die Objektorientierte Programmierung und Exceptionhandling in Python. Neben einem intensiven und praxisorientierten Basistraining zu Python wird ein einheitliches Grundwissen in der objektorientierten Programmierung vermittelt.

Durch praxisorientierte Übungen zur Programmlogik und eine umfassende Schulung zum Einstieg in die objektorientierte Programmierung sind Sie bestens gerüstet, um Python für Ihre Unternehmenszwecke einzusetzen.

Folgende Themen werden behandelt:

Einführung in Python
- Python: Unterschied zu Java / C#.NET / C++ / PHP
- Kurzübersicht über die Editoren
- Die Entwicklungsumgebung
- Einrichten eines Python-Projekts
- Grundsätzlicher Aufbau eines Python-Programms
Syntax von Python
- Die Help-Funktion
- Kommentare
- Allgemeine Datentypen
- int, float, Decimal, bool, string
- Konvertierungen zwischen Datentypen
- Logische und arithmetische Operatoren
- Formatierte Ausgaben mit format()
- Funktionen, Parameterübergabe
- Die pass-Anweisung
- Lambda-Expressions
Übungen zur Programmlogik
- Viele ausgewählte Übungen
- Schleifen: for und while
- Die range-Funktion
- Bedingungen: if, elif, else
- Übungen zu verbesserter Performance
Objektorientierte Programmierung
- Einstieg in objektorientierte Programmierung
- Datenkapselung, Vererbung, Polymorphie
- Klassen und Objekte
- Die Klasse Object
- Mehrfachvererbung
- Überschreiben von Methoden der Basisklasse
- Viele Übungen: eigene Klassen schreiben
Exceptionhandling in Python
- Die Klasse Exception
- try / except / finally
- Erstellen einer eigenen Fehlerklasse
Weitere optionale Themen
- Dateien lesen und schreiben
- Operatorüberladung
- Reguläre Ausdrücke

Jetzt Buchen

Köln 5 Tage Special

4. November 2019

Python – Komplett

In dieser Schulung lernen Sie die vielfältigen Nutzungsmöglichkeiten der Programmiersprache Python kennen. Durch eine Reihe praktischer Übungen können Sie nach der Schulung problemlos eigene Entwicklungen vorantreiben und die Vorteile von Python für Ihre Projekte nutzen.

Nach der Schulung haben Sie alle wesentlichen Punkte der Programmiersprache Python gelernt. Sie verstehen das Konzept der Python-Klassen und können relationale und objekt-orientierte Datenbanken in Verbindung mit Python problemlos einsetzen.

Folgende Inhalte werden behandelt: 1.-3. Tag: Auch separat buchbar als Python Basiswissen

Organisation von Python-Code bei umfangreichen Projekten
- Packages
- import
list, tuple, dict (Zusammenfassung aus "Python-Einführung"
list, tuple dict, set (advanced features):
- List Comprehensions
- Generator-Ausdrücke
- Iteratoren
- Mengen (sets)
- dict: update, get, setdefault, pop, items
Funktionsparameter
- Parameter-Defaults
- Funktionen mit beliebig langen Parameterlisten
- Packen und Entpacken von Listen, Tupeln und Dictionaries
- als Sequenzen von Funktionsparametern
Typumwandlungen der Grunddatentypen
- int, float, str, dict, list, tuple, set
Verschachtelte Collections
- Result sets, list of dictionaries
Dateien, Objektserialisierung und Objektbanken
- file
- shelf als Beispiel von pickle-Anwendung
Python-Klassen (Python-Typen)
- object methods
- static methods
- class methods
- get/set methods (Vergleich mit JavaBeans)
- properties
- filigrane Zugriffsrechte auf Objektattribute
- (Vergleich mit Java-Zugriffsrechten)
- Operatorenüberladung
- list-like objects
- dictionary-like objects
- callable objects
- Vererbung
Exceptions
- Eigene Fehlerklassen modellieren
- Eigene Fehlerobjekte in Methoden einbauen
Das Dokumentationssystem von Python
- das Objektattribut __doc__ (docstring)
- reStructuredText als Syntax von docstring
- automatische Generierung von Dokumentation (epydoc)
Python UnitTests (eine kurze Einführung)
- der Zusammenhang von UnitTests und docstrings
- der Python-Interpreter als Betriebssystem
- die Module os, sys, shutils
Graphische Benutzeroberfläche (GUI) (eine kurze Einführung)
SQL-Datenbankanbindung mit Python (kurze Beispiele)
Threads (eine kurze Einführung)

4.-5. Tag: Auch separat buchbar als Python Aufbau SQL mit Python:

Python SQLite
- neue Tabellen anlegen
- Daten in die Tabelle einfügen
- Daten abfragen
- update
- Datentypen in SQLite
- Adapter und Konvertierer
Die Einheitliche Python-DB-API
Python und MySQL (MySQLdb)
Python und Oracle
Python und ODBC

Python-Objektdatenbank (ZODB-Zope Object Database)

ZODB als selbständige Datenbank installieren (ohne Zope)
Die Erfüllung von Datenbank-Standards (ACID) durch die ZODB
- Atomicity
- Consistency
- Isolation
- Durability
Die hierarchische Objektstruktur der ZODB
Persistenzregeln beim Update von Veränderungen an ZODB-Objekten
Persistente Objektreferenzen in der ZODB
Hinweis auf advanced features: mounting, distributing
Eine einfache Anwendung als Beispiel

Object Relational Mapping

SQLAlchemy als Brücke zwischen ZODB und SQL-Datenbanken

Jetzt Buchen

Köln 3 Tage Special

4. November 2019

Python für Programmiereinsteiger

In drei Tagen vermittelt dieser Kurs einheitliches Grundwissen zur objektorientierten Programmierung mit Python. Der Kurs startet mit einer Einführung in Python, geht über die Syntax von Python zu vielen Übungen zur Programmlogik, behandelt die Objektorientierte Programmierung und Exceptionhandling in Python. Neben einem intensiven und praxisorientierten Basistraining zu Python wird ein einheitliches Grundwissen in der objektorientierten Programmierung vermittelt.

Folgende Themen werden behandelt:

Einführung in Python
- Python: Unterschied zu Java / C#.NET / C++ / PHP
- Kurzübersicht über die Editoren
- Die Entwicklungsumgebung
- Einrichten eines Python-Projekts
- Grundsätzlicher Aufbau eines Python-Programms
Syntax von Python
- Die Help-Funktion
- Kommentare
- Allgemeine Datentypen
- int, float, Decimal, bool, string
- Konvertierungen zwischen Datentypen
- Logische und arithmetische Operatoren
- Formatierte Ausgaben mit format()
- Funktionen, Parameterübergabe
- Die pass-Anweisung
- Lambda-Expressions
Übungen zur Programmlogik
- Viele ausgewählte Übungen
- Schleifen: for und while
- Die range-Funktion
- Bedingungen: if, elif, else
- Übungen zu verbesserter Performance
Objektorientierte Programmierung
- Einstieg in objektorientierte Programmierung
- Datenkapselung, Vererbung, Polymorphie
- Klassen und Objekte
- Die Klasse Object
- Mehrfachvererbung
- Überschreiben von Methoden der Basisklasse
- Viele Übungen: eigene Klassen schreiben
Exceptionhandling in Python
- Die Klasse Exception
- try / except / finally
- Erstellen einer eigenen Fehlerklasse
Weitere optionale Themen
- Dateien lesen und schreiben
- Operatorüberladung
- Reguläre Ausdrücke

Jetzt Buchen

Köln 1 Tage Expert

7. November 2019

Machine Learning: Grundlagen kompakt

In dieser Schulung lernen Sie, mit welchen Konzepten und Algorithmen Computer aus Beispielen lernen. Nach der Schulung werden Sie verstehen, wie Machinelles Lernen mit Neuronalen Netzen funktioniert und welche Tools hilfreich sind.

Neben den wichtigen Grundkonzepten des Machinellen Lernens, erhalten Sie einen fundierten Überblick über Tools, die für den Aufbau Neuronaler Netze hilfreich sind.

Folgende Themen werden behandelt:

Intelligente Agenten
- Struktur von Agenten, Agentenprogramm, Agentenfunktion
- Agenten-Grundtypen
- Modellbasierter Reflexagent
- Lernender Agent
Maschinelles Lernen
- Lernformen: nicht überwachtes Lernen, verstärkendes Lernen, überwachtes Lernen
- Lernen aus Beispielen
- Trainingsmenge versus Testmenge
- Generalisierungsfähigkeit der gelernten Abbildung
- Problem der Überanpassung
Neuronale Netze, Multi Layer Perceptrons
- Vom biologischen zum technischen Neuron
- Perceptron
- Nichtlineare Aktivierungsfunktionen
- Multi-Layer-Perceptrons (mehrschichtige neuronale Netze)
- Lernalgorithmus "Backpropagation of Error"
- Beispiele zu Regression und Klassifikation mit Multi Layer Perceptrons
- praktische Tipps
- deep learning
- Beispiele und Demos zu deep learning
Neuronale Netze, Convolutional Neural Networks (CNN)
- Grundidee und Topologie CNN
- Beispiele und Demos zu Convolutional Neural Networks / Deep Learning
Neuronale Netze, Recurrent Neural Networks (RNN, LSTM)
- Grundidee und Topologie RNN
- Lernalgorithmus "Backpropagation Through Time"
- Long Short-Term Memory Networks (LSTM)
- Beispiele und Demos zu RNN und LSTM
Support-Vektor-Maschinen
- Grundidee und Unterschied zu Neuronalen Netzen
- Kernel-Trick zur Garantie der Linearen Separierbarkeit in höheren Dimensionen
- Beispiele und Demos zu Support Vector Machines
- Praktische Tipps
Hinweise zu Tools, Internet-Quellen und Literatur
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 1 Tage Expert

8. November 2019

Machine Learning: Praxistag mit TensorFlow

Der Praxisworkshop bereitet Sie auf die Arbeit mit dem frei verfügbaren Framework TensorWork vor. Anhand zahlreicher praktischer Übungen werden Sie verstehen, wie Multi-Layer Perceptron funktioniert und lernen, wie ein Convolutional Neural Network zur Bilderkennung aufgebaut ist.

Nach dem Praxistag können Sie mit TensorFlow eigene Daten verarbeiten, Netze und das Training mit TensorBoard visualisieren. Sie haben mehrere Fallstudien selbst durchgeführt und können anhand der gewonnenen Erfahrungen nun eigene Projekte zu Multi-Layer Perceptrons und Convolutional Neural Networks starten.

Folgende Themen werden behandelt:

Installation Python für Windows
Installation TensorFlow für Windows
Installation weiterer nützlicher Python-Packages
Jupyter Notebooks
Zahlen, Vektoren, Matrizen und Tensoren
"Hello world!" mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow Keras
Convolutional Neural Networks (CNN) mit TensorFlow Keras
Visualisierung mit TensorBoard
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 5 Tage Expert

11. November 2019

Vertiefungswoche – Deep Learning und neuronale Netze

Einführung in die Anwendung neuronaler Netze im betriebswirtschaftlichen Kontext in unterschiedlichen Anwendungsszenarien von der Bildklassifizierung bis zum Reinforcement Learning.

Die Teilnehmer können aktuelle Methoden im Bereich des Deep Learning anwenden und mit Data Science Werkzeugen umsetzen.

Deep Learning Methodik, Convolutional und Recurrent Netzwerkarchitekturen, Reinforcement Learning zur Entscheidungsunterstützung

Jetzt Buchen

Köln 5 Tage Expert

11. November 2019

Vertiefungswoche – Sprachverarbeitung und Social Media Analytics

Der Kurs vermittelt einen grundlegenden Einblick in die Verarbeitung natürlicher Sprache im Computer und zeigt Ihnen Methoden und Technologien zur Social Media-Analyse, deren Technik Sie an praktischen Beispielen erlernen.

Die Teilnehmer des Kurses sind nach erfolgreicher Kursteilnahme in der Lage, heutige Methoden der Sprachanalyse und -erzeugung zu bewerten und selbst anzuwenden. Sie sind mit den aktuellen Methoden und Technologien der Social-Media-Analyse vertraut und können Inhalte und Aktivitäten in sozialen Netzwerken eigenständig bewerten.

Methoden zur Analyse; Generieren natürlicher Sprache im Computer; Datenbeschaffung über offene Schnittstellen von sozialen Medien, deren Aufbereitung sowie Speicherung; Methoden der Graphen- und Indikator-basierten Analyse, es wird besonderen Wert auf die Anwendung der vorgestellten Konzepte gelegt

Coming Soon…

Köln 5 Tage Expert

11. November 2019

Vertiefungswoche – Big Data mit Hadoop

tba

Coming Soon…

Köln 5 Tage Expert

11. November 2019

Vertiefungswoche – Praxisprojekt

tba

Coming Soon…

Köln 5 Tage Explorer

18. November 2019

Grundlagenwoche – Data Science

Einführung in die Methodik und Anwendung von Data Science für die Lösung betriebswirtschaftlicher datenbezogener Fragestellungen. Neben den statistischen Grundlagen der Datenanalyse stehen die Basiskonzepte des Data Mining im Fokus.

Die Teilnehmer sind in der Lage, eine vollständige Data Science Lösung zu entwerfen, umzusetzen und zu bewerten. Sie können marktübliche Kenntnisse und Kompetenzen erwerben.

Es werden Techniken der explorativen Analyse, der Datenvorbereitung und des überwachten und nichtüberwachten Lernens vermittelt. Deskriptive und induktive Verfahren der statistischen Datenanalyse werden vorgestellt.

Jetzt Buchen

Köln 1 Tage Explorer

21. November 2019

Data Science: Grundlagen der Statistik kompakt

Kompaktschulung zu statistischen Grundlagen, die für die Themengebiete Data Science und Machine Learning notwendig sind.

Mit dieser Grundlagenschulung bauen Sie sich ein statistisches Fundament auf. Die Kompaktschulung vermittelt die wesentlichen Grundlagen der beschreibenden und schließenden Statistik.

Folgende Themen werden behandelt:

Grundlagen der beschreibenden Statistik
- Stichprobe versus Gesamtheit
- statistische Skalen: nominal, ordinal, metrisch
- relative Häufigkeiten und kumulierte relative Häufigkeiten, empirische Verteilungsfunktion
- Histogramm für klassierte Daten
- Lagemaße: arithmetisches Mittel, Median, Quantile
- Box-Whisker-Plot
- Streuungsmaße: Varianz und Standardabweichung
- zweidimensionale Datensätze, Streudiagramm
- Zusammenhangsmaße: Korrelation
- Lineare Regression
Grundlagen der schließenden Statistik
- Schließen von der Stichprobe auf die Gesamtheit
- Wahrscheinlichkeit versus relative Häufigkeit
- diskrete und stetige Zufallsvariablen
- Gaußkurve, Normalverteilung
- Vertrauensbereich, Konfidenzintervalle
- Grundlagen der Hypothesentests (Nullhypothese, Alternativhypothese, Signifikanzniveau)
- Hypothesentest-Typen (Mittelwerttest, Anteilstest, Unabhängigkeitstest, F-Test als Gesamtmodell-Test, t-Test) und Anwendungsbereiche
- Ausblick: einfaktorielle Varianzanalyse
- Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 3 Tage Practitioner

25. November 2019

Data Science mit Python – Einführung in Python

Nutzen Sie die vielfältigen Möglichkeiten von Python im Bereich Data Science. Die Schulung vermittelt in 3 Tagen das nötige Know-How, um Datenstrukturen, Visualisierungen, Statistiken und Control Flows mit Python und zusätzlichen Data Sciences Paketen wie pandas selbstständig zu erstellen und auszuwerten.

Nach der Schulung haben Sie einen guten Überblick über die Möglichkeiten von Python im Bereich Data Science. Sie lernen Machine Learning Algorithmen in Theorie und Praxis kennen und können grundlegende Statistiken mit pandas erstellen.

Folgende Themen werden behandelt:

Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Die Entwicklungsumgebung (IDE) Spyder
- Aspekte von Python, die anders als in anderen Programmiersprachen sind
Datenstrukturen in Python
- Unterschied Funktionen vs. Methoden
- Datenstrukturen in Python (number, tuple, list, dictionary, string)
- Überblick und wichtige Methoden zu den Datenstrukturen
- Unterschied list vs. tuple
- Die Besonderheit des Wertes NaN
- Wann benutze ich welche Klammer [], (), {}?
- List comprehension
Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile ansprechen, hinzufügen, löschen und verändern
- Eine Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Fehlende Werte ergänzen
- Logische Operatoren
Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Subplots erstellen
- Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- While Schleife
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Cross-validation (Kreuzvalidierung)
Weitere Machine Learning Algorithmen in Python
- Erklärung von (SVM), Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)

Jetzt Buchen

Köln 2 Tage Special

25. November 2019

Datenmodellierung in Business-Intelligence und Big-Data-Systemen

Damit ein betriebliches Informationssystem wie etwa ein Data Warehouse reibungslos funktioniert, bedarf es einer grundlegenden Datenmodellierung. Die 2-tägige Schulung vermittelt die methodischen Grundlagen und veweist auf die notwendigen technischen Aspekte. Dabei werden auch beispielhafte Lösungen für verschiedene Anwendungsfälle aufgezeigt.

Nach der Schulung kennen Sie die Grundlagen der Datenmodellierung für Business Intelligence und Data Analytics. Als Teilnehmer haben Sie verschiedene konzeptionelle Datenmodellierungsansätze kennengelernt und können nun mit Data Vault klassische Modellierungsarten einen aktuellen Modellansatz gegenüberstellen.

Folgende Themen werden behandelt:

Informationssysteme und Kennzahlen
Data-Warehouse-Systeme
Relationale Datenmodelle
Entity-Relationship-Modell
Normalformen & Historisierung
Dimensionale Datenmodelle
Agile dimensionale Modellierung
Star- und Snowflake-Schema
Modellierung mit ADAPT
Data-Vault-Datenmodelle
Modellierung von Fachlogik
NoSQL-Datenmodelle

Jetzt Buchen

Köln 5 Tage Practitioner

2. Dezember 2019

Praxiswoche – Data Science mit Python

Die Teilnehmer erhalten einen Einstieg in Python und Pandas, um Daten zu analysieren und Machine Learning Algorithmen einsetzen zu können. Die durchgängigen Praxisbeispiele mit vielen Übungen führen wie ein roter Faden durch diese Schulung.

Nach dem Seminar sind Sie in der Lage Pandas als Data Science Tool für Ihre Projekte zu nutzen. Darüber hinaus lernen Sie die Umsetzung grundlegender Data Science Schritte in Python kennen, sodass sie Ihre Projekte auch direkt in einer Programmiersprache umsetzen können.

Datenstrukturen in Python, Einführung in das Data Science Paket pandas (Daten einlesen, Data handling), grundlegende Statistiken mit pandas, Algorithmen im Data Science

Jetzt Buchen

Köln 3 Tage Expert

2. Dezember 2019

Machine Learning mit Python

Wenn Sie Automatisierungsprozesse vorantreiben und ein Gespür für den Wert Ihrer Daten bekommen möchten, ist diese 3-tägige Schulung perfekt geeignet. Sie lernen den Umgang mit gängiger Lernalgorithmen aus der Scikit-Learn Bibliothek und erhalten anhand praktischer Beispiele ein Verständis zu statischen Grundlagen.

Neben der Vermittlung von Machine Learning Grundlagen liegt der Fokus dieser Schulung auf der Vorverarbeitung der Daten und der Extraktion relevanter Variablen für den Anlernprozess. Dank einer Grundlagenschulung zur praktischen Anwendung von gängigen Lernalgorithmen aus der Scikit-Learn Bibliothek fällt es am Ende der Schulung nicht schwer, Daten zielsicher zu extrahieren, Algorithmen anzulernen und diese zur Klassifizierung oder Prognose einzusetzen.

Folgenden Themen werden behandelt:

Daten ziehen und aufbereiten
- Dateien im Verzeichnis ansteuern
- Standardverfahren zum Lesen/Schreiben von Text- und CSV-Dateien
- SQL-Datenbanken ansteuern
- Arbeiten mit Datenmatrizen: Einführung in Numpy & Pandas
- Daten inspizieren und beschreiben
- Fehlende Werte behandeln
Machine Learning Grundlagen
- Grundlagen, Varianten und Techniken des Machine Learnings.
- Arbeiten mit der Machine Learning Bibliothek scikit-learn.
- Einfache Zusammenhänge zwischen stetigen Variablen modellieren: Lineare Regression
- Klassifizieren mit Logistic Regression, Softmax und Support Vector Machine.
- Modellen evaluieren: Accuracy, Precision, Recall & Confusion matrix
- Unterteilen der Daten in Trainings- und Testdaten
Feature-Extraction
- Kategoriale Daten vorbereiten: One-Hot Codierung
- Standardisierung von Daten
- Dimensionsreduktion mit PCA (Principle Component Analysis)
- Aufbereitung von Textdaten: Tokenizer und Bag-of-words.
Machine Learning Workflow
- Daten aufarbeiten und zusammenführen (DataMapper)
- Pipelines einrichten
- Speichern und laden trainierter Klassifizierer

Jetzt Buchen

Köln 5 Tage Special

2. Dezember 2019

Python – Komplett

Folgende Inhalte werden behandelt: 1.-3. Tag: Auch separat buchbar als Python Basiswissen

Organisation von Python-Code bei umfangreichen Projekten
- Packages
- import
list, tuple, dict (Zusammenfassung aus "Python-Einführung"
list, tuple dict, set (advanced features):
- List Comprehensions
- Generator-Ausdrücke
- Iteratoren
- Mengen (sets)
- dict: update, get, setdefault, pop, items
Funktionsparameter
- Parameter-Defaults
- Funktionen mit beliebig langen Parameterlisten
- Packen und Entpacken von Listen, Tupeln und Dictionaries
- als Sequenzen von Funktionsparametern
Typumwandlungen der Grunddatentypen
- int, float, str, dict, list, tuple, set
Verschachtelte Collections
- Result sets, list of dictionaries
Dateien, Objektserialisierung und Objektbanken
- file
- shelf als Beispiel von pickle-Anwendung
Python-Klassen (Python-Typen)
- object methods
- static methods
- class methods
- get/set methods (Vergleich mit JavaBeans)
- properties
- filigrane Zugriffsrechte auf Objektattribute
- (Vergleich mit Java-Zugriffsrechten)
- Operatorenüberladung
- list-like objects
- dictionary-like objects
- callable objects
- Vererbung
Exceptions
- Eigene Fehlerklassen modellieren
- Eigene Fehlerobjekte in Methoden einbauen
Das Dokumentationssystem von Python
- das Objektattribut __doc__ (docstring)
- reStructuredText als Syntax von docstring
- automatische Generierung von Dokumentation (epydoc)
Python UnitTests (eine kurze Einführung)
- der Zusammenhang von UnitTests und docstrings
- der Python-Interpreter als Betriebssystem
- die Module os, sys, shutils
Graphische Benutzeroberfläche (GUI) (eine kurze Einführung)
SQL-Datenbankanbindung mit Python (kurze Beispiele)
Threads (eine kurze Einführung)

4.-5. Tag: Auch separat buchbar als Python Aufbau SQL mit Python:

Python SQLite
- neue Tabellen anlegen
- Daten in die Tabelle einfügen
- Daten abfragen
- update
- Datentypen in SQLite
- Adapter und Konvertierer
Die Einheitliche Python-DB-API
Python und MySQL (MySQLdb)
Python und Oracle
Python und ODBC

Python-Objektdatenbank (ZODB-Zope Object Database)

ZODB als selbständige Datenbank installieren (ohne Zope)
Die Erfüllung von Datenbank-Standards (ACID) durch die ZODB
- Atomicity
- Consistency
- Isolation
- Durability
Die hierarchische Objektstruktur der ZODB
Persistenzregeln beim Update von Veränderungen an ZODB-Objekten
Persistente Objektreferenzen in der ZODB
Hinweis auf advanced features: mounting, distributing
Eine einfache Anwendung als Beispiel

Object Relational Mapping

SQLAlchemy als Brücke zwischen ZODB und SQL-Datenbanken

Jetzt Buchen

Köln 4 Tage Expert

16. Dezember 2019

Deep Learning mit Python & Keras

Diese Schulung wurde für technisch interessierte Fachkräfte mit Grundkenntnissen in Python konzipiert. Sie ist geeignet für alle Teilnehmer, die mehr über Neuronale Netze lernen und mit Keras eigene Neuronale Netze aufbauen und trainieren und damit den Sprung in fortgeschrittene Machine Learning Techniken wagen möchten.

Durch praktische Übungen wird vermittelt, wie Bild-, Text und numerische Daten für Training und Schätzung vorbereitet werden. Nach der Schulung kennen Sie den kompletten Workflow des Machine Learning mit der Deep Learning Bibliothek Keras. Sie sind in der Lage Daten, und Optionen des Einsatzes neuronaler Netze zu prüfen udn Modelle zielsicher auszuwählen und zu trainieren.

Folgende Themen werden behandelt:

Wie lernen Neuronale Netze?
- Variablen, Modelle und Zusammenhänge
- Künstliche Neuronen und neuronale Netze
- Mathematische Grundlagen des Anlernprozesses: Backpropagation, Loss und Gradient Descent
Neuronale Netze mit Keras aufbauen und trainieren
- Graphen mit Tensorflow erstellen
- Ein einfaches Netz mit Keras und Tensorflow aufbauen und anlernen
- Welches Modell ist das richtige? Evaluation und Anpassung angelernter Modelle.
- Einsatz angelernter Modelle zur Klassifzierung und Schätzung
- Modelle speichern und laden
- Overfitting mit Dropout-Layern verhindern
- Überwachung des Anlernprozesses mit TensorBoard
Maschinelles Sehen: Konvolutionale neuronale Netze (CNN)
- Bilddateien als mehrdimensionale Matrizen
- Details sehen und Formen abstrahieren: Konvolutionale Netze (CNN)
- Konvolutionale Layer mit Keras aufbauen und anlernen
- Vortrainierte Layer einsetzen
Mit Sequenzdaten arbeiten: Rekurrente neuronale Netze (RNN)
- Zeitreihendaten und Textsequenzen: Eigenschaften und Eigenheiten
- Neuronale Netze mit Gedächtnis (Feedforward vs. RNN)
- Sequenzdaten mit LSTM (Long Short-Term Memory) aufbauen
- Textdaten mit Embedding-Layers interpretieren
Feature Extraction: Numerische Daten, Bild und Text-Daten vorbereiten
- Datenrepräsentation: Skalare, Vektoren & Matrizen in Numpy
- Daten einlesen und vorbereiten mit Pandas, Scikit-learn und Keras
- Qualitativer Variablen und Dummy-Sets
- Standardisierung von Daten
- Dimensionsreduktion mit PCA
- Bilddateien transformieren
- Mit Textdaten arbeiten: Zerlegen, tokenizieren, vektorisieren und einbetten.

Jetzt Buchen

Köln 4 Tage Special

6. Januar 2020

Data Science mit RapidMiner: Grundlagen und fortgeschrittene Themen für Analysten

Die Schulungen sind auch geeignet, um neue Data Scientists auszubilden oder erfahrenen Data Scientists den Umstieg auf die Plattform RapidMiner zu erleichtern.

Nachdem Sie die Schulung besucht haben können Sie durch Ablegen einer Prüfung das Zertifikat „RapidMiner Analyst “ erwerben, mit dem Sie Ihre neue Qualifizierung nach außen sichtbar machen.

Grundlegende Methoden der Datenaufbereitung, Erstellen analytischer Vorhersagemodelle, Anwendung analytischer Vorhersagemodelle, Evaluation von Modellen im Hinblick auf verschiedene Gütekriterien, Weiterführende Methoden der Datenaufbereitung, Erstellen komplexer, analytischer Vorhersagemodelle, Anwendung analytischer Vorhersagemodelle, Evaluation und Optimierung von Modellen im Hinblick auf verschiedene Gütekriterien

Jetzt Buchen

Köln 0 Tage Practitioner

13. Januar 2020

Data Science mit Python – Einführung in Python

Folgende Themen werden behandelt:

Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Die Entwicklungsumgebung (IDE) Spyder
- Aspekte von Python, die anders als in anderen Programmiersprachen sind
Datenstrukturen in Python
- Unterschied Funktionen vs. Methoden
- Datenstrukturen in Python (number, tuple, list, dictionary, string)
- Überblick und wichtige Methoden zu den Datenstrukturen
- Unterschied list vs. tuple
- Die Besonderheit des Wertes NaN
- Wann benutze ich welche Klammer [], (), {}?
- List comprehension
Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile ansprechen, hinzufügen, löschen und verändern
- Eine Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Fehlende Werte ergänzen
- Logische Operatoren
Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Subplots erstellen
- Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- While Schleife
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Cross-validation (Kreuzvalidierung)
Weitere Machine Learning Algorithmen in Python
- Erklärung von (SVM), Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)

Jetzt Buchen

Köln 2 Tage Practitioner

20. Januar 2020

Einstieg in Data Science mit Pandas

Das Python-Paket Pandas ist als universeller Werkzeugkasten für den Bereich Data Science nicht mehr wegzudenken. Die 2-tägige Schulung vermittelt die Grundlagen und Funktionsweisen dieses mächtigen Tools und gibt Hilfestellung für einen optimalen Einsatz von Pandas im Unternehmenskontext.

Nach der Schulung wissen Sie, wie Sie Datenaufbereitung, Datenaggregation und Datenvisualisierung mit Pandas umsetzen und haben anhand von praktischen Beispielen ein Gefühl für den Einsatz von Pandas im Unternehmenskontext erhalten.

Folgende Themen werden behandelt:

Pandas im Überblick
- Datenaufbereitung
- Datenaggregation
- Datenvisualisierung
Einführung in Pandas
- Aggregatfunktionen
- Zeitreihen
- Geodaten
- Best Practices

Jetzt Buchen

Köln 2 Tage Special

21. Januar 2020

Big Data mit Amazon Web Services (AWS)

Die 2-tägige Schulung vermittelt technisches Grundlagenwissen zu den Big-Data Lösungen von Amazon Web Services (AWS).

Nach der Schulung wissen Sie, welche Tools bei der effizienten Verarbeitung von großen Datenmengen hilfreich sind. Auf Basis von Amazon Web Services (AWS) werden Sie sichere und produktive Big Data Umgebungen einrichten können.

Folgende Themen werden behandelt:

Big Data - Konzeptuelle Grundlagen
- Einführung
- Klassifizierung von Methoden
- überwachtes und unüberwachtes Lernen
Big Data - Grundlegende Tools
- Apache Hadoop
- Hadoop distributed File System (HDFS)
- SQL/NoSQL Abfragen
AWS Setup für Big Data
- AWS Services für Big Data
- Apache Hadoop und Amazon EMR
- Installation und Konfiguration einesAmazon EMR Clusters
- Programmierframeworks für Amazon EMR (z.B.Hive, Pig, usw.)
- Hadoop User Experience (HUE)
AWS Datenverarbeitung
- In-Memory Datenanalyse mit Apache Spark und Amazon EMR
- AWS Datenspeicherung
- (Fast) Realtime Datenverarbeitung mit AWS Kinesis
- Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
Kosten,
-Sicherheit und Visualisierung
- AWS Abrechnungsmodelle
- IT-Sicherheit und AWS Big-Data Anwendungen
- Interaktive Datenabfrage- und Analyse mit Amazon Athena
- Automatisiertes extrahieren, transformieren und laden von Daten mittels AWS Glue
- Visualisierung von Daten und Abfragen via Amazon QuickSight

Jetzt Buchen

Köln 3 Tage Practitioner

22. Januar 2020

Jupyter Notebook Infrastruktur für effiziente Data Science Workflows

Wer als Datenanalyst tätig ist, wird an Jupyter kaum vorbei kommen. Die 3-tägige Schulung gibt einen Überblick über iPython und den Funktionsumfang von Jupyter. Der Fokus der Schulung liegt auf dem Aufbau einer Infrastruktur auf Basis von Jupyter Notebooks, die den Arbeitsalltag eines Datanalysten deutlich erleichtert.

Nach der Schulung können Sie über Jupyter mit Notebooks arbeiten und können auf Basis einer für Datenanalysten zugeschnittenen Infrastruktur effizienter im Projektalltag arbeiten.

Folgende Themen werden behandelt:

Einführung, Überblick
- iPython und Jupyter
- JupyterHub
- nbconvert und nbviewer
- Kernels
Notebooks erweitern
- Widgets
- nbextensions
- Dashboards
- Notebooks einbetten
Praxis mit Jupyter
- Reproduzierbare Notebooks
- Parametrisierung
- Zeitplanung
- Refactoring

Jetzt Buchen

Köln 1 Tage Explorer

6. Februar 2020

Machine Learning: Grundlagen kompakt

Neben wichtigen Grundkonzepten des Machinellen Lernens, erhalten Sie einen fundierten Überblick über Tools, die für den Aufbau Neuronaler Netze hilfreich sind.

Folgende Themen werden behandelt:

Intelligente Agenten
- Struktur von Agenten, Agentenprogramm, Agentenfunktion
- Agenten-Grundtypen
- Modellbasierter Reflexagent
- Lernender Agent
Maschinelles Lernen
- Lernformen: nicht überwachtes Lernen, verstärkendes Lernen, überwachtes Lernen
- Lernen aus Beispielen
- Trainingsmenge versus Testmenge
- Generalisierungsfähigkeit der gelernten Abbildung
- Problem der Überanpassung
Neuronale Netze, Multi Layer Perceptrons
- Vom biologischen zum technischen Neuron
- Perceptron
- Nichtlineare Aktivierungsfunktionen
- Multi-Layer-Perceptrons (mehrschichtige neuronale Netze)
- Lernalgorithmus "Backpropagation of Error"
- Beispiele zu Regression und Klassifikation mit Multi Layer Perceptrons
- praktische Tipps
- deep learning
- Beispiele und Demos zu deep learning
Neuronale Netze, Convolutional Neural Networks (CNN)
- Grundidee und Topologie CNN
- Beispiele und Demos zu Convolutional Neural Networks / Deep Learning
Neuronale Netze, Recurrent Neural Networks (RNN, LSTM)
- Grundidee und Topologie RNN
- Lernalgorithmus "Backpropagation Through Time"
- Long Short-Term Memory Networks (LSTM)
- Beispiele und Demos zu RNN und LSTM
Support-Vektor-Maschinen
- Grundidee und Unterschied zu Neuronalen Netzen
- Kernel-Trick zur Garantie der Linearen Separierbarkeit in höheren Dimensionen
- Beispiele und Demos zu Support Vector Machines
- Praktische Tipps
Hinweise zu Tools, Internet-Quellen und Literatur
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 2 Tage Special

6. Februar 2020

Tableau – Einstieg in Visualisierungen und Dashboards

Die 2-tägige Schulung bereitet Erstanwender und Anfänger auf die Erstellung von Visualisierungen und Dashboards mit Tableau, inkl. Dateneinlesung, Formeln und Stories vor.

Teilnehmer haben nach der Schulung erste praktische Erfahrung mit der Anwendung von Tableau gemacht und sind für eine produktive Arbeit und die Erstellung von Dashboards mit Tableau bestens gerüstet.

Folgende Themen werden behandelt:

Vorstellung des Tools und seiner Varianten
Anbindung von Datenquellen
Unterschiede Extrakt- und Live-Datenquellen
Optional: Erstellung von Serverdatenquellen zur gemeinsamen Nutzung
Ebenen der Datenfilterung
Erstellung von Visualisierungen
Zeitliche und geographischen Datenanalyse
Unterschied diskrete und fortlaufende Dimensionen
Formelerstellung und Berechnungen
Berechnungskontexte: Level-of-Detail-Ausdrücke
Erstellung von Gruppen und Sets
Erstellung von Dashboards
Erstellung von Stories
Verknüpfung unterschiedlicher Datenquellen: Join und Blending

Coming Soon…

Köln 1 Tage Expert

7. Februar 2020

Machine Learning: Praxistag mit TensorFlow

Folgende Themen werden behandelt:

Installation Python für Windows
Installation TensorFlow für Windows
Installation weiterer nützlicher Python-Packages
Jupyter Notebooks
Zahlen, Vektoren, Matrizen und Tensoren
"Hello world!" mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow Keras
Convolutional Neural Networks (CNN) mit TensorFlow Keras
Visualisierung mit TensorBoard
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 3 Tage Expert

10. Februar 2020

Machine Learning mit Python

Wenn Sie Automatisierungsprozesse vorantreiben und ein Gespür für den Wert Ihrer Daten bekommen möchten, ist diese 3-tägige Schulung perfekt geeignet. Sie lernen den Umgang gängiger Lernalgorithmen aus der Scikit-Learn Bibliothek und erhalten anhand praktischer Beispiele ein Verständis zu statischen Grundlagen.

Folgenden Themen werden behandelt:

Daten ziehen und aufbereiten
- Dateien im Verzeichnis ansteuern
- Standardverfahren zum Lesen/Schreiben von Text- und CSV-Dateien
- SQL-Datenbanken ansteuern
- Arbeiten mit Datenmatrizen: Einführung in Numpy & Pandas
- Daten inspizieren und beschreiben
- Fehlende Werte behandeln
Machine Learning Grundlagen
- Grundlagen, Varianten und Techniken des Machine Learnings.
- Arbeiten mit der Machine Learning Bibliothek scikit-learn.
- Einfache Zusammenhänge zwischen stetigen Variablen modellieren: Lineare Regression
- Klassifizieren mit Logistic Regression, Softmax und Support Vector Machine.
- Modellen evaluieren: Accuracy, Precision, Recall & Confusion matrix
- Unterteilen der Daten in Trainings- und Testdaten
Feature-Extraction
- Kategoriale Daten vorbereiten: One-Hot Codierung
- Standardisierung von Daten
- Dimensionsreduktion mit PCA (Principle Component Analysis)
- Aufbereitung von Textdaten: Tokenizer und Bag-of-words.
Machine Learning Workflow
- Daten aufarbeiten und zusammenführen (DataMapper)
- Pipelines einrichten
- Speichern und laden trainierter Klassifizierer

Jetzt Buchen

Köln 5 Tage Special

10. Februar 2020

Python – Komplett

Folgende Inhalte werden behandelt: 1.-3. Tag: Auch separat buchbar als Python Basiswissen

Organisation von Python-Code bei umfangreichen Projekten
- Packages
- import
list, tuple, dict (Zusammenfassung aus "Python-Einführung"
list, tuple dict, set (advanced features):
- List Comprehensions
- Generator-Ausdrücke
- Iteratoren
- Mengen (sets)
- dict: update, get, setdefault, pop, items
Funktionsparameter
- Parameter-Defaults
- Funktionen mit beliebig langen Parameterlisten
- Packen und Entpacken von Listen, Tupeln und Dictionaries
- als Sequenzen von Funktionsparametern
Typumwandlungen der Grunddatentypen
- int, float, str, dict, list, tuple, set
Verschachtelte Collections
- Result sets, list of dictionaries
Dateien, Objektserialisierung und Objektbanken
- file
- shelf als Beispiel von pickle-Anwendung
Python-Klassen (Python-Typen)
- object methods
- static methods
- class methods
- get/set methods (Vergleich mit JavaBeans)
- properties
- filigrane Zugriffsrechte auf Objektattribute
- (Vergleich mit Java-Zugriffsrechten)
- Operatorenüberladung
- list-like objects
- dictionary-like objects
- callable objects
- Vererbung
Exceptions
- Eigene Fehlerklassen modellieren
- Eigene Fehlerobjekte in Methoden einbauen
Das Dokumentationssystem von Python
- das Objektattribut __doc__ (docstring)
- reStructuredText als Syntax von docstring
- automatische Generierung von Dokumentation (epydoc)
Python UnitTests (eine kurze Einführung)
- der Zusammenhang von UnitTests und docstrings
- der Python-Interpreter als Betriebssystem
- die Module os, sys, shutils
Graphische Benutzeroberfläche (GUI) (eine kurze Einführung)
SQL-Datenbankanbindung mit Python (kurze Beispiele)
Threads (eine kurze Einführung)

4.-5. Tag: Auch separat buchbar als Python Aufbau SQL mit Python:

Python SQLite
- neue Tabellen anlegen
- Daten in die Tabelle einfügen
- Daten abfragen
- update
- Datentypen in SQLite
- Adapter und Konvertierer
Die Einheitliche Python-DB-API
Python und MySQL (MySQLdb)
Python und Oracle
Python und ODBC

Python-Objektdatenbank (ZODB-Zope Object Database)

ZODB als selbständige Datenbank installieren (ohne Zope)
Die Erfüllung von Datenbank-Standards (ACID) durch die ZODB
- Atomicity
- Consistency
- Isolation
- Durability
Die hierarchische Objektstruktur der ZODB
Persistenzregeln beim Update von Veränderungen an ZODB-Objekten
Persistente Objektreferenzen in der ZODB
Hinweis auf advanced features: mounting, distributing
Eine einfache Anwendung als Beispiel

Object Relational Mapping

SQLAlchemy als Brücke zwischen ZODB und SQL-Datenbanken

Jetzt Buchen

Köln 2 Tage Special

27. Februar 2020

Analytics Architekturen für Big Data, BI, DWH und AI

In zwei intensiven Schulungstagen lernen Sie unterschiedliche Architekturvarianten kennen. Mit diesem Grundlagenwissen können Sie Architekturalternativen bewerten, Risiken einschätzen und eigene Entwürfe einbringen.

Nach der Schulung kennen Sie die aktuellen Technologien für analytische Systeme und wissen, welche Systeme für den passenden Unternehmenskontext geeignet sind.

Folgende Themen werden behandelt:

Data-Warehouse-Architekturen
Datenmodelle
Data-Warehouse-Prozesse
Reporting und Analyse
Moderne Datenhaltungskonzepte
Big-Data-Architekturen
Data Lake und Big Data Warehouse

Jetzt Buchen

Köln 1 Tage Explorer

2. März 2020

Data Science: Grundlagen der Statistik kompakt

Kompaktschulung zu statistischen Grundlagen, die für die Themengebiete Data Science und Machine Learning notwendig sind.

Mit dieser Grundlagenschulung bauen Sie sich ein statistisches Fundament auf. Die Kompaktschulung vermittelt die wesentlichen Grundlagen der beschreibenden und schließenden Statistik.

Folgende Themen werden behandelt:

Grundlagen der beschreibenden Statistik
- Stichprobe versus Gesamtheit
- statistische Skalen: nominal, ordinal, metrisch
- relative Häufigkeiten und kumulierte relative Häufigkeiten, empirische Verteilungsfunktion
- Histogramm für klassierte Daten
- Lagemaße: arithmetisches Mittel, Median, Quantile
- Box-Whisker-Plot
- Streuungsmaße: Varianz und Standardabweichung
- zweidimensionale Datensätze, Streudiagramm
- Zusammenhangsmaße: Korrelation
- Lineare Regression
Grundlagen der schließenden Statistik
- Schließen von der Stichprobe auf die Gesamtheit
- Wahrscheinlichkeit versus relative Häufigkeit
- diskrete und stetige Zufallsvariablen
- Gaußkurve, Normalverteilung
- Vertrauensbereich, Konfidenzintervalle
- Grundlagen der Hypothesentests (Nullhypothese, Alternativhypothese, Signifikanzniveau)
- Hypothesentest-Typen (Mittelwerttest, Anteilstest, Unabhängigkeitstest, F-Test als Gesamtmodell-Test, t-Test) und Anwendungsbereiche
- Ausblick: einfaktorielle Varianzanalyse
- Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 1 Tage Explorer

3. März 2020

Data Science: Grundlagen der Statistik, Praxistag mit Excel

In diesem Praxistag lernen Sie die drei Zugangswege zu statistischen Analysen in Verwendung mit Excel kennen. Durch die Arbeit mit Fallbeispielen bekommen Sie ein Verständnis für die Darstellung und Berechnung verschiedener Kennzahlen, Analysen und Diagramme in Excel.

Nach dem Praxistag können Sie mit Hilfe von Excel eigenständig statistische Analysen erstellen, statistische Kennzahlen berechnen und Diagramme erzeugen.

Folgende Themen werden behandelt:

Excel: Statistik mit den Analyse-Funktionen
Excel: Statistik mit den Formeln
Excel: Statistik mit den Diagrammen
Fallstudie, Berechnung von statistischen Kennzahlen
Fallstudie, Darstellung von statistischen Diagrammen
Unterschiede in den verschiedenen Excel-Versionen
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 4 Tage Expert

9. März 2020

Deep Learning mit Python & Keras

Folgende Themen werden behandelt:

Wie lernen Neuronale Netze?
- Variablen, Modelle und Zusammenhänge
- Künstliche Neuronen und neuronale Netze
- Mathematische Grundlagen des Anlernprozesses: Backpropagation, Loss und Gradient Descent
Neuronale Netze mit Keras aufbauen und trainieren
- Graphen mit Tensorflow erstellen
- Ein einfaches Netz mit Keras und Tensorflow aufbauen und anlernen
- Welches Modell ist das richtige? Evaluation und Anpassung angelernter Modelle.
- Einsatz angelernter Modelle zur Klassifzierung und Schätzung
- Modelle speichern und laden
- Overfitting mit Dropout-Layern verhindern
- Überwachung des Anlernprozesses mit TensorBoard
Maschinelles Sehen: Konvolutionale neuronale Netze (CNN)
- Bilddateien als mehrdimensionale Matrizen
- Details sehen und Formen abstrahieren: Konvolutionale Netze (CNN)
- Konvolutionale Layer mit Keras aufbauen und anlernen
- Vortrainierte Layer einsetzen
Mit Sequenzdaten arbeiten: Rekurrente neuronale Netze (RNN)
- Zeitreihendaten und Textsequenzen: Eigenschaften und Eigenheiten
- Neuronale Netze mit Gedächtnis (Feedforward vs. RNN)
- Sequenzdaten mit LSTM (Long Short-Term Memory) aufbauen
- Textdaten mit Embedding-Layers interpretieren
Feature Extraction: Numerische Daten, Bild und Text-Daten vorbereiten
- Datenrepräsentation: Skalare, Vektoren & Matrizen in Numpy
- Daten einlesen und vorbereiten mit Pandas, Scikit-learn und Keras
- Qualitativer Variablen und Dummy-Sets
- Standardisierung von Daten
- Dimensionsreduktion mit PCA
- Bilddateien transformieren
- Mit Textdaten arbeiten: Zerlegen, tokenizieren, vektorisieren und einbetten.

Jetzt Buchen

Köln 3 Tage Special

16. März 2020

Python für Programmiereinsteiger

Folgende Themen werden behandelt:

Einführung in Python
- Python: Unterschied zu Java / C#.NET / C++ / PHP
- Kurzübersicht über die Editoren
- Die Entwicklungsumgebung
- Einrichten eines Python-Projekts
- Grundsätzlicher Aufbau eines Python-Programms
Syntax von Python
- Die Help-Funktion
- Kommentare
- Allgemeine Datentypen
- int, float, Decimal, bool, string
- Konvertierungen zwischen Datentypen
- Logische und arithmetische Operatoren
- Formatierte Ausgaben mit format()
- Funktionen, Parameterübergabe
- Die pass-Anweisung
- Lambda-Expressions
Übungen zur Programmlogik
- Viele ausgewählte Übungen
- Schleifen: for und while
- Die range-Funktion
- Bedingungen: if, elif, else
- Übungen zu verbesserter Performance
Objektorientierte Programmierung
- Einstieg in objektorientierte Programmierung
- Datenkapselung, Vererbung, Polymorphie
- Klassen und Objekte
- Die Klasse Object
- Mehrfachvererbung
- Überschreiben von Methoden der Basisklasse
- Viele Übungen: eigene Klassen schreiben
Exceptionhandling in Python
- Die Klasse Exception
- try / except / finally
- Erstellen einer eigenen Fehlerklasse
Weitere optionale Themen
- Dateien lesen und schreiben
- Operatorüberladung
- Reguläre Ausdrücke

Jetzt Buchen

Köln 5 Tage Explorer

23. März 2020

Grundlagenwoche – Data Science

Die Teilnehmer sind in der Lage, eine vollständige Data Science Lösung zu entwerfen, umzusetzen und zu bewerten. Sie können marktübliche Kenntnisse und Kompetenzen erwerben.

Jetzt Buchen

Köln 3 Tage Practitioner

15. April 2020

Data Science mit Python – Einführung in Python

Folgende Themen werden behandelt:

Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Die Entwicklungsumgebung (IDE) Spyder
- Aspekte von Python, die anders als in anderen Programmiersprachen sind
Datenstrukturen in Python
- Unterschied Funktionen vs. Methoden
- Datenstrukturen in Python (number, tuple, list, dictionary, string)
- Überblick und wichtige Methoden zu den Datenstrukturen
- Unterschied list vs. tuple
- Die Besonderheit des Wertes NaN
- Wann benutze ich welche Klammer [], (), {}?
- List comprehension
Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile ansprechen, hinzufügen, löschen und verändern
- Eine Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Fehlende Werte ergänzen
- Logische Operatoren
Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Subplots erstellen
- Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- While Schleife
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Cross-validation (Kreuzvalidierung)
Weitere Machine Learning Algorithmen in Python
- Erklärung von (SVM), Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)

Jetzt Buchen

Köln 2 Tage Explorer

20. April 2020

Data Science – Einführung für angehende Data Scientists

Die 2-tägige Schulung bereitet Sie auf einen Einstieg im Bereich Data Science vor. Neben Grundlagenwissen zu Data Science und Machine Learning, werden Sie Tools und Sprachen kennenlernen, die für ganz unterschiedliche Aufgabengebiete im Arbeitsumfeld eines Data Scientists eingesetzt werden.

Nach der Schulung haben Sie das Grundlagenwissen, um als Data Scientist im Unternehmenskontext erste Herausforderungen zu meistern und eigene Ideen weiterzuentwickeln.

Folgende Themen werden behandelt:

Einführung und Einbindung von Data Science in einen betriebswirtschaftlichen Rahmen
Vorgehensmodelle und Zieldefinitionen für Data-Science-Projekte
Data-Science-Methoden (insbesondere Machine Learning) und Werkzeuge
Praktische Umsetzung eines Data-Science- Prozesses in einem Tool
Tipps, Tricks und Kniffe für ein gutes Data-Science-Produkt

Jetzt Buchen

Köln 5 Tage Practitioner

20. April 2020

Data Science und R Einführung – Komplett für angehende Data Scientists

Wenn Sie Data Science im Unternehmenskontext einsetzen möchten, ist diese Schulung perfekt geeignet. In der intensiven 5-tägigen Schulung wird der Umgang mit allen notwendigen Tools geübt, es werden Data Science Methoden, insbesondere Machine Learning geschult und es gibt jede Menge gute Tipps, Tricks & Kniffe für ein hervorragendes Data Science Produkt.

Nach der Schulung wissen Sie, worauf es bei Data Science im Unternehmenskontext ankommt. Sie kennen Tools, Tricks & Kniffe, die Ihnen den Arbeitsalltag als Data Scientist erleichtern werden. Nach der Schulung werden Sie in der Lage sein, erste Projekte mit Hilfe der Programmiersprache R unter Einsatz von R Studio zu begleiten oder selbst zu starten.

Folgende Themen werden behandelt: 1.-2. Tag: Auch separat buchbar als Data Science - Einführung für angehende Data Scientists

Einführung und Einbindung von Data Science in einen betriebswirtschaftlichen Rahmen
Vorgehensmodelle und Zieldefinitionen für Data-Science-Projekte
Data-Science-Methoden (insbesondere Machine Learning) und Werkzeuge
Praktische Umsetzung eines Data-Science- Prozesses in einem Tool
Tipps, Tricks und Kniffe für ein gutes Data-Science-Produkt

3.-5. Tag: Auch separat buchbar als Einführung R für Data Scientists

Funktionale Programmierung
Grundlagen der Skriptsprache R
Entwicklungsumgebung Rstudio
Grundlegende statistische Verfahren
Umsetzung exemplarischer Data-Science-Prozesse in R
Visualisierung und Vorverarbeitung der Daten
Modellbildung mit aktuellen Machine-Learning-Algorithmen
Erstellung und Bewertung von Prognosen für typische Anwendungsfälle

Jetzt Buchen

Köln 2 Tage Special

21. April 2020

Big Data mit Amazon Web Services (AWS)

Die 2-tägige Schulung vermittelt technisches Grundlagenwissen zu den Big-Data Lösungen von Amazon Web Services (AWS).

Folgende Themen werden behandelt:

Big Data - Konzeptuelle Grundlagen
- Einführung
- Klassifizierung von Methoden
- überwachtes und unüberwachtes Lernen
Big Data - Grundlegende Tools
- Apache Hadoop
- Hadoop distributed File System (HDFS)
- SQL/NoSQL Abfragen
AWS Setup für Big Data
- AWS Services für Big Data
- Apache Hadoop und Amazon EMR
- Installation und Konfiguration einesAmazon EMR Clusters
- Programmierframeworks für Amazon EMR (z.B.Hive, Pig, usw.)
- Hadoop User Experience (HUE)
AWS Datenverarbeitung
- In-Memory Datenanalyse mit Apache Spark und Amazon EMR
- AWS Datenspeicherung
- (Fast) Realtime Datenverarbeitung mit AWS Kinesis
- Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
Kosten,
-Sicherheit und Visualisierung
- AWS Abrechnungsmodelle
- IT-Sicherheit und AWS Big-Data Anwendungen
- Interaktive Datenabfrage- und Analyse mit Amazon Athena
- Automatisiertes extrahieren, transformieren und laden von Daten mittels AWS Glue
- Visualisierung von Daten und Abfragen via Amazon QuickSight

Jetzt Buchen

Köln 3 Tage Practitioner

22. April 2020

Einführung R für Data Scientists

Die Schulung vermittelt die Grundlagen zum Einsatz von R, eine der meistverwendeten Data-Science Programmiersprachen weltweit. In der Schulung wird auf konkrete Data-Science Fragestellungen im Unternehmenskontext eingegangen.

Nach der Schulung werden Sie in der Lage sein, erste Projekte mit Hilfe der Programmiersprache R unter Einsatz von R Studio zu begleiten oder selbst zu starten.

Folgende Themen werden vermittelt: Diese Agenda ist auch Bestandteil (3.-5. Tag) des Kurses Data Science und R Einführung - Komplett für angehende Data Scientists

Funktionale Programmierung
Grundlagen der Skriptsprache R
Entwicklungsumgebung Rstudio
Grundlegende statistische Verfahren
Umsetzung exemplarischer Data-Science-Prozesse in R
Visualisierung und Vorverarbeitung der Daten
Modellbildung mit aktuellen Machine-Learning-Algorithmen
Erstellung und Bewertung von Prognosen für typische Anwendungsfälle

Jetzt Buchen

Köln 2 Tage Practitioner

4. Mai 2020

Einstieg in Data Science mit Pandas

Folgende Themen werden behandelt:

Pandas im Überblick
- Datenaufbereitung
- Datenaggregation
- Datenvisualisierung
Einführung in Pandas
- Aggregatfunktionen
- Zeitreihen
- Geodaten
- Best Practices

Jetzt Buchen

Köln 5 Tage Special

4. Mai 2020

Python – Komplett

Folgende Inhalte werden behandelt: 1.-3. Tag: Auch separat buchbar als Python Basiswissen

Organisation von Python-Code bei umfangreichen Projekten
- Packages
- import
list, tuple, dict (Zusammenfassung aus "Python-Einführung"
list, tuple dict, set (advanced features):
- List Comprehensions
- Generator-Ausdrücke
- Iteratoren
- Mengen (sets)
- dict: update, get, setdefault, pop, items
Funktionsparameter
- Parameter-Defaults
- Funktionen mit beliebig langen Parameterlisten
- Packen und Entpacken von Listen, Tupeln und Dictionaries
- als Sequenzen von Funktionsparametern
Typumwandlungen der Grunddatentypen
- int, float, str, dict, list, tuple, set
Verschachtelte Collections
- Result sets, list of dictionaries
Dateien, Objektserialisierung und Objektbanken
- file
- shelf als Beispiel von pickle-Anwendung
Python-Klassen (Python-Typen)
- object methods
- static methods
- class methods
- get/set methods (Vergleich mit JavaBeans)
- properties
- filigrane Zugriffsrechte auf Objektattribute
- (Vergleich mit Java-Zugriffsrechten)
- Operatorenüberladung
- list-like objects
- dictionary-like objects
- callable objects
- Vererbung
Exceptions
- Eigene Fehlerklassen modellieren
- Eigene Fehlerobjekte in Methoden einbauen
Das Dokumentationssystem von Python
- das Objektattribut __doc__ (docstring)
- reStructuredText als Syntax von docstring
- automatische Generierung von Dokumentation (epydoc)
Python UnitTests (eine kurze Einführung)
- der Zusammenhang von UnitTests und docstrings
- der Python-Interpreter als Betriebssystem
- die Module os, sys, shutils
Graphische Benutzeroberfläche (GUI) (eine kurze Einführung)
SQL-Datenbankanbindung mit Python (kurze Beispiele)
Threads (eine kurze Einführung)

4.-5. Tag: Auch separat buchbar als Python Aufbau SQL mit Python:

Python SQLite
- neue Tabellen anlegen
- Daten in die Tabelle einfügen
- Daten abfragen
- update
- Datentypen in SQLite
- Adapter und Konvertierer
Die Einheitliche Python-DB-API
Python und MySQL (MySQLdb)
Python und Oracle
Python und ODBC

Python-Objektdatenbank (ZODB-Zope Object Database)

ZODB als selbständige Datenbank installieren (ohne Zope)
Die Erfüllung von Datenbank-Standards (ACID) durch die ZODB
- Atomicity
- Consistency
- Isolation
- Durability
Die hierarchische Objektstruktur der ZODB
Persistenzregeln beim Update von Veränderungen an ZODB-Objekten
Persistente Objektreferenzen in der ZODB
Hinweis auf advanced features: mounting, distributing
Eine einfache Anwendung als Beispiel

Object Relational Mapping

SQLAlchemy als Brücke zwischen ZODB und SQL-Datenbanken

Jetzt Buchen

Köln 3 Tage Practitioner

6. Mai 2020

Jupyter Notebook Infrastruktur für effiziente Data Science Workflows

Nach der Schulung können Sie über Jupyter mit Notebooks arbeiten und können auf Basis einer für Datenanalysten zugeschnittenen Infrastruktur effizienter im Projektalltag arbeiten.

Folgende Themen werden behandelt:

Einführung, Überblick
- iPython und Jupyter
- JupyterHub
- nbconvert und nbviewer
- Kernels
Notebooks erweitern
- Widgets
- nbextensions
- Dashboards
- Notebooks einbetten
Praxis mit Jupyter
- Reproduzierbare Notebooks
- Parametrisierung
- Zeitplanung
- Refactoring

Jetzt Buchen

Köln 2 Tage Special

7. Mai 2020

Analytics Architekturen für Big Data, BI, DWH und AI

Nach der Schulung kennen Sie die aktuellen Technologien für analytische Systeme und wissen, welche Systeme für den passenden Unternehmenskontext geeignet sind.

Folgende Themen werden behandelt:

Data-Warehouse-Architekturen
Datenmodelle
Data-Warehouse-Prozesse
Reporting und Analyse
Moderne Datenhaltungskonzepte
Big-Data-Architekturen
Data Lake und Big Data Warehouse

Jetzt Buchen

Köln 1 Tage Expert

7. Mai 2020

Machine Learning: Grundlagen kompakt

Neben wichtigen Grundkonzepten des Machinellen Lernens, erhalten Sie einen fundierten Überblick über Tools, die für den Aufbau Neuronaler Netze hilfreich sind.

Folgende Themen werden behandelt:

Intelligente Agenten
- Struktur von Agenten, Agentenprogramm, Agentenfunktion
- Agenten-Grundtypen
- Modellbasierter Reflexagent
- Lernender Agent
Maschinelles Lernen
- Lernformen: nicht überwachtes Lernen, verstärkendes Lernen, überwachtes Lernen
- Lernen aus Beispielen
- Trainingsmenge versus Testmenge
- Generalisierungsfähigkeit der gelernten Abbildung
- Problem der Überanpassung
Neuronale Netze, Multi Layer Perceptrons
- Vom biologischen zum technischen Neuron
- Perceptron
- Nichtlineare Aktivierungsfunktionen
- Multi-Layer-Perceptrons (mehrschichtige neuronale Netze)
- Lernalgorithmus "Backpropagation of Error"
- Beispiele zu Regression und Klassifikation mit Multi Layer Perceptrons
- praktische Tipps
- deep learning
- Beispiele und Demos zu deep learning
Neuronale Netze, Convolutional Neural Networks (CNN)
- Grundidee und Topologie CNN
- Beispiele und Demos zu Convolutional Neural Networks / Deep Learning
Neuronale Netze, Recurrent Neural Networks (RNN, LSTM)
- Grundidee und Topologie RNN
- Lernalgorithmus "Backpropagation Through Time"
- Long Short-Term Memory Networks (LSTM)
- Beispiele und Demos zu RNN und LSTM
Support-Vektor-Maschinen
- Grundidee und Unterschied zu Neuronalen Netzen
- Kernel-Trick zur Garantie der Linearen Separierbarkeit in höheren Dimensionen
- Beispiele und Demos zu Support Vector Machines
- Praktische Tipps
Hinweise zu Tools, Internet-Quellen und Literatur
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 1 Tage Expert

8. Mai 2020

Machine Learning: Praxistag mit TensorFlow

Folgende Themen werden behandelt:

Installation Python für Windows
Installation TensorFlow für Windows
Installation weiterer nützlicher Python-Packages
Jupyter Notebooks
Zahlen, Vektoren, Matrizen und Tensoren
"Hello world!" mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow Keras
Convolutional Neural Networks (CNN) mit TensorFlow Keras
Visualisierung mit TensorBoard
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 2 Tage Special

18. Mai 2020

Tableau – Einstieg in Visualisierungen und Dashboards

Die 2-tägige Schulung bereitet Erstanwender und Anfänger auf die Erstellung von Visualisierungen und Dashboards mit Tableau, inkl. Dateneinlesung, Formeln und Stories vor.

Folgende Themen werden behandelt:

Vorstellung des Tools und seiner Varianten
Anbindung von Datenquellen
Unterschiede Extrakt- und Live-Datenquellen
Optional: Erstellung von Serverdatenquellen zur gemeinsamen Nutzung
Ebenen der Datenfilterung
Erstellung von Visualisierungen
Zeitliche und geographischen Datenanalyse
Unterschied diskrete und fortlaufende Dimensionen
Formelerstellung und Berechnungen
Berechnungskontexte: Level-of-Detail-Ausdrücke
Erstellung von Gruppen und Sets
Erstellung von Dashboards
Erstellung von Stories
Verknüpfung unterschiedlicher Datenquellen: Join und Blending

Jetzt Buchen

Köln 5 Tage Practitioner

25. Mai 2020

Praxiswoche – Data Science mit Python

Datenstrukturen in Python, Einführung in das Data Science Paket pandas (Daten einlesen, Data handling), grundlegende Statistiken mit pandas, Algorithmen im Data Science

Jetzt Buchen

Köln 2 Tage Special

28. Mai 2020

Datenmodellierung in Business-Intelligence und Big-Data-Systemen

Folgende Themen werden behandelt:

Informationssysteme und Kennzahlen
Data-Warehouse-Systeme
Relationale Datenmodelle
Entity-Relationship-Modell
Normalformen & Historisierung
Dimensionale Datenmodelle
Agile dimensionale Modellierung
Star- und Snowflake-Schema
Modellierung mit ADAPT
Data-Vault-Datenmodelle
Modellierung von Fachlogik
NoSQL-Datenmodelle

Jetzt Buchen

Köln 4 Tage Special

15. Juni 2020

Data Science mit RapidMiner: Grundlagen und fortgeschrittene Themen für Analysten

Die Schulungen sind auch geeignet, um neue Data Scientists auszubilden oder erfahrenen Data Scientists den Umstieg auf die Plattform RapidMiner zu erleichtern.

Jetzt Buchen

Köln 3 Tage Practitioner

15. Juni 2020

Data Science mit Python – Einführung in Python

Folgende Themen werden behandelt:

Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Die Entwicklungsumgebung (IDE) Spyder
- Aspekte von Python, die anders als in anderen Programmiersprachen sind
Datenstrukturen in Python
- Unterschied Funktionen vs. Methoden
- Datenstrukturen in Python (number, tuple, list, dictionary, string)
- Überblick und wichtige Methoden zu den Datenstrukturen
- Unterschied list vs. tuple
- Die Besonderheit des Wertes NaN
- Wann benutze ich welche Klammer [], (), {}?
- List comprehension
Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile ansprechen, hinzufügen, löschen und verändern
- Eine Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Fehlende Werte ergänzen
- Logische Operatoren
Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Subplots erstellen
- Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- While Schleife
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Cross-validation (Kreuzvalidierung)
Weitere Machine Learning Algorithmen in Python
- Erklärung von (SVM), Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)

Jetzt Buchen

Köln 3 Tage Practitioner

15. Juni 2020

Machine Learning mit Python

Folgenden Themen werden behandelt:

Daten ziehen und aufbereiten
- Dateien im Verzeichnis ansteuern
- Standardverfahren zum Lesen/Schreiben von Text- und CSV-Dateien
- SQL-Datenbanken ansteuern
- Arbeiten mit Datenmatrizen: Einführung in Numpy & Pandas
- Daten inspizieren und beschreiben
- Fehlende Werte behandeln
Machine Learning Grundlagen
- Grundlagen, Varianten und Techniken des Machine Learnings.
- Arbeiten mit der Machine Learning Bibliothek scikit-learn.
- Einfache Zusammenhänge zwischen stetigen Variablen modellieren: Lineare Regression
- Klassifizieren mit Logistic Regression, Softmax und Support Vector Machine.
- Modellen evaluieren: Accuracy, Precision, Recall & Confusion matrix
- Unterteilen der Daten in Trainings- und Testdaten
Feature-Extraction
- Kategoriale Daten vorbereiten: One-Hot Codierung
- Standardisierung von Daten
- Dimensionsreduktion mit PCA (Principle Component Analysis)
- Aufbereitung von Textdaten: Tokenizer und Bag-of-words.
Machine Learning Workflow
- Daten aufarbeiten und zusammenführen (DataMapper)
- Pipelines einrichten
- Speichern und laden trainierter Klassifizierer

Jetzt Buchen

Köln 4 Tage Expert

22. Juni 2020

Deep Learning mit Python & Keras

Folgende Themen werden behandelt:

Wie lernen Neuronale Netze?
- Variablen, Modelle und Zusammenhänge
- Künstliche Neuronen und neuronale Netze
- Mathematische Grundlagen des Anlernprozesses: Backpropagation, Loss und Gradient Descent
Neuronale Netze mit Keras aufbauen und trainieren
- Graphen mit Tensorflow erstellen
- Ein einfaches Netz mit Keras und Tensorflow aufbauen und anlernen
- Welches Modell ist das richtige? Evaluation und Anpassung angelernter Modelle.
- Einsatz angelernter Modelle zur Klassifzierung und Schätzung
- Modelle speichern und laden
- Overfitting mit Dropout-Layern verhindern
- Überwachung des Anlernprozesses mit TensorBoard
Maschinelles Sehen: Konvolutionale neuronale Netze (CNN)
- Bilddateien als mehrdimensionale Matrizen
- Details sehen und Formen abstrahieren: Konvolutionale Netze (CNN)
- Konvolutionale Layer mit Keras aufbauen und anlernen
- Vortrainierte Layer einsetzen
Mit Sequenzdaten arbeiten: Rekurrente neuronale Netze (RNN)
- Zeitreihendaten und Textsequenzen: Eigenschaften und Eigenheiten
- Neuronale Netze mit Gedächtnis (Feedforward vs. RNN)
- Sequenzdaten mit LSTM (Long Short-Term Memory) aufbauen
- Textdaten mit Embedding-Layers interpretieren
Feature Extraction: Numerische Daten, Bild und Text-Daten vorbereiten
- Datenrepräsentation: Skalare, Vektoren & Matrizen in Numpy
- Daten einlesen und vorbereiten mit Pandas, Scikit-learn und Keras
- Qualitativer Variablen und Dummy-Sets
- Standardisierung von Daten
- Dimensionsreduktion mit PCA
- Bilddateien transformieren
- Mit Textdaten arbeiten: Zerlegen, tokenizieren, vektorisieren und einbetten.

Jetzt Buchen

Köln 3 Tage Special

22. Juni 2020

Python für Programmiereinsteiger

Folgende Themen werden behandelt:

Einführung in Python
- Python: Unterschied zu Java / C#.NET / C++ / PHP
- Kurzübersicht über die Editoren
- Die Entwicklungsumgebung
- Einrichten eines Python-Projekts
- Grundsätzlicher Aufbau eines Python-Programms
Syntax von Python
- Die Help-Funktion
- Kommentare
- Allgemeine Datentypen
- int, float, Decimal, bool, string
- Konvertierungen zwischen Datentypen
- Logische und arithmetische Operatoren
- Formatierte Ausgaben mit format()
- Funktionen, Parameterübergabe
- Die pass-Anweisung
- Lambda-Expressions
Übungen zur Programmlogik
- Viele ausgewählte Übungen
- Schleifen: for und while
- Die range-Funktion
- Bedingungen: if, elif, else
- Übungen zu verbesserter Performance
Objektorientierte Programmierung
- Einstieg in objektorientierte Programmierung
- Datenkapselung, Vererbung, Polymorphie
- Klassen und Objekte
- Die Klasse Object
- Mehrfachvererbung
- Überschreiben von Methoden der Basisklasse
- Viele Übungen: eigene Klassen schreiben
Exceptionhandling in Python
- Die Klasse Exception
- try / except / finally
- Erstellen einer eigenen Fehlerklasse
Weitere optionale Themen
- Dateien lesen und schreiben
- Operatorüberladung
- Reguläre Ausdrücke

Jetzt Buchen

Köln 2 Tage Special

23. Juni 2020

Big Data mit Amazon Web Services (AWS)

Die 2-tägige Schulung vermittelt technisches Grundlagenwissen zu den Big-Data Lösungen von Amazon Web Services (AWS).

Folgende Themen werden behandelt:

Big Data - Konzeptuelle Grundlagen
- Einführung
- Klassifizierung von Methoden
- überwachtes und unüberwachtes Lernen
Big Data - Grundlegende Tools
- Apache Hadoop
- Hadoop distributed File System (HDFS)
- SQL/NoSQL Abfragen
AWS Setup für Big Data
- AWS Services für Big Data
- Apache Hadoop und Amazon EMR
- Installation und Konfiguration einesAmazon EMR Clusters
- Programmierframeworks für Amazon EMR (z.B.Hive, Pig, usw.)
- Hadoop User Experience (HUE)
AWS Datenverarbeitung
- In-Memory Datenanalyse mit Apache Spark und Amazon EMR
- AWS Datenspeicherung
- (Fast) Realtime Datenverarbeitung mit AWS Kinesis
- Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
Kosten,
-Sicherheit und Visualisierung
- AWS Abrechnungsmodelle
- IT-Sicherheit und AWS Big-Data Anwendungen
- Interaktive Datenabfrage- und Analyse mit Amazon Athena
- Automatisiertes extrahieren, transformieren und laden von Daten mittels AWS Glue
- Visualisierung von Daten und Abfragen via Amazon QuickSight

Jetzt Buchen

Köln 5 Tage Special

29. Juni 2020

Python – Komplett

Folgende Inhalte werden behandelt: 1.-3. Tag: Auch separat buchbar als Python Basiswissen

Organisation von Python-Code bei umfangreichen Projekten
- Packages
- import
list, tuple, dict (Zusammenfassung aus "Python-Einführung"
list, tuple dict, set (advanced features):
- List Comprehensions
- Generator-Ausdrücke
- Iteratoren
- Mengen (sets)
- dict: update, get, setdefault, pop, items
Funktionsparameter
- Parameter-Defaults
- Funktionen mit beliebig langen Parameterlisten
- Packen und Entpacken von Listen, Tupeln und Dictionaries
- als Sequenzen von Funktionsparametern
Typumwandlungen der Grunddatentypen
- int, float, str, dict, list, tuple, set
Verschachtelte Collections
- Result sets, list of dictionaries
Dateien, Objektserialisierung und Objektbanken
- file
- shelf als Beispiel von pickle-Anwendung
Python-Klassen (Python-Typen)
- object methods
- static methods
- class methods
- get/set methods (Vergleich mit JavaBeans)
- properties
- filigrane Zugriffsrechte auf Objektattribute
- (Vergleich mit Java-Zugriffsrechten)
- Operatorenüberladung
- list-like objects
- dictionary-like objects
- callable objects
- Vererbung
Exceptions
- Eigene Fehlerklassen modellieren
- Eigene Fehlerobjekte in Methoden einbauen
Das Dokumentationssystem von Python
- das Objektattribut __doc__ (docstring)
- reStructuredText als Syntax von docstring
- automatische Generierung von Dokumentation (epydoc)
Python UnitTests (eine kurze Einführung)
- der Zusammenhang von UnitTests und docstrings
- der Python-Interpreter als Betriebssystem
- die Module os, sys, shutils
Graphische Benutzeroberfläche (GUI) (eine kurze Einführung)
SQL-Datenbankanbindung mit Python (kurze Beispiele)
Threads (eine kurze Einführung)

4.-5. Tag: Auch separat buchbar als Python Aufbau SQL mit Python:

Python SQLite
- neue Tabellen anlegen
- Daten in die Tabelle einfügen
- Daten abfragen
- update
- Datentypen in SQLite
- Adapter und Konvertierer
Die Einheitliche Python-DB-API
Python und MySQL (MySQLdb)
Python und Oracle
Python und ODBC

Python-Objektdatenbank (ZODB-Zope Object Database)

ZODB als selbständige Datenbank installieren (ohne Zope)
Die Erfüllung von Datenbank-Standards (ACID) durch die ZODB
- Atomicity
- Consistency
- Isolation
- Durability
Die hierarchische Objektstruktur der ZODB
Persistenzregeln beim Update von Veränderungen an ZODB-Objekten
Persistente Objektreferenzen in der ZODB
Hinweis auf advanced features: mounting, distributing
Eine einfache Anwendung als Beispiel

Object Relational Mapping

SQLAlchemy als Brücke zwischen ZODB und SQL-Datenbanken

Jetzt Buchen

Köln 3 Tage Practitioner

17. August 2020

Data Science mit Python – Einführung in Python

Folgende Themen werden behandelt:

Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Die Entwicklungsumgebung (IDE) Spyder
- Aspekte von Python, die anders als in anderen Programmiersprachen sind
Datenstrukturen in Python
- Unterschied Funktionen vs. Methoden
- Datenstrukturen in Python (number, tuple, list, dictionary, string)
- Überblick und wichtige Methoden zu den Datenstrukturen
- Unterschied list vs. tuple
- Die Besonderheit des Wertes NaN
- Wann benutze ich welche Klammer [], (), {}?
- List comprehension
Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile ansprechen, hinzufügen, löschen und verändern
- Eine Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Fehlende Werte ergänzen
- Logische Operatoren
Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Subplots erstellen
- Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- While Schleife
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Cross-validation (Kreuzvalidierung)
Weitere Machine Learning Algorithmen in Python
- Erklärung von (SVM), Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)

Jetzt Buchen

Köln 2 Tage Practitioner

17. August 2020

Einstieg in Data Science mit Pandas

Folgende Themen werden behandelt:

Pandas im Überblick
- Datenaufbereitung
- Datenaggregation
- Datenvisualisierung
Einführung in Pandas
- Aggregatfunktionen
- Zeitreihen
- Geodaten
- Best Practices

Jetzt Buchen

Köln 3 Tage Practitioner

19. August 2020

Jupyter Notebook Infrastruktur für effiziente Data Science Workflows

Nach der Schulung können Sie über Jupyter mit Notebooks arbeiten und können auf Basis einer für Datenanalysten zugeschnittenen Infrastruktur effizienter im Projektalltag arbeiten.

Folgende Themen werden behandelt:

Einführung, Überblick
- iPython und Jupyter
- JupyterHub
- nbconvert und nbviewer
- Kernels
Notebooks erweitern
- Widgets
- nbextensions
- Dashboards
- Notebooks einbetten
Praxis mit Jupyter
- Reproduzierbare Notebooks
- Parametrisierung
- Zeitplanung
- Refactoring

Jetzt Buchen

Köln 2 Tage Special

20. August 2020

Tableau – Einstieg in Visualisierungen und Dashboards

Die 2-tägige Schulung bereitet Erstanwender und Anfänger auf die Erstellung von Visualisierungen und Dashboards mit Tableau, inkl. Dateneinlesung, Formeln und Stories vor.

Folgende Themen werden behandelt:

Vorstellung des Tools und seiner Varianten
Anbindung von Datenquellen
Unterschiede Extrakt- und Live-Datenquellen
Optional: Erstellung von Serverdatenquellen zur gemeinsamen Nutzung
Ebenen der Datenfilterung
Erstellung von Visualisierungen
Zeitliche und geographischen Datenanalyse
Unterschied diskrete und fortlaufende Dimensionen
Formelerstellung und Berechnungen
Berechnungskontexte: Level-of-Detail-Ausdrücke
Erstellung von Gruppen und Sets
Erstellung von Dashboards
Erstellung von Stories
Verknüpfung unterschiedlicher Datenquellen: Join und Blending

Jetzt Buchen

Köln 2 Tage Special

27. August 2020

Analytics Architekturen für Big Data, BI, DWH und AI

Nach der Schulung kennen Sie die aktuellen Technologien für analytische Systeme und wissen, welche Systeme für den passenden Unternehmenskontext geeignet sind.

Folgende Themen werden behandelt:

Data-Warehouse-Architekturen
Datenmodelle
Data-Warehouse-Prozesse
Reporting und Analyse
Moderne Datenhaltungskonzepte
Big-Data-Architekturen
Data Lake und Big Data Warehouse

Jetzt Buchen

Köln 1 Tage Expert

27. August 2020

Machine Learning: Grundlagen kompakt

Neben wichtigen Grundkonzepten des Machinellen Lernens, erhalten Sie einen fundierten Überblick über Tools, die für den Aufbau Neuronaler Netze hilfreich sind.

Folgende Themen werden behandelt:

Intelligente Agenten
- Struktur von Agenten, Agentenprogramm, Agentenfunktion
- Agenten-Grundtypen
- Modellbasierter Reflexagent
- Lernender Agent
Maschinelles Lernen
- Lernformen: nicht überwachtes Lernen, verstärkendes Lernen, überwachtes Lernen
- Lernen aus Beispielen
- Trainingsmenge versus Testmenge
- Generalisierungsfähigkeit der gelernten Abbildung
- Problem der Überanpassung
Neuronale Netze, Multi Layer Perceptrons
- Vom biologischen zum technischen Neuron
- Perceptron
- Nichtlineare Aktivierungsfunktionen
- Multi-Layer-Perceptrons (mehrschichtige neuronale Netze)
- Lernalgorithmus "Backpropagation of Error"
- Beispiele zu Regression und Klassifikation mit Multi Layer Perceptrons
- praktische Tipps
- deep learning
- Beispiele und Demos zu deep learning
Neuronale Netze, Convolutional Neural Networks (CNN)
- Grundidee und Topologie CNN
- Beispiele und Demos zu Convolutional Neural Networks / Deep Learning
Neuronale Netze, Recurrent Neural Networks (RNN, LSTM)
- Grundidee und Topologie RNN
- Lernalgorithmus "Backpropagation Through Time"
- Long Short-Term Memory Networks (LSTM)
- Beispiele und Demos zu RNN und LSTM
Support-Vektor-Maschinen
- Grundidee und Unterschied zu Neuronalen Netzen
- Kernel-Trick zur Garantie der Linearen Separierbarkeit in höheren Dimensionen
- Beispiele und Demos zu Support Vector Machines
- Praktische Tipps
Hinweise zu Tools, Internet-Quellen und Literatur
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 1 Tage Expert

28. August 2020

Machine Learning: Praxistag mit TensorFlow

Folgende Themen werden behandelt:

Installation Python für Windows
Installation TensorFlow für Windows
Installation weiterer nützlicher Python-Packages
Jupyter Notebooks
Zahlen, Vektoren, Matrizen und Tensoren
"Hello world!" mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow Keras
Convolutional Neural Networks (CNN) mit TensorFlow Keras
Visualisierung mit TensorBoard
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 5 Tage Special

31. August 2020

Python – Komplett

Folgende Inhalte werden behandelt: 1.-3. Tag: Auch separat buchbar als Python Basiswissen

Organisation von Python-Code bei umfangreichen Projekten
- Packages
- import
list, tuple, dict (Zusammenfassung aus "Python-Einführung"
list, tuple dict, set (advanced features):
- List Comprehensions
- Generator-Ausdrücke
- Iteratoren
- Mengen (sets)
- dict: update, get, setdefault, pop, items
Funktionsparameter
- Parameter-Defaults
- Funktionen mit beliebig langen Parameterlisten
- Packen und Entpacken von Listen, Tupeln und Dictionaries
- als Sequenzen von Funktionsparametern
Typumwandlungen der Grunddatentypen
- int, float, str, dict, list, tuple, set
Verschachtelte Collections
- Result sets, list of dictionaries
Dateien, Objektserialisierung und Objektbanken
- file
- shelf als Beispiel von pickle-Anwendung
Python-Klassen (Python-Typen)
- object methods
- static methods
- class methods
- get/set methods (Vergleich mit JavaBeans)
- properties
- filigrane Zugriffsrechte auf Objektattribute
- (Vergleich mit Java-Zugriffsrechten)
- Operatorenüberladung
- list-like objects
- dictionary-like objects
- callable objects
- Vererbung
Exceptions
- Eigene Fehlerklassen modellieren
- Eigene Fehlerobjekte in Methoden einbauen
Das Dokumentationssystem von Python
- das Objektattribut __doc__ (docstring)
- reStructuredText als Syntax von docstring
- automatische Generierung von Dokumentation (epydoc)
Python UnitTests (eine kurze Einführung)
- der Zusammenhang von UnitTests und docstrings
- der Python-Interpreter als Betriebssystem
- die Module os, sys, shutils
Graphische Benutzeroberfläche (GUI) (eine kurze Einführung)
SQL-Datenbankanbindung mit Python (kurze Beispiele)
Threads (eine kurze Einführung)

4.-5. Tag: Auch separat buchbar als Python Aufbau SQL mit Python:

Python SQLite
- neue Tabellen anlegen
- Daten in die Tabelle einfügen
- Daten abfragen
- update
- Datentypen in SQLite
- Adapter und Konvertierer
Die Einheitliche Python-DB-API
Python und MySQL (MySQLdb)
Python und Oracle
Python und ODBC

Python-Objektdatenbank (ZODB-Zope Object Database)

ZODB als selbständige Datenbank installieren (ohne Zope)
Die Erfüllung von Datenbank-Standards (ACID) durch die ZODB
- Atomicity
- Consistency
- Isolation
- Durability
Die hierarchische Objektstruktur der ZODB
Persistenzregeln beim Update von Veränderungen an ZODB-Objekten
Persistente Objektreferenzen in der ZODB
Hinweis auf advanced features: mounting, distributing
Eine einfache Anwendung als Beispiel

Object Relational Mapping

SQLAlchemy als Brücke zwischen ZODB und SQL-Datenbanken

Jetzt Buchen

Köln 1 Tage Explorer

10. September 2020

Data Science: Grundlagen der Statistik kompakt

Kompaktschulung zu statistischen Grundlagen, die für die Themengebiete Data Science und Machine Learning notwendig sind.

Mit dieser Grundlagenschulung bauen Sie sich ein statistisches Fundament auf. Die Kompaktschulung vermittelt die wesentlichen Grundlagen der beschreibenden und schließenden Statistik.

Folgende Themen werden behandelt:

Grundlagen der beschreibenden Statistik
- Stichprobe versus Gesamtheit
- statistische Skalen: nominal, ordinal, metrisch
- relative Häufigkeiten und kumulierte relative Häufigkeiten, empirische Verteilungsfunktion
- Histogramm für klassierte Daten
- Lagemaße: arithmetisches Mittel, Median, Quantile
- Box-Whisker-Plot
- Streuungsmaße: Varianz und Standardabweichung
- zweidimensionale Datensätze, Streudiagramm
- Zusammenhangsmaße: Korrelation
- Lineare Regression
Grundlagen der schließenden Statistik
- Schließen von der Stichprobe auf die Gesamtheit
- Wahrscheinlichkeit versus relative Häufigkeit
- diskrete und stetige Zufallsvariablen
- Gaußkurve, Normalverteilung
- Vertrauensbereich, Konfidenzintervalle
- Grundlagen der Hypothesentests (Nullhypothese, Alternativhypothese, Signifikanzniveau)
- Hypothesentest-Typen (Mittelwerttest, Anteilstest, Unabhängigkeitstest, F-Test als Gesamtmodell-Test, t-Test) und Anwendungsbereiche
- Ausblick: einfaktorielle Varianzanalyse
- Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 1 Tage Explorer

11. September 2020

Data Science: Grundlagen der Statistik, Praxistag mit Excel

Nach dem Praxistag können Sie mit Hilfe von Excel eigenständig statistische Analysen erstellen, statistische Kennzahlen berechnen und Diagramme erzeugen.

Folgende Themen werden behandelt:

Excel: Statistik mit den Analyse-Funktionen
Excel: Statistik mit den Formeln
Excel: Statistik mit den Diagrammen
Fallstudie, Berechnung von statistischen Kennzahlen
Fallstudie, Darstellung von statistischen Diagrammen
Unterschiede in den verschiedenen Excel-Versionen
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 3 Tage Practitioner

14. September 2020

Data Science mit Python – Einführung in Python

Folgende Themen werden behandelt:

Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Die Entwicklungsumgebung (IDE) Spyder
- Aspekte von Python, die anders als in anderen Programmiersprachen sind
Datenstrukturen in Python
- Unterschied Funktionen vs. Methoden
- Datenstrukturen in Python (number, tuple, list, dictionary, string)
- Überblick und wichtige Methoden zu den Datenstrukturen
- Unterschied list vs. tuple
- Die Besonderheit des Wertes NaN
- Wann benutze ich welche Klammer [], (), {}?
- List comprehension
Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile ansprechen, hinzufügen, löschen und verändern
- Eine Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Fehlende Werte ergänzen
- Logische Operatoren
Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Subplots erstellen
- Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- While Schleife
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Cross-validation (Kreuzvalidierung)
Weitere Machine Learning Algorithmen in Python
- Erklärung von (SVM), Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)

Jetzt Buchen

Köln 2 Tage Explorer

5. Oktober 2020

Data Science – Einführung für angehende Data Scientists

Nach der Schulung haben Sie das Grundlagenwissen, um als Data Scientist im Unternehmenskontext erste Herausforderungen zu meistern und eigene Ideen weiterzuentwickeln.

Folgende Themen werden behandelt:

Einführung und Einbindung von Data Science in einen betriebswirtschaftlichen Rahmen
Vorgehensmodelle und Zieldefinitionen für Data-Science-Projekte
Data-Science-Methoden (insbesondere Machine Learning) und Werkzeuge
Praktische Umsetzung eines Data-Science- Prozesses in einem Tool
Tipps, Tricks und Kniffe für ein gutes Data-Science-Produkt

Jetzt Buchen

Köln 5 Tage Explorer

5. Oktober 2020

Grundlagenwoche – Data Science

Die Teilnehmer sind in der Lage, eine vollständige Data Science Lösung zu entwerfen, umzusetzen und zu bewerten. Sie können marktübliche Kenntnisse und Kompetenzen erwerben.

Jetzt Buchen

Köln 5 Tage Practitioner

5. Oktober 2020

Data Science und R Einführung – Komplett für angehende Data Scientists

Folgende Themen werden behandelt: 1.-2. Tag: Auch separat buchbar als Data Science - Einführung für angehende Data Scientists

Einführung und Einbindung von Data Science in einen betriebswirtschaftlichen Rahmen
Vorgehensmodelle und Zieldefinitionen für Data-Science-Projekte
Data-Science-Methoden (insbesondere Machine Learning) und Werkzeuge
Praktische Umsetzung eines Data-Science- Prozesses in einem Tool
Tipps, Tricks und Kniffe für ein gutes Data-Science-Produkt

3.-5. Tag: Auch separat buchbar als Einführung R für Data Scientists

Funktionale Programmierung
Grundlagen der Skriptsprache R
Entwicklungsumgebung Rstudio
Grundlegende statistische Verfahren
Umsetzung exemplarischer Data-Science-Prozesse in R
Visualisierung und Vorverarbeitung der Daten
Modellbildung mit aktuellen Machine-Learning-Algorithmen
Erstellung und Bewertung von Prognosen für typische Anwendungsfälle

Jetzt Buchen

Köln 3 Tage Practitioner

7. Oktober 2020

Einführung R für Data Scientists

Nach der Schulung werden Sie in der Lage sein, erste Projekte mit Hilfe der Programmiersprache R unter Einsatz von R Studio zu begleiten oder selbst zu starten.

Folgende Themen werden vermittelt: Diese Agenda ist auch Bestandteil (3.-5. Tag) des Kurses Data Science und R Einführung - Komplett für angehende Data Scientists

Funktionale Programmierung
Grundlagen der Skriptsprache R
Entwicklungsumgebung Rstudio
Grundlegende statistische Verfahren
Umsetzung exemplarischer Data-Science-Prozesse in R
Visualisierung und Vorverarbeitung der Daten
Modellbildung mit aktuellen Machine-Learning-Algorithmen
Erstellung und Bewertung von Prognosen für typische Anwendungsfälle

Jetzt Buchen

Köln 4 Tage Expert

12. Oktober 2020

Deep Learning mit Python & Keras

Folgende Themen werden behandelt:

Wie lernen Neuronale Netze?
- Variablen, Modelle und Zusammenhänge
- Künstliche Neuronen und neuronale Netze
- Mathematische Grundlagen des Anlernprozesses: Backpropagation, Loss und Gradient Descent
Neuronale Netze mit Keras aufbauen und trainieren
- Graphen mit Tensorflow erstellen
- Ein einfaches Netz mit Keras und Tensorflow aufbauen und anlernen
- Welches Modell ist das richtige? Evaluation und Anpassung angelernter Modelle.
- Einsatz angelernter Modelle zur Klassifzierung und Schätzung
- Modelle speichern und laden
- Overfitting mit Dropout-Layern verhindern
- Überwachung des Anlernprozesses mit TensorBoard
Maschinelles Sehen: Konvolutionale neuronale Netze (CNN)
- Bilddateien als mehrdimensionale Matrizen
- Details sehen und Formen abstrahieren: Konvolutionale Netze (CNN)
- Konvolutionale Layer mit Keras aufbauen und anlernen
- Vortrainierte Layer einsetzen
Mit Sequenzdaten arbeiten: Rekurrente neuronale Netze (RNN)
- Zeitreihendaten und Textsequenzen: Eigenschaften und Eigenheiten
- Neuronale Netze mit Gedächtnis (Feedforward vs. RNN)
- Sequenzdaten mit LSTM (Long Short-Term Memory) aufbauen
- Textdaten mit Embedding-Layers interpretieren
Feature Extraction: Numerische Daten, Bild und Text-Daten vorbereiten
- Datenrepräsentation: Skalare, Vektoren & Matrizen in Numpy
- Daten einlesen und vorbereiten mit Pandas, Scikit-learn und Keras
- Qualitativer Variablen und Dummy-Sets
- Standardisierung von Daten
- Dimensionsreduktion mit PCA
- Bilddateien transformieren
- Mit Textdaten arbeiten: Zerlegen, tokenizieren, vektorisieren und einbetten.

Jetzt Buchen

Köln 2 Tage Special

13. Oktober 2020

Big Data mit Amazon Web Services (AWS)

Die 2-tägige Schulung vermittelt technisches Grundlagenwissen zu den Big-Data Lösungen von Amazon Web Services (AWS).

Folgende Themen werden behandelt:

Big Data - Konzeptuelle Grundlagen
- Einführung
- Klassifizierung von Methoden
- überwachtes und unüberwachtes Lernen
Big Data - Grundlegende Tools
- Apache Hadoop
- Hadoop distributed File System (HDFS)
- SQL/NoSQL Abfragen
AWS Setup für Big Data
- AWS Services für Big Data
- Apache Hadoop und Amazon EMR
- Installation und Konfiguration einesAmazon EMR Clusters
- Programmierframeworks für Amazon EMR (z.B.Hive, Pig, usw.)
- Hadoop User Experience (HUE)
AWS Datenverarbeitung
- In-Memory Datenanalyse mit Apache Spark und Amazon EMR
- AWS Datenspeicherung
- (Fast) Realtime Datenverarbeitung mit AWS Kinesis
- Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
Kosten,
-Sicherheit und Visualisierung
- AWS Abrechnungsmodelle
- IT-Sicherheit und AWS Big-Data Anwendungen
- Interaktive Datenabfrage- und Analyse mit Amazon Athena
- Automatisiertes extrahieren, transformieren und laden von Daten mittels AWS Glue
- Visualisierung von Daten und Abfragen via Amazon QuickSight

Jetzt Buchen

Köln 2 Tage Special

29. Oktober 2020

Datenmodellierung in Business-Intelligence und Big-Data-Systemen

Folgende Themen werden behandelt:

Informationssysteme und Kennzahlen
Data-Warehouse-Systeme
Relationale Datenmodelle
Entity-Relationship-Modell
Normalformen & Historisierung
Dimensionale Datenmodelle
Agile dimensionale Modellierung
Star- und Snowflake-Schema
Modellierung mit ADAPT
Data-Vault-Datenmodelle
Modellierung von Fachlogik
NoSQL-Datenmodelle

Jetzt Buchen

Köln 3 Tage Expert

2. November 2020

Machine Learning mit Python

Folgenden Themen werden behandelt:

Daten ziehen und aufbereiten
- Dateien im Verzeichnis ansteuern
- Standardverfahren zum Lesen/Schreiben von Text- und CSV-Dateien
- SQL-Datenbanken ansteuern
- Arbeiten mit Datenmatrizen: Einführung in Numpy & Pandas
- Daten inspizieren und beschreiben
- Fehlende Werte behandeln
Machine Learning Grundlagen
- Grundlagen, Varianten und Techniken des Machine Learnings.
- Arbeiten mit der Machine Learning Bibliothek scikit-learn.
- Einfache Zusammenhänge zwischen stetigen Variablen modellieren: Lineare Regression
- Klassifizieren mit Logistic Regression, Softmax und Support Vector Machine.
- Modellen evaluieren: Accuracy, Precision, Recall & Confusion matrix
- Unterteilen der Daten in Trainings- und Testdaten
Feature-Extraction
- Kategoriale Daten vorbereiten: One-Hot Codierung
- Standardisierung von Daten
- Dimensionsreduktion mit PCA (Principle Component Analysis)
- Aufbereitung von Textdaten: Tokenizer und Bag-of-words.
Machine Learning Workflow
- Daten aufarbeiten und zusammenführen (DataMapper)
- Pipelines einrichten
- Speichern und laden trainierter Klassifizierer

Jetzt Buchen

Köln 5 Tage Special

2. November 2020

Python – Komplett

Folgende Inhalte werden behandelt: 1.-3. Tag: Auch separat buchbar als Python Basiswissen

Organisation von Python-Code bei umfangreichen Projekten
- Packages
- import
list, tuple, dict (Zusammenfassung aus "Python-Einführung"
list, tuple dict, set (advanced features):
- List Comprehensions
- Generator-Ausdrücke
- Iteratoren
- Mengen (sets)
- dict: update, get, setdefault, pop, items
Funktionsparameter
- Parameter-Defaults
- Funktionen mit beliebig langen Parameterlisten
- Packen und Entpacken von Listen, Tupeln und Dictionaries
- als Sequenzen von Funktionsparametern
Typumwandlungen der Grunddatentypen
- int, float, str, dict, list, tuple, set
Verschachtelte Collections
- Result sets, list of dictionaries
Dateien, Objektserialisierung und Objektbanken
- file
- shelf als Beispiel von pickle-Anwendung
Python-Klassen (Python-Typen)
- object methods
- static methods
- class methods
- get/set methods (Vergleich mit JavaBeans)
- properties
- filigrane Zugriffsrechte auf Objektattribute
- (Vergleich mit Java-Zugriffsrechten)
- Operatorenüberladung
- list-like objects
- dictionary-like objects
- callable objects
- Vererbung
Exceptions
- Eigene Fehlerklassen modellieren
- Eigene Fehlerobjekte in Methoden einbauen
Das Dokumentationssystem von Python
- das Objektattribut __doc__ (docstring)
- reStructuredText als Syntax von docstring
- automatische Generierung von Dokumentation (epydoc)
Python UnitTests (eine kurze Einführung)
- der Zusammenhang von UnitTests und docstrings
- der Python-Interpreter als Betriebssystem
- die Module os, sys, shutils
Graphische Benutzeroberfläche (GUI) (eine kurze Einführung)
SQL-Datenbankanbindung mit Python (kurze Beispiele)
Threads (eine kurze Einführung)

4.-5. Tag: Auch separat buchbar als Python Aufbau SQL mit Python:

Python SQLite
- neue Tabellen anlegen
- Daten in die Tabelle einfügen
- Daten abfragen
- update
- Datentypen in SQLite
- Adapter und Konvertierer
Die Einheitliche Python-DB-API
Python und MySQL (MySQLdb)
Python und Oracle
Python und ODBC

Python-Objektdatenbank (ZODB-Zope Object Database)

ZODB als selbständige Datenbank installieren (ohne Zope)
Die Erfüllung von Datenbank-Standards (ACID) durch die ZODB
- Atomicity
- Consistency
- Isolation
- Durability
Die hierarchische Objektstruktur der ZODB
Persistenzregeln beim Update von Veränderungen an ZODB-Objekten
Persistente Objektreferenzen in der ZODB
Hinweis auf advanced features: mounting, distributing
Eine einfache Anwendung als Beispiel

Object Relational Mapping

SQLAlchemy als Brücke zwischen ZODB und SQL-Datenbanken

Jetzt Buchen

Köln 1 Tage Expert

5. November 2020

Machine Learning: Grundlagen kompakt

Neben wichtigen Grundkonzepten des Machinellen Lernens, erhalten Sie einen fundierten Überblick über Tools, die für den Aufbau Neuronaler Netze hilfreich sind.

Folgende Themen werden behandelt:

Intelligente Agenten
- Struktur von Agenten, Agentenprogramm, Agentenfunktion
- Agenten-Grundtypen
- Modellbasierter Reflexagent
- Lernender Agent
Maschinelles Lernen
- Lernformen: nicht überwachtes Lernen, verstärkendes Lernen, überwachtes Lernen
- Lernen aus Beispielen
- Trainingsmenge versus Testmenge
- Generalisierungsfähigkeit der gelernten Abbildung
- Problem der Überanpassung
Neuronale Netze, Multi Layer Perceptrons
- Vom biologischen zum technischen Neuron
- Perceptron
- Nichtlineare Aktivierungsfunktionen
- Multi-Layer-Perceptrons (mehrschichtige neuronale Netze)
- Lernalgorithmus "Backpropagation of Error"
- Beispiele zu Regression und Klassifikation mit Multi Layer Perceptrons
- praktische Tipps
- deep learning
- Beispiele und Demos zu deep learning
Neuronale Netze, Convolutional Neural Networks (CNN)
- Grundidee und Topologie CNN
- Beispiele und Demos zu Convolutional Neural Networks / Deep Learning
Neuronale Netze, Recurrent Neural Networks (RNN, LSTM)
- Grundidee und Topologie RNN
- Lernalgorithmus "Backpropagation Through Time"
- Long Short-Term Memory Networks (LSTM)
- Beispiele und Demos zu RNN und LSTM
Support-Vektor-Maschinen
- Grundidee und Unterschied zu Neuronalen Netzen
- Kernel-Trick zur Garantie der Linearen Separierbarkeit in höheren Dimensionen
- Beispiele und Demos zu Support Vector Machines
- Praktische Tipps
Hinweise zu Tools, Internet-Quellen und Literatur
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 1 Tage Expert

6. November 2020

Machine Learning: Praxistag mit TensorFlow

Folgende Themen werden behandelt:

Installation Python für Windows
Installation TensorFlow für Windows
Installation weiterer nützlicher Python-Packages
Jupyter Notebooks
Zahlen, Vektoren, Matrizen und Tensoren
"Hello world!" mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow
Multi-Layer-Perceptrons (MLP) mit TensorFlow Keras
Convolutional Neural Networks (CNN) mit TensorFlow Keras
Visualisierung mit TensorBoard
Diskussion spezifischer Fragestellungen aus der beruflichen Praxis

Jetzt Buchen

Köln 3 Tage Practitioner

9. November 2020

Data Science mit Python – Einführung in Python

Folgende Themen werden behandelt:

Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Die Entwicklungsumgebung (IDE) Spyder
- Aspekte von Python, die anders als in anderen Programmiersprachen sind
Datenstrukturen in Python
- Unterschied Funktionen vs. Methoden
- Datenstrukturen in Python (number, tuple, list, dictionary, string)
- Überblick und wichtige Methoden zu den Datenstrukturen
- Unterschied list vs. tuple
- Die Besonderheit des Wertes NaN
- Wann benutze ich welche Klammer [], (), {}?
- List comprehension
Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile ansprechen, hinzufügen, löschen und verändern
- Eine Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Fehlende Werte ergänzen
- Logische Operatoren
Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python's pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Subplots erstellen
- Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- While Schleife
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Cross-validation (Kreuzvalidierung)
Weitere Machine Learning Algorithmen in Python
- Erklärung von (SVM), Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)

Jetzt Buchen

Köln 2 Tage Special

12. November 2020

Analytics Architekturen für Big Data, BI, DWH und AI

Nach der Schulung kennen Sie die aktuellen Technologien für analytische Systeme und wissen, welche Systeme für den passenden Unternehmenskontext geeignet sind.

Folgende Themen werden behandelt:

Data-Warehouse-Architekturen
Datenmodelle
Data-Warehouse-Prozesse
Reporting und Analyse
Moderne Datenhaltungskonzepte
Big-Data-Architekturen
Data Lake und Big Data Warehouse

Jetzt Buchen

Köln 4 Tage Special

16. November 2020

Data Science mit RapidMiner: Grundlagen und fortgeschrittene Themen für Analysten

Die Schulungen sind auch geeignet, um neue Data Scientists auszubilden oder erfahrenen Data Scientists den Umstieg auf die Plattform RapidMiner zu erleichtern.

Jetzt Buchen

Köln 5 Tage Practitioner

7. Dezember 2020

Praxiswoche – Data Science mit Python

Datenstrukturen in Python, Einführung in das Data Science Paket pandas (Daten einlesen, Data handling), grundlegende Statistiken mit pandas, Algorithmen im Data Science

Jetzt Buchen

Köln 2 Tage Practitioner

14. Dezember 2020

Einstieg in Data Science mit Pandas

Folgende Themen werden behandelt:

Pandas im Überblick
- Datenaufbereitung
- Datenaggregation
- Datenvisualisierung
Einführung in Pandas
- Aggregatfunktionen
- Zeitreihen
- Geodaten
- Best Practices

Jetzt Buchen

Köln 3 Tage Practitioner

16. Dezember 2020

Jupyter Notebook Infrastruktur für effiziente Data Science Workflows

Nach der Schulung können Sie über Jupyter mit Notebooks arbeiten und können auf Basis einer für Datenanalysten zugeschnittenen Infrastruktur effizienter im Projektalltag arbeiten.

Folgende Themen werden behandelt:

Einführung, Überblick
- iPython und Jupyter
- JupyterHub
- nbconvert und nbviewer
- Kernels
Notebooks erweitern
- Widgets
- nbextensions
- Dashboards
- Notebooks einbetten
Praxis mit Jupyter
- Reproduzierbare Notebooks
- Parametrisierung
- Zeitplanung
- Refactoring