freiberufler Data Engineer / Data Scientist auf freelance.de

Data Engineer / Data Scientist

offline
  • auf Anfrage
  • 76227 Durlach
  • auf Anfrage
  • de  |  en
  • 01.09.2024

Kurzvorstellung

Ich bin ein Data Engineer & Data Scientist mit einem Hintergrund in Operations Research, der sich auf Python, C++ und Azure-Cloud-Anwendungen konzentriert.

Auszug Referenzen (1)

"A. is a talented developer and data engineer. Our team has benefited greatly from his contributions and it has been a pleasure to work with him."
Senior Data Scientist (Festanstellung)
Mathias Diez
Tätigkeitszeitraum

4/2019 – 12/2022

Tätigkeitsbeschreibung

Das Team, in dem ich gearbeitet habe, generiert täglich Millionen von Bestellentscheidungen als Teil einer vollständig automatisierten und cloudbasierten SaaS-Lösung für große Einzelhandelskunden. Täglich angesetzte Datenpipelines ermöglichen es dem Optimierungsalgorithmus, die neuesten Daten zu berücksichtigen und gleichzeitig Unsicherheiten und Einschränkungen einzubeziehen, um für die Kunden rechtzeitig die besten Entscheidungen zu treffen. Ich habe daran gearbeitet
- ein bestehendes Analysetool mit einem Dask-Cluster zu skalieren,
- einen Flask Service mit einer PostgreSQL-Datenbank inklusive ETL-Pipeline in Azure einzurichten, mit dem über eine REST API kommuniziert werden kann,
- Apache Airflow DAGs zu konfigurieren,
- anspruchsvolle SQL-Abfragen einschließlich CTEs für eine Exasol-Datenbank zu erstellen und anzupassen,
- komplexe Datenstrukturen in eine in Python geschriebene Datenpipeline zu integrieren,
- erforderliche Anpassungen am Partitionierungsmodell für die Parallelisierungslösung vorzunehmen und
- den in C++ geschriebenen Optimierungsalgorithmus zu verbessern und ihn mit neuen Funktionalitäten zu erweitern.

Eingesetzte Qualifikationen

Agile Methodologie, C++, Microsoft Azure, Python, SQL

Qualifikationen

  • Apache Airflow
  • Azure Functions
  • C++6 J.
  • Dask
  • Data Science
  • Microsoft Azure3 J.
  • Python6 J.
  • SQL6 J.

Projekt‐ & Berufserfahrung

Senior Data Scientist (Festanstellung)
Blue Yonder, Karlsruhe
4/2019 – 12/2022 (3 Jahre, 9 Monate)
IT & Entwicklung
Tätigkeitszeitraum

4/2019 – 12/2022

Tätigkeitsbeschreibung

Das Team, in dem ich gearbeitet habe, generiert täglich Millionen von Bestellentscheidungen als Teil einer vollständig automatisierten und cloudbasierten SaaS-Lösung für große Einzelhandelskunden. Täglich angesetzte Datenpipelines ermöglichen es dem Optimierungsalgorithmus, die neuesten Daten zu berücksichtigen und gleichzeitig Unsicherheiten und Einschränkungen einzubeziehen, um für die Kunden rechtzeitig die besten Entscheidungen zu treffen. Ich habe daran gearbeitet
- ein bestehendes Analysetool mit einem Dask-Cluster zu skalieren,
- einen Flask Service mit einer PostgreSQL-Datenbank inklusive ETL-Pipeline in Azure einzurichten, mit dem über eine REST API kommuniziert werden kann,
- Apache Airflow DAGs zu konfigurieren,
- anspruchsvolle SQL-Abfragen einschließlich CTEs für eine Exasol-Datenbank zu erstellen und anzupassen,
- komplexe Datenstrukturen in eine in Python geschriebene Datenpipeline zu integrieren,
- erforderliche Anpassungen am Partitionierungsmodell für die Parallelisierungslösung vorzunehmen und
- den in C++ geschriebenen Optimierungsalgorithmus zu verbessern und ihn mit neuen Funktionalitäten zu erweitern.

Eingesetzte Qualifikationen

Agile Methodologie, C++, Microsoft Azure, Python, SQL

wissenschaftliche Mitarbeiter (Festanstellung)
RWTH Aachen, Aachen
10/2016 – 3/2019 (2 Jahre, 6 Monate)
Logistikdienstleister
Tätigkeitszeitraum

10/2016 – 3/2019

Tätigkeitsbeschreibung

Ich war Teil eines Industrieforschungsprojekts an der RWTH Aachen, das das Transportnetzwerk für eines der weltweit führenden Logistikunternehmen optimierte. Meine Arbeit konzentrierte sich auf
- den Aufbau einer Datenpipeline, um die aktuellsten Daten einzubeziehen,
- die Implementierung eines problemspezifischen mathematischen Optimierungsalgorithmus und
- die Visualisierung der Lieferkette in einem Dashboard.

Eingesetzte Qualifikationen

C++, Python, SQL

Zertifikate

Microsoft Certified: Azure Data Engineer Associate
2023
Create Serverless Applications
2022
Data Science Nanodegree, Udacity
2020
Neural Networks and Deep Learning
2019

Ausbildung

Betriebswirtschaftslehre, Operations Research
Master of Science
2016
Aachen
Wirtschaftswissenschaften, Finance & Accounting
Bachelor of Science
2014
Frankfurt am Main

Weitere Kenntnisse

Ich besitze umfangreiche Kenntnisse im Python-Ökosystem (pandas, numpy, sqlalchemy, scikit-learn, pyarrow, pydantic, dask, flask, ...) um datengesteuerte Anwendungen zu realisieren, habe aber auch C++ in meinem Werkzeugkasten, wenn mehr Performance gefragt ist. Darüber hinaus verfüge ich über gute SQL- und CQL-Kenntnisse für die Kommunikation mit Datenbanken oder Blob-Storage-Lösungen. Ich sehe Softwareentwicklung und -betrieb gerne als Einheit (DevOps) und bevorzuge es, Software in einer agilen Umgebung zu entwickeln. Um den Fokus auf die Kernanwendung zu legen, setze ich bevorzugt auf serverlose Lösungen, die in der Azure-Cloud skalierbar und mit geringem Overhead eingerichtet, ausgerollt und betrieben werden können.

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Fließend)
Reisebereitschaft
auf Anfrage
Arbeitserlaubnis
  • Europäische Union
  • Schweiz
  • Vereinigte Staaten von Amerika
Home-Office
bevorzugt
Profilaufrufe
921
Alter
35
Berufserfahrung
8 Jahre und 1 Monat (seit 10/2016)

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden