freiberufler Data Scientist / Machine Learning Engineer auf freelance.de

Data Scientist / Machine Learning Engineer

offline
  • 100€/Stunde
  • 50674 Köln
  • auf Anfrage
  • de  |  en
  • 28.05.2024

Kurzvorstellung

Ich bin ein kommunikativer Cloud-native Data Scientist und Machine Learning Engineer. Meine Stärken liegen in meiner umfassenden Expertise in modernen KI-Technologien, sowie in der verständlichen Präsentation komplexer technischer Zusammenhänge

Qualifikationen

  • Apache Spark1 J.
  • Big Data
  • Data Science
  • Databricks
  • Kubernetes1 J.
  • Large Language Models1 J.
  • Natural Language Processing
  • Python2 J.
  • Pytorch
  • SQL

Projekt‐ & Berufserfahrung

Machine Learning Engineer
Kundenname anonymisiert, Osnabrück
2/2023 – 6/2024 (1 Jahr, 5 Monate)
Öffentliche Verwaltung
Tätigkeitszeitraum

2/2023 – 6/2024

Tätigkeitsbeschreibung

Deployment von PySpark KI-Anwendungen in Kubernetes und Hadoop

- Deployment, Skalierung und Überwachung von KI-Anwendungen im Kubernetes Cluster (Stackable), sowie im Hadoop Cluster (Cloudera)
- Einbindung von Monitoring Tools (mlflow) zur kontinuierlichen Modellüberwachung (MLOps)
- Skalierung und Logging der Hyperparametersuche von ML-Pipelines mit PySpark und MLFlow - Beschleunigung der bisherigen Suche um 500%.
- Performance- und Ressourcen Optimierung von verschiedenen Machine Learning Apps durch anpassen von Spark Konfigurationen und Datenpartitionierung
- Einführung von modernen GitOps Praktiken für CI/CD im Migrationsprozess

Eingesetzte Qualifikationen

Apache Hadoop, Apache Spark, Docker, Kubernetes, Python

Data Scientist
Kundenname anonymisiert, Osnabrück
9/2022 – 7/2024 (1 Jahr, 11 Monate)
Öffentliche Verwaltung
Tätigkeitszeitraum

9/2022 – 7/2024

Tätigkeitsbeschreibung

Development of LLM Based AI-Applications in PySpark

- Fine-tuning of foundational LLM (Llama2, Mistral) for generation of text summaries in German. Development utilizing Parameter Efficient Fine Tuning (PEFT) and Low Rank Adaption (LoRA) with Huggingface.
- Segmentation of multi-dimensional customer data by utilizing efficient LLM feature representations - Enhancement of existing clustering approaches by 2x.
- Detection of data anomalies and duplicates through distributed end-to-end Machine Learning pipelines in PySpark, substantially enhancing data quality.
- Time- and cost optimization of GPU resources through dynamic job scheduling on Nvidia A100 and A30 GPUs.

Eingesetzte Qualifikationen

Apache Hadoop, Apache Spark, Generative KI, Large Language Models, Python

Data Analyst (Festanstellung)
Kundenname anonymisiert, Utrecht
1/2021 – 9/2021 (9 Monate)
Automobilindustrie
Tätigkeitszeitraum

1/2021 – 9/2021

Tätigkeitsbeschreibung

Development of ML-Applications for Data Quality Enhancement

- Development of tree based ML classifiers for detection of anomalies in charge point data.
- Creation of business insights regarding data quality utilizing SQL based database queries.

Eingesetzte Qualifikationen

Python, R (Programmiersprache), Scikit-learn, SQL

Zertifikate

Certified Kubernetes Application Developer
The Linux Foundation
2023
Databricks Certified Associate Developer for Apache Spark
Databricks
2023

Ausbildung

M. Sc. Artificial Intelligence
Master of Science
Utrecht University
2022
Utrecht
B. Sc. Psychologie in IT
Bachelor of Science
Technische Universität Darmstadt
2019
Darmstadt

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Muttersprache)
Reisebereitschaft
auf Anfrage
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
142
Alter
27
Berufserfahrung
3 Jahre und 11 Monate (seit 01/2021)

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden