Data Scientist | Generative AI | Data Engineer | TensorFlow Certified Developer | Python
- Verfügbarkeit einsehen
- 0 Referenzen
- auf Anfrage
- 48145 Münster
- DACH-Region
- de | en
- 01.07.2024
Kurzvorstellung
Qualifikationen
Projekt‐ & Berufserfahrung
12/2023 – 5/2024
Tätigkeitsbeschreibung
Entwicklung einer Retrieval Augmented Generation (RAG) Ingestion-
und Retrieval-Pipeline sowie einer Evaluationskomponente
basierend auf den Frameworks LlamaIndex, LangChain, Phoenix
und MLflow.
- Beratung, Design und Implementierung von RAG Strategien mit Fokus auf Chat-Applikationen
- Erstellung von Evaluierung-Pipelines für die Optimierung der RAG-Hyperparameter
- Erstellung von Verarbeitungsalgorithmen von Dokumenten
- Recherche und Umsetzung von State-of-the-Art Methoden im Bereich von Generative AI insbesondere LLM
Tätigkeiten:
- Fachliche und technische Beratung als LLM-Entwickler/Engineer
- Entwurf und Implementierung einer RAG Pipeline mit Retrieval- und Response-Evaluation
- Koordination mit Entwicklern und Stakeholdern, um Domänenwissen in funktionale Anforderungen umzuwandeln
Confluence, Docker, Document Retrieval, Git, Langchain, Mongodb, Natural Language Processing, Pandas, Postgresql, Python
10/2023 – 11/2023
Tätigkeitsbeschreibung
Multi-Tenant Chatbot mit RAG unter Azure Kubernetes Service
Aufbau eines mandantenfähigen Chatbots mit RAG unter Verwendung von Azure Kubernetes Service, Azure Key Vault, Istio Service Mesh, OAuth2-Proxy und Azure Entra ID
Tätigkeiten:
- Modellierung und Aufbau der Azure Kubernetes Architektur
- Integration des Istio Service Meshs
- Erstellung von Chatbots mit Zugriff auf Kontextwissen aus Vektordatenbanken
Docker, Kubernetes, Langchain, Large Language Models, Microsoft Azure, Pandas, Python
2/2023 – 8/2023
Tätigkeitsbeschreibung
Kinderbuchgenerator
Entwicklung einer generativen AI-Anwendung zur Erstellung von individuellen und visualisierten Geschichten für Kinder.
Tätigkeiten:
- Integration der OpenAI, Midjourney und Stable Diffusion APIs
- Prompt Engineering zur Verbesserung der Qualität und Kreativität der generierten Texte und Bilder
- Verwendung von Promptemplates
- Benutzerfreundliche React-App als Interface für die individuelle Geschichtengenerierung
Data Science, Microsoft Azure, Natural Language Processing, Postgresql, Python, React (JavaScript library)
10/2022 – 9/2023
Tätigkeitsbeschreibung
Customer Data Hub
Konzeption und Entwicklung eines kundenzentrieten Data Warehouses für die Realisierung von konzernweiten Customer Analytics Use Cases
- Realisierung von generischen Kundenselektionen
- Erstellung von NBO-Trainingsdatensätzen für das trainieren von konzernweiten NBO-Modellen (Next Best Offer)
- Kundenreporting (Power BI Datenanbindung)
Tätigkeiten:
- DWH-Modellierung
- Spezifikation und Implementierung der ETL-Strecken
- Automatisierte Job- und Test-Steuerung
- Erstellung von Next Best Offer - Trainingsdatensätzen (NBO) für
die Umsetzung konzernweiter Recommendation Modelle
- Aufbau einer Pipeline zur generischen Kundenselektionen
- Selektionstool – PowerBI
Apache Spark, Confluence, Data Science, Data Warehousing, ETL, Git, Gradient Boosting, Jira, Python, SQL, Test Automation
6/2022 – 9/2022
Tätigkeitsbeschreibung
Next Best Offer (NBO)
Entwicklung eines generischen Empfehlungssystems, um Prognosen über zukünftige Produktkäufe von Kunden abzuleiten.
Tätigkeiten:
- Explorative Datenanalyse und Datenaufbereitung
- Evaluierung von Recommendation Algorithmen
- Erstellung von Trainingspipelines
- Aufbau einer MLflow-Umgebung zum Hyperparametertuning und Persistieren verschiedener Recommendation Modelle
Confluence, Data Science, Git, Gradient Boosting, Jira, Microsoft Azure, Python, Scikit-learn, Tensorflow
11/2021 – 8/2022
Tätigkeitsbeschreibung
AI Golf-Coaching
Entwicklung eines Systems, das mithilfe von in Kleidung und Smartphones integrierten Sensoren sowie durch Objekterkennung in Videos Bewegungsempfehlungen für den Sportler generiert.
Tätigkeiten:
- Analyse und Aufbereitung von Senor- und Video-Daten
- Bildverarbeitung, Bildklassifikation und Object Detection mit OpenCV, TensorFlow, PyTorch
- Entwicklung von individuellen Trainingspipelines und Modellarchitekturen
- Vertestung der Integration von Deep Learning- und Gradient Boosting Modellen in mobilen Endgeräten
- Versionierung der Modellperformance und der Modelle mit DVC und MLflow
Amazon Web Services (AWS), Computer Vision, Confluence, Data Science, Docker, Flutter, Git, Gradient Boosting, Jira, Objekterkennung, Objekterkennung, Opencv, Pytorch, Tensorflow
5/2021 – 8/2021
Tätigkeitsbeschreibung
Identifikation von Keywords und Tags
Entwicklung einer Komponente zur automatischen Findung von Tags und Keywords basierend auf Textinhalten aus Präsentationsmedien (Videos, Powerpoints)
Tätigkeiten:
- Requirements Engineering
- Implementierung und Evaluierung verschiedener Algorithmen und Frameworks zur Extraktion von Keywords, z.B. RAKE, TF-IDF, KeyBert, Spacy
- Entwicklung von individuellen Trainings- und Evaluierungspipelines
- Medienbereitstellung und Ergebnisempfang per API
- UML-Modellierung
Confluence, Docker, Git, Jira, Natural Language Processing, Python, Scikit-learn, Tensorflow
11/2020 – 4/2021
Tätigkeitsbeschreibung
Auslesen von Textinhalten aus Videos - OCR
Entwicklung einer Komponente zum Auslesen und Bereitstellen von Textinhalten aus Videos und Slideshows auf Basis von OCR
Tätigkeiten:
- Requirements Engineering
- Datenanalyse und Datenaufbereitung
- UML-Modellierung
- Evaluation verschiedener OCRs
- OCR-Integration und Ergebnisbereitstellung per API
Confluence, Docker, Git, Jira, Postgresql, Python, Pytorch, Scikit-learn
4/2020 – 9/2020
Tätigkeitsbeschreibung
Regelbasierte Klassifikation von Transaktionsdaten
Entwicklung einer Java-Anwendung zur Klassifikation von Transaktionsdaten auf Basis einer Rule Engine.
Tätigkeiten:
- Laden der Transaktionsdaten und Regeln mit PostgreSQL und EasyRules
- Containerisierung und Parallelisierung mit Docker
- Containermanagement
- Userinterface mit Angular und Flask
Angular, Apache HTTP Server, Confluence, Docker, Git, Java (allg.), Jira, Python, SQL
Zertifikate
Udemy
DeepLearning.AI
Microsoft
Stanford Online
Ausbildung
Fachhochschule Münster
Münster
Otto-von-Guericke-Universität Magdeburg
Magdeburg
Über mich
Weitere Kenntnisse
⠀ - Data Science & Generative AI
⠀ - Data Engineering
⠀ - Computer Vision
Tätigkeitsschwerpunkte:
⠀ - Data Warehouse Modellierung und Bau der ETL-Strecken
⠀ - Binäre und Multi-Klassen Klassifikation (Video, Bild, Text, Audio)
⠀ - Generative AI (Prompt Engineering, Fine Tuning LLMs, RAG)
⠀ - Echtzeit Objekterkennung und Pose Estimation (Video, Bild)
⠀ - Bau von Regressions-, Ranking- und Empfehlungsmodellen
⠀ - Next Best Offer (NBO), Next Best Action (NBA)
Programmiersprachen:
⠀ - Python, SQL, Java, TypeScript, PowerShell
Bibliotheken, Frameworks, Tools und Technologien:
⠀ Python:
⠀ ⠀ PySpark, TensorFlow, PyTorch, LangChain, LlamaIndex,
⠀ ⠀ pandas, NumPy, YOLOv5, XGBoost, CatBoost, LLMs,
⠀ ⠀ LightGBM, Implicit, NLTK, Spacy, scikit-learn, Ragas,
⠀ ⠀ OpenCV, PyTest, MLflow, FastApi, Flask, DeepEval
⠀ Java:
⠀ ⠀ Spring Boot, EasyRules, Apache HttpServer
⠀ TypeScript:
⠀ ⠀ Angular, React
⠀ Sonstiges:
⠀ ⠀ Azure, AWS, Git, DVC, PowerBI, Docker, Kubernetes,
⠀ ⠀ Kubeflow, Confluence, Dataiku, Bash, Shell
Persönliche Daten
- Deutsch (Muttersprache)
- Englisch (Fließend)
- Europäische Union
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden