Data Scientist & Engineer

zuletzt online vor 1 Tagen

Verfügbarkeit einsehen
0 Referenzen

70€/Stunde
41812 Erkelenz
auf Anfrage
de | en | es
24.03.2025

Kurzvorstellung

			Ich arbeite als Data Scientist mit praktischer Erfahrung in den Bereichen Softwareentwicklung, Statistik, Machine Learning und Data Engineering.
		

Qualifikationen

		 Cloud (allg.)2 J.
 Data Science
 Datenanalyse1 J.
 Generative KI
 GPT
 Langchain
 Large Language Models
 Microsoft Azure2 J.
 Natural Language Processing
 Power Bi3 J.
 Python8 J.
 Scikit-learn3 J.
 SQL4 J.
 Tensorflow4 J.

		

Projekt‐ & Berufserfahrung

AWS-Dozent 
									Kundenname anonymisiert, Berlin								

11/2024 – 5/2025 (7 Monate)

Details anzeigen

Tätigkeitszeitraum

11/2024 – 5/2025

Tätigkeitsbeschreibung

• Durchführung von Vorlesungen und Übungen im Rahmen des AWS Restart Programms zur Zertifizierung von IT-Quereinsteigern zum AWS Cloud Practitioner und AWS Solutions Architect
• Aufbau einer Data Science & KI Schulung
• Schulungsinhalte: AWS-Services (S3, EC2, VPC, IAM, CloudTrail, RDS,
Redshift, Aurora, DynamoDB, ElastiCache, EBS, EFS, CLI, Systems
Manager, Elastic Beanstalk, ECR, ECS, EKS, Fargate, Athena, OpenSearch,
QuickSight, Glue, Flink, Kafka, Kinesis, SageMaker, Elastic Load Balancer,
EC2 Auto-Scaling, Route 53, API-Gateway, KMS, Cognito, CloudFront,
Lambda, SNS, SQS, Gateways, CloudWatch, CloudFormation), Linux, Python und SQL

Eingesetzte Qualifikationen

SQL, Python, Amazon Web Services (AWS)

Entwicklung eines Large Language Modells mit Q&A Webapp 
									Steuerberater, Wegberg								

6/2024 – 10/2024 (5 Monate)

Details anzeigen

Tätigkeitszeitraum

6/2024 – 10/2024

Tätigkeitsbeschreibung

• Training eines Large Language Modells zur Zusammenfassung von individuellen Textdokumenten und Steuertexten
• Aufteilung eines Textdokuments in Chunks, Erstellung von Embeddings, Abspeicherung in einer Vektor-Datenbank und Nutzung des LLMs mit LangChain
• Entwicklung einer Webapp mit Streamlit, auf welcher Nutzer Textdokumente hochladen und Fragen zum Inhalt des Dokuments formulieren können
• Nutzung des Large Language Modells zur Beantwortung von Fragen zu Textdokumenten

Verwendete Tools: Python, OpenAI, LangChain, Pinecone, Streamlit

Eingesetzte Qualifikationen

Generative KI, GPT, Langchain, Large Language Models, Python

Analyse von Einflussfaktoren auf die Bewerbungsanzahl von Jobausschreibungen 
									Promotionbasis GmbH, München								

10/2022 – 9/2023 (1 Jahr)

Details anzeigen

Tätigkeitszeitraum

10/2022 – 9/2023

Tätigkeitsbeschreibung

- Import und Vorbereitung der Job-Statistiken
- Korrelationsanalyse zur Identifizierung von Einflussfaktoren auf die Bewerbungsanzahl
- Untersuchung und Visualisierung des Einflusses verschiedener Parameter auf die Anzahl der Bewerbungen und Listing-Einblendungen
- Ermittlung von Klick-Kennzahlen und View-Kennzahlen sowie Analyse von Einflussfaktoren auf die Click-Through-Rate
- Ableitung von Empfehlungen zur Steigerung der Bewerbungsanzahl für Stellenausschreibungen
- Dokumentation und Präsentation der Ergebnisse
- Entwicklung eines Machine Learning Modells zur Prädiktion der Bewerbungsanzahl auf Basis der Parameter einer Jobausschreibung
- Deployment des Prädiktionsmodells als REST-API mit Docker

Verwendete Tools: Python, Scikit-learn, Keras, TensorFlow, Matplotlib, Seaborn, Plotly, Jupyter, Git, Docker, PowerPoint

Eingesetzte Qualifikationen

Datenanalyse, Gradient Boosting, Keras, Neuronale Netze, Scikit-learn, Tensorflow, Docker, Python

Entwicklung einer Cloud Architektur in Azure 
									DAVID Systems GmbH, München								

8/2022 – 5/2024 (1 Jahr, 10 Monate)

Details anzeigen

Tätigkeitszeitraum

8/2022 – 5/2024

Tätigkeitsbeschreibung

• Planung und Vorbereitung der Workshops zum Data Strategy & Analytics Assessment
• Analyse des Status Quo und der Anforderungen an eine Zielarchitektur
• Entwurf von mehreren möglichen Zielarchitekturen mit den jeweiligen Vor- und Nachteilen
• Umsetzung der ausgewählten Architektur in Azure
• Entwicklung eines Datenmodells und Definierung einer ETL-Strecke zur Verschiebung der Daten mit Azure Data Factory in eine Azure Cosmos DB
• Transformation der Daten mit Dataflows in Azure Data Factory
• Entwicklung von Azure Functions zur automatisierten Fehlererkennung und Lösung basierend auf Log-Dateien
• Erstellung eines Power BI Reports zur Visualisierung und Analyse der Log-Dateien
• Nutzung von Databricks und Spark zur Auswertung der Daten
• Dokumentation der Architektur in Terraform und Confluence

Verwendete Tools: Azure Cosmos DB, Azure Data Factory, Azure Blob Storage, Azure Functions, Azure DevOps, Azure Data Studio, Terraform, Databricks, PySpark, MongoDB Compass, Python, PyMongo, Power BI, Jira Atlassian, Confluence

Eingesetzte Qualifikationen

Databricks, Power Bi, Mongodb, Jira, Python, Cloud (allg.), Microsoft Azure

Ähnlichkeitsanalyse und Clusterung von Sachnummern im Einkauf mit KI 
									Kundenname anonymisiert, München								

5/2022 – 11/2022 (7 Monate)

Details anzeigen

Tätigkeitszeitraum

5/2022 – 11/2022

Tätigkeitsbeschreibung

- Import und Vorbereitung der verschiedenen Datenquellen
- Ähnlichkeitsanalyse basierend auf der Produktbezeichnung mit NLP
- Erstellung einer Ähnlichkeitstabelle zum Vergleich der Sachnummern mit mehreren Parametern
- Entwicklung eines neuronalen Netzes zur Prädiktion eines Ähnlichkeitswertes zwischen Sachnummern
- Implementierung eines Algorithmus zur Identifikation von Clustern mit ähnlichen Produkten
- Berechnung des Referenzpreises und Einsparungspotenzial für jedes Cluster
- Generierung und Export einer Datei mit den Ergebnissen des Cluster-Algorithmus
- Aufsetzung einer Schnittstelle zum Weiter- oder Neu-Trainieren des neuronalen Netzes mit Anwender-Feedback
- Deployment innerhalb einer AWS-Umgebung

Verwendete Tools: Python, Scikit-learn, Keras, Tensorflow, Jupyter, Git, AWS, SonarQube

Eingesetzte Qualifikationen

Keras, Scikit-learn, Tensorflow, Python, Amazon Web Services (AWS)

Planung und Implementierung einer WMS-Datenarchitektur 
									LGI Logistics Group International GmbH, München								

4/2022 – 3/2023 (1 Jahr)

Details anzeigen

Tätigkeitszeitraum

4/2022 – 3/2023

Tätigkeitsbeschreibung

- Durchführung eines Data Assessment zum WMS Reporting
- Analyse des Status Quo und der Anforderungen an eine Zielarchitektur
- Entwurf von mehreren möglichen Zielarchitekturen mit den jeweiligen Vor- und Nachteilen
- Umsetzung der ausgewählten Architektur in Azure
- Aufsetzung eines ETL-Prozesses zur Verschiebung und Transformation der Daten von lokalen Oracle-Datenbanken in eine Azure SQL Datenbank mit Azure Data Factory

Verwendete Tools: Azure SQL DB, Azure Data Factory, Azure Data Studio, PowerPoint, Power BI, Dataverse, SharePoint

Eingesetzte Qualifikationen

Power Bi, Cloud (allg.), Microsoft Azure

Analyse von Fahrdaten zur Ermittlung des Elektrifizierungspotenzials von LKWs 
									Kundenname anonymisiert, München								

3/2022 – 10/2022 (8 Monate)

Details anzeigen

Tätigkeitszeitraum

3/2022 – 10/2022

Tätigkeitsbeschreibung

- Identifizierung der Schicht- und Standzeiten von LKWs anhand von Tracking-Daten
- Untersuchung der Points of Interest in der Umgebung von Standorten der LKWs mithilfe der Here Maps API
- Ermittlung der optimalen Anzahl und Orte für Ladestationen von Elektroautos
- Implementierung von Algorithmen zur Bestimmung der elektrifizierbaren LKWs auf Basis der fahrspezifischen Daten
- Entwicklung eines Dashboards mit Plotly Dash zur Analyse des Fahrverhaltens und des Elektrifizierungspotenzials
- Dokumentation der Algorithmen in Confluence

Verwendete Tools: Python, Here Maps API, Plotly, Dash, PyInstaller, Jupyter, Visual Studio Code, Jira Atlassian, Confluence, Git

Eingesetzte Qualifikationen

Data Science, Git, Python

Data Scientist (Festanstellung)
									IAM Global GmbH, Düsseldorf								

7/2021 – 2/2022 (8 Monate)

Details anzeigen

Tätigkeitszeitraum

7/2021 – 2/2022

Tätigkeitsbeschreibung

Entwicklung eines Systems zur Personalvermittlung, welches mithilfe von künstlicher Intelligenz und psychologischen Modellen möglichst passende Vakanzen für einen Kandidaten findet
- Datenbereinigung und Import von Stellenausschreibungen
- Programmierung eines intelligenten Algorithmus zur Auswahl der optimalen Kontaktdaten für eine offene Stelle
- Implementierung von Webcrawlern für Kandidatenprofile auf LinkedIn und Xing
- Entwicklung von Machine Learning Modellen zur automatischen Identifizierung passender Vakanzen für einen Kandidaten
- Erstellung einer R Shiny Wep App zur statistischen Auswertung psychologischer Daten
- Mustererkennung und Implementierung psychologischer Modelle
- Erstellung eines Python-Dashboards für die Marktanalyse mit Geo-Heatmaps, Zeitreihenanalyse und ML-Prognosen
- Analyse gesendeter E-Mails und Webhooks zur Optimierung der Antwortrate
- Entwicklung von KI-Modellen zur Vorhersage der Request- und Blacklist-Wahrscheinlichkeiten vor der Präsentation eines Kandidaten bei einem Unternehmen
- Entwicklung von CI/CD Pipelines mit Git und Slack Integration

Verwendete Tools: Python, Scikit-learn, Plotly, Dash, Jupyter, Heroku, R Shiny, R Studio, AWS S3, MongoDB, Mongo Cloud, Jira Atlassian, Git, Linux

Eingesetzte Qualifikationen

Amazon Web Services (AWS), Jira, Mongodb, Python, R (Programmiersprache), Scikit-learn

Werkstudent Data Science 
									INSO Projects GmbH, Düsseldorf								

3/2020 – 6/2021 (1 Jahr, 4 Monate)

Details anzeigen

Tätigkeitszeitraum

3/2020 – 6/2021

Tätigkeitsbeschreibung

- Implementierung von Feature-Selection-Algorithmen zur Identifizierung von Preistreibern
- Analyse des Quote-to-Cash-Prozesses zur Optimierung des Supply Chain Managements
- Anwendung von NLP-Techniken zur E-Mail-Analyse
- Entwicklung eines Machine Learning Modells zur automatischen Extraktion von Signaturen aus E-Mails
- Analyse und Auswertung von Finanzbuchhaltungsdaten

Verwendete Tools: Python, Scikit-learn, Statsmodels, Seaborn, Jupyter, SQL, SSMS, Hadoop, Microsoft Power BI, Microsoft Teams, SharePoint, Git

Eingesetzte Qualifikationen

Apache Hadoop, Git, Power Bi, Python, Scikit-learn, SQL

Mathematisch-technischer Softwareentwickler (Festanstellung)
									Cybernetics Lab IMA & IfU - RWTH Aachen University, Aachen								

9/2016 – 8/2019 (3 Jahre)

Details anzeigen

Tätigkeitszeitraum

9/2016 – 8/2019

Tätigkeitsbeschreibung

Entwicklung einer Webplattform zur Fabrikplanung
- Implementierung eines Java-Backends mit Spring und Hibernate
- Verwaltung der SQL-Datenbank
- Entwicklung und Optimierung von Datenmodellen
- Auswertung, Erstellung und Datenmigration in NoSQL-Datenbanken zur Leistungssteigerung (MongoDB, Neo4j)
- Einrichtung automatisierter JUnit-Tests
- Implementierung und Anbindung eines Python-Backends für Deep Learning mit Tensorflow

Entwicklung einer Desktop-Anwendung zur Finanz- & Personalverwaltung
- Implementierung vom Backend und Frontend für eine Desktop-Anwendung mit C# und WPF
- Verwaltung der SQL-Datenbank
- Datenmigration aus einer SAP-Datenbank

Verwendete Tools: C#, WPF, Java, Spring, Hibernate, Postman, SQL, MySQL Workbench, MongoDB, Neo4j, Python, Tensorflow, Git, JUnit, IntelliJ IDEA, Visual Studio Code, YouTrack

Eingesetzte Qualifikationen

C#, Git, Java (allg.), Mongodb, Mysql, Python, Softwareentwicklung (allg.), SQL, Tensorflow

Weitere Projekt‐ & Berufserfahrung anzeigen Weitere Projekt‐ & Berufserfahrung ausblenden

Zertifikate

							MongoDB Associate Developer

								MongoDB

2025

							Fabric Analytics Engineer Associate

								Microsoft

2024

							Power BI Data Analyst Associate

								Microsoft

2024

							AWS Certified Solutions Architect – Associate

								Amazon Web Services

2024

							Databricks Certified Data Engineer Associate

								Databricks

2023

							TensorFlow Developer Certificate

								Google

2023

							AWS Certified Cloud Practitioner

								Amazon Web Services

2023

							Azure Data Scientist Associate

								Microsoft

2023

							Azure Data Engineer Associate

								Microsoft

2022

							DataScienceMATSE

								FH Aachen

2019

Ausbildung

Master of Science

Angewandte Mathematik und Informatik
FH Aachen - University of Applied Sciences

2021
Aachen

Bachelor of Science

Scientific Programming
FH Aachen - University of Applied Sciences

2019
Aachen

Mathematisch-technischer Softwareentwickler

Ausbildung
Cybernetics Lab IMA & IfU - FH Aachen

2019

Über mich

			FÄHIGKEITEN

- Datenanalyse, KI-Entwicklung, Machine Learning, Deep Learning

- Entwicklung von Cloud-Architekturen & Datenpipelines

- Datenvisualisierung, Erstellung von Dashboards

- Webentwicklung, API-Erstellung

- Statistische Analysemethoden

- MLOps, DevOps

TOOLS

- Programmiersprachen: Python, R, Java, C#, SQL, PySpark

- Bibliotheken: TensorFlow, Scikit-learn, MLflow, OpenAI, LangChain, Airflow, FastAPI

- Datenbanken: MySQL, Oracle, MongoDB, Pinecone

- Cloud-Plattformen: Azure, AWS, Databricks, MS Fabric

- Datenvisualisierung: Power BI, Streamlit, Seaborn, Plotly, Dash, R Shiny

- Sonstige Tools: Git, Jira, Docker, Heroku, Terraform, Azure DevOps

Persönliche Daten

Sprache

							Deutsch (Muttersprache)
Englisch (Fließend)
Spanisch (Gut)

							

Reisebereitschaft

auf Anfrage

Arbeitserlaubnis

Europäische Union

Home-Office

unbedingt

Profilaufrufe

303

Alter

Berufserfahrung

							8 Jahre und 7 Monate
							(seit 09/2016)
							

Projektleitung

2 Jahre

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden