freiberufler Data Scientist & Engineer auf freelance.de

Data Scientist & Engineer

zuletzt online vor 7 Tagen
  • 70€/Stunde
  • 41812 Erkelenz
  • auf Anfrage
  • de  |  en  |  es
  • 16.11.2024

Kurzvorstellung

Ich arbeite als Data Scientist mit praktischer Erfahrung in den Bereichen Softwareentwicklung, Statistik, Machine Learning und Data Engineering.

Qualifikationen

  • Cloud (allg.)2 J.
  • Data Science
  • Datenanalyse1 J.
  • Generative KI
  • GPT
  • Langchain
  • Large Language Models
  • Microsoft Azure2 J.
  • Natural Language Processing
  • Power Bi3 J.
  • Python7 J.
  • Scikit-learn3 J.
  • SQL4 J.
  • Tensorflow4 J.

Projekt‐ & Berufserfahrung

Entwicklung eines Large Language Modells mit Q&A Webapp
Steuerberater, Wegberg
6/2024 – offen (6 Monate)
Finanzdienstleister
Tätigkeitszeitraum

6/2024 – offen

Tätigkeitsbeschreibung

• Training eines Large Language Modells zur Zusammenfassung von individuellen Textdokumenten und Steuertexten
• Aufteilung eines Textdokuments in Chunks, Erstellung von Embeddings, Abspeicherung in einer Vektor-Datenbank und Nutzung des LLMs mit LangChain
• Entwicklung einer Webapp mit Streamlit, auf welcher Nutzer Textdokumente hochladen und Fragen zum Inhalt des Dokuments formulieren können
• Nutzung des Large Language Modells zur Beantwortung von Fragen zu Textdokumenten

Verwendete Tools: Python, OpenAI, LangChain, Pinecone, Streamlit

Eingesetzte Qualifikationen

Generative KI, GPT, Langchain, Large Language Models, Python

Analyse von Einflussfaktoren auf die Bewerbungsanzahl von Jobausschreibungen
Promotionbasis GmbH, München
10/2022 – 9/2023 (1 Jahr)
IT & Entwicklung
Tätigkeitszeitraum

10/2022 – 9/2023

Tätigkeitsbeschreibung

- Import und Vorbereitung der Job-Statistiken
- Korrelationsanalyse zur Identifizierung von Einflussfaktoren auf die Bewerbungsanzahl
- Untersuchung und Visualisierung des Einflusses verschiedener Parameter auf die Anzahl der Bewerbungen und Listing-Einblendungen
- Ermittlung von Klick-Kennzahlen und View-Kennzahlen sowie Analyse von Einflussfaktoren auf die Click-Through-Rate
- Ableitung von Empfehlungen zur Steigerung der Bewerbungsanzahl für Stellenausschreibungen
- Dokumentation und Präsentation der Ergebnisse
- Entwicklung eines Machine Learning Modells zur Prädiktion der Bewerbungsanzahl auf Basis der Parameter einer Jobausschreibung
- Deployment des Prädiktionsmodells als REST-API mit Docker

Verwendete Tools: Python, Scikit-learn, Keras, TensorFlow, Matplotlib, Seaborn, Plotly, Jupyter, Git, Docker, PowerPoint

Eingesetzte Qualifikationen

Datenanalyse, Gradient Boosting, Keras, Neuronale Netze, Scikit-learn, Tensorflow, Docker, Python

Entwicklung einer Cloud Architektur in Azure
DAVID Systems GmbH, München
8/2022 – 5/2024 (1 Jahr, 10 Monate)
Telekommunikation
Tätigkeitszeitraum

8/2022 – 5/2024

Tätigkeitsbeschreibung

• Planung und Vorbereitung der Workshops zum Data Strategy & Analytics Assessment
• Analyse des Status Quo und der Anforderungen an eine Zielarchitektur
• Entwurf von mehreren möglichen Zielarchitekturen mit den jeweiligen Vor- und Nachteilen
• Umsetzung der ausgewählten Architektur in Azure
• Entwicklung eines Datenmodells und Definierung einer ETL-Strecke zur Verschiebung der Daten mit Azure Data Factory in eine Azure Cosmos DB
• Transformation der Daten mit Dataflows in Azure Data Factory
• Entwicklung von Azure Functions zur automatisierten Fehlererkennung und Lösung basierend auf Log-Dateien
• Erstellung eines Power BI Reports zur Visualisierung und Analyse der Log-Dateien
• Nutzung von Databricks und Spark zur Auswertung der Daten
• Dokumentation der Architektur in Terraform und Confluence

Verwendete Tools: Azure Cosmos DB, Azure Data Factory, Azure Blob Storage, Azure Functions, Azure DevOps, Azure Data Studio, Terraform, Databricks, PySpark, MongoDB Compass, Python, PyMongo, Power BI, Jira Atlassian, Confluence

Eingesetzte Qualifikationen

Databricks, Power Bi, Mongodb, Jira, Python, Cloud (allg.), Microsoft Azure

Ähnlichkeitsanalyse und Clusterung von Sachnummern im Einkauf mit KI
Kundenname anonymisiert, München
5/2022 – 11/2022 (7 Monate)
Automobilindustrie
Tätigkeitszeitraum

5/2022 – 11/2022

Tätigkeitsbeschreibung

- Import und Vorbereitung der verschiedenen Datenquellen
- Ähnlichkeitsanalyse basierend auf der Produktbezeichnung mit NLP
- Erstellung einer Ähnlichkeitstabelle zum Vergleich der Sachnummern mit mehreren Parametern
- Entwicklung eines neuronalen Netzes zur Prädiktion eines Ähnlichkeitswertes zwischen Sachnummern
- Implementierung eines Algorithmus zur Identifikation von Clustern mit ähnlichen Produkten
- Berechnung des Referenzpreises und Einsparungspotenzial für jedes Cluster
- Generierung und Export einer Datei mit den Ergebnissen des Cluster-Algorithmus
- Aufsetzung einer Schnittstelle zum Weiter- oder Neu-Trainieren des neuronalen Netzes mit Anwender-Feedback
- Deployment innerhalb einer AWS-Umgebung

Verwendete Tools: Python, Scikit-learn, Keras, Tensorflow, Jupyter, Git, AWS, SonarQube

Eingesetzte Qualifikationen

Keras, Scikit-learn, Tensorflow, Python, Amazon Web Services (AWS)

Planung und Implementierung einer WMS-Datenarchitektur
LGI Logistics Group International GmbH, München
4/2022 – 3/2023 (1 Jahr)
Logistikdienstleister
Tätigkeitszeitraum

4/2022 – 3/2023

Tätigkeitsbeschreibung

- Durchführung eines Data Assessment zum WMS Reporting
- Analyse des Status Quo und der Anforderungen an eine Zielarchitektur
- Entwurf von mehreren möglichen Zielarchitekturen mit den jeweiligen Vor- und Nachteilen
- Umsetzung der ausgewählten Architektur in Azure
- Aufsetzung eines ETL-Prozesses zur Verschiebung und Transformation der Daten von lokalen Oracle-Datenbanken in eine Azure SQL Datenbank mit Azure Data Factory

Verwendete Tools: Azure SQL DB, Azure Data Factory, Azure Data Studio, PowerPoint, Power BI, Dataverse, SharePoint

Eingesetzte Qualifikationen

Power Bi, Cloud (allg.), Microsoft Azure

Analyse von Fahrdaten zur Ermittlung des Elektrifizierungspotenzials von LKWs
Kundenname anonymisiert, München
3/2022 – 10/2022 (8 Monate)
Automobilindustrie
Tätigkeitszeitraum

3/2022 – 10/2022

Tätigkeitsbeschreibung

- Identifizierung der Schicht- und Standzeiten von LKWs anhand von Tracking-Daten
- Untersuchung der Points of Interest in der Umgebung von Standorten der LKWs mithilfe der Here Maps API
- Ermittlung der optimalen Anzahl und Orte für Ladestationen von Elektroautos
- Implementierung von Algorithmen zur Bestimmung der elektrifizierbaren LKWs auf Basis der fahrspezifischen Daten
- Entwicklung eines Dashboards mit Plotly Dash zur Analyse des Fahrverhaltens und des Elektrifizierungspotenzials
- Dokumentation der Algorithmen in Confluence

Verwendete Tools: Python, Here Maps API, Plotly, Dash, PyInstaller, Jupyter, Visual Studio Code, Jira Atlassian, Confluence, Git

Eingesetzte Qualifikationen

Data Science, Git, Python

Data Scientist (Festanstellung)
IAM Global GmbH, Düsseldorf
7/2021 – 2/2022 (8 Monate)
Personalvermittlung
Tätigkeitszeitraum

7/2021 – 2/2022

Tätigkeitsbeschreibung

Entwicklung eines Systems zur Personalvermittlung, welches mithilfe von künstlicher Intelligenz und psychologischen Modellen möglichst passende Vakanzen für einen Kandidaten findet
- Datenbereinigung und Import von Stellenausschreibungen
- Programmierung eines intelligenten Algorithmus zur Auswahl der optimalen Kontaktdaten für eine offene Stelle
- Implementierung von Webcrawlern für Kandidatenprofile auf LinkedIn und Xing
- Entwicklung von Machine Learning Modellen zur automatischen Identifizierung passender Vakanzen für einen Kandidaten
- Erstellung einer R Shiny Wep App zur statistischen Auswertung psychologischer Daten
- Mustererkennung und Implementierung psychologischer Modelle
- Erstellung eines Python-Dashboards für die Marktanalyse mit Geo-Heatmaps, Zeitreihenanalyse und ML-Prognosen
- Analyse gesendeter E-Mails und Webhooks zur Optimierung der Antwortrate
- Entwicklung von KI-Modellen zur Vorhersage der Request- und Blacklist-Wahrscheinlichkeiten vor der Präsentation eines Kandidaten bei einem Unternehmen
- Entwicklung von CI/CD Pipelines mit Git und Slack Integration

Verwendete Tools: Python, Scikit-learn, Plotly, Dash, Jupyter, Heroku, R Shiny, R Studio, AWS S3, MongoDB, Mongo Cloud, Jira Atlassian, Git, Linux

Eingesetzte Qualifikationen

Amazon Web Services (AWS), Jira, Mongodb, Python, R (Programmiersprache), Scikit-learn

Werkstudent Data Science
INSO Projects GmbH, Düsseldorf
3/2020 – 6/2021 (1 Jahr, 4 Monate)
Dienstleistungsbranche
Tätigkeitszeitraum

3/2020 – 6/2021

Tätigkeitsbeschreibung

- Implementierung von Feature-Selection-Algorithmen zur Identifizierung von Preistreibern
- Analyse des Quote-to-Cash-Prozesses zur Optimierung des Supply Chain Managements
- Anwendung von NLP-Techniken zur E-Mail-Analyse
- Entwicklung eines Machine Learning Modells zur automatischen Extraktion von Signaturen aus E-Mails
- Analyse und Auswertung von Finanzbuchhaltungsdaten

Verwendete Tools: Python, Scikit-learn, Statsmodels, Seaborn, Jupyter, SQL, SSMS, Hadoop, Microsoft Power BI, Microsoft Teams, SharePoint, Git

Eingesetzte Qualifikationen

Apache Hadoop, Git, Power Bi, Python, Scikit-learn, SQL

Mathematisch-technischer Softwareentwickler (Festanstellung)
Cybernetics Lab IMA & IfU - RWTH Aachen University, Aachen
9/2016 – 8/2019 (3 Jahre)
Hochschulen und Forschungseinrichtungen
Tätigkeitszeitraum

9/2016 – 8/2019

Tätigkeitsbeschreibung

Entwicklung einer Webplattform zur Fabrikplanung
- Implementierung eines Java-Backends mit Spring und Hibernate
- Verwaltung der SQL-Datenbank
- Entwicklung und Optimierung von Datenmodellen
- Auswertung, Erstellung und Datenmigration in NoSQL-Datenbanken zur Leistungssteigerung (MongoDB, Neo4j)
- Einrichtung automatisierter JUnit-Tests
- Implementierung und Anbindung eines Python-Backends für Deep Learning mit Tensorflow

Entwicklung einer Desktop-Anwendung zur Finanz- & Personalverwaltung
- Implementierung vom Backend und Frontend für eine Desktop-Anwendung mit C# und WPF
- Verwaltung der SQL-Datenbank
- Datenmigration aus einer SAP-Datenbank

Verwendete Tools: C#, WPF, Java, Spring, Hibernate, Postman, SQL, MySQL Workbench, MongoDB, Neo4j, Python, Tensorflow, Git, JUnit, IntelliJ IDEA, Visual Studio Code, YouTrack

Eingesetzte Qualifikationen

C#, Git, Java (allg.), Mongodb, Mysql, Python, Softwareentwicklung (allg.), SQL, Tensorflow

Zertifikate

Fabric Analytics Engineer Associate
Microsoft
2024
Power BI Data Analyst Associate
Microsoft
2024
Databricks Certified Data Engineer Associate
Databricks
2023
TensorFlow Developer Certificate
Google
2023
AWS Certified Cloud Practitioner
Amazon Web Services
2023
Azure Data Scientist Associate
Microsoft
2023
Azure Data Engineer Associate
Microsoft
2022
DataScienceMATSE
FH Aachen
2019

Ausbildung

Master of Science
Angewandte Mathematik und Informatik
FH Aachen - University of Applied Sciences
2021
Aachen
Bachelor of Science
Scientific Programming
FH Aachen - University of Applied Sciences
2019
Aachen
Mathematisch-technischer Softwareentwickler
Ausbildung
Cybernetics Lab IMA & IfU - FH Aachen
2019

Über mich

FÄHIGKEITEN
- Datenanalyse, KI-Entwicklung, Machine Learning, Deep Learning
- Entwicklung von Cloud-Architekturen & Datenpipelines
- Datenvisualisierung, Erstellung von Dashboards
- Webentwicklung, API-Erstellung
- Statistische Analysemethoden
- MLOps, DevOps

TOOLS
- Programmiersprachen: Python, R, Java, C#, SQL, PySpark
- Bibliotheken: TensorFlow, Scikit-learn, MLflow, OpenAI, LangChain, Airflow, FastAPI
- Datenbanken: MySQL, Oracle, MongoDB, Pinecone
- Cloud-Plattformen: Azure, AWS, Databricks, MS Fabric
- Datenvisualisierung: Power BI, Streamlit, Seaborn, Plotly, Dash, R Shiny
- Sonstige Tools: Git, Jira, Docker, Heroku, Terraform, Azure DevOps

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Fließend)
  • Spanisch (Gut)
Reisebereitschaft
auf Anfrage
Arbeitserlaubnis
  • Europäische Union
Home-Office
unbedingt
Profilaufrufe
187
Alter
27
Berufserfahrung
8 Jahre und 2 Monate (seit 09/2016)
Projektleitung
2 Jahre

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden