freiberufler AI Engineer/Berater & Data Scientist auf freelance.de

AI Engineer/Berater & Data Scientist

zuletzt online vor 10 Tagen
  • 70€/Stunde
  • 53797 Lohmar, Rheinland
  • auf Anfrage
  • de  |  en  |  es
  • 25.10.2024

Kurzvorstellung

Ich bin Data Scientist mit einem Master in Data Science und spezialisiert auf Künstliche Intelligenz, insbesondere im Fine-Tuning von Modellen, der Entwicklung von automatisierten Lösungen und Data Crawlern/Scrapern.

Auszug Referenzen (2)

"N. war uns bei unserem KI-Projekt eine große Hilfe. Er hat viele Ideen eingebracht, die er auch direkt umsetzen konnte."
AI Engineer/ Data Scientist (Festanstellung)
Peter Glaser
Tätigkeitszeitraum

3/2024 – 9/2024

Tätigkeitsbeschreibung

The project's goal was to create an AI that can generate football reports in the writing style of the kicker journalist (the most famous German football app). I compared many LLMs, prompt engineered the best 2 und fine-tuned them to generate reports for the Bundesliga and Oberliga.

Eingesetzte Qualifikationen

Data Mining, Data Science, Deeplearning4j, Google Cloud, Microsoft Azure, Natural Language Processing

"Alles ist sehr professionell abgelaufen und hat sehr gut funktioniert"
Data Scientist (Festanstellung)
Kundenname anonymisiert
Tätigkeitszeitraum

6/2021 – 12/2023

Tätigkeitsbeschreibung

- customer segmentation
- Creating new data pipelines
- maintaining established ones
- data analysis tasks
- creating tons of Tableau dashboards
- switching from Tableau to PowerBI
- ..

Eingesetzte Qualifikationen

Amazon Web Services (AWS), Big Data, Data Science, Python, Tableau

Qualifikationen

  • Amazon Web Services (AWS)2 J.
  • Big Data3 J.
  • Computer Vision
  • Data Mining
  • Data Science4 J.
  • Generative KI
  • Large Language Models
  • Maschinelles Lernen
  • Natural Language Processing

Projekt‐ & Berufserfahrung

AI Engineer/ Data Scientist (Festanstellung)
Olympia Verlag GmbH (Kicker), Remote
3/2024 – 9/2024 (7 Monate)
Medienbranche
Tätigkeitszeitraum

3/2024 – 9/2024

Tätigkeitsbeschreibung

The project's goal was to create an AI that can generate football reports in the writing style of the kicker journalist (the most famous German football app). I compared many LLMs, prompt engineered the best 2 und fine-tuned them to generate reports for the Bundesliga and Oberliga.

Eingesetzte Qualifikationen

Data Mining, Data Science, Deeplearning4j, Google Cloud, Microsoft Azure, Natural Language Processing

Co Founder (Festanstellung)
SparMahl, Dortmund
1/2024 – offen (11 Monate)
IT & Entwicklung
Tätigkeitszeitraum

1/2024 – offen

Tätigkeitsbeschreibung

Ich bin einer von 3 Gründern von SparMahl.
SparMahl ist Check24 für den Lebensmittteleinkauf.

SparMahl ist eine App die wöchentliche Angebote und das bestehende Sortiment zu den billigsten Rezepten kombiniert und so Leuten beim Sparen helfen will.
Die App empfiehlt außerdem den billigsten Supermarkt in ihrer Nähe für ihre Einkaufsliste.

Bei SparMahl nutzen wir in allen möglichen Bereichen KI.
Ich habe z.B. ein Hybrides Produktklassifizierungsmodell entworfen und entwickelt, dass ein Knowledge Model, ein LLM und ein Vision Model nutzt um alle Lebensmittel in eine von über 1000 Kategorien zu klassifizieren.

Außerdem hab ich alle Crawler selbst programmiert die automatisiert alle 30.000 Supermarkt Filialen Deutschlandweit innerhalb einer Stunde scrapen, um genau zu wissen welches Angebot in welcher Filiale gültig ist.

Eingesetzte Qualifikationen

Data Science, Natural Language Processing

Data Scientist (Festanstellung)
Ionity, München
6/2021 – 12/2023 (2 Jahre, 7 Monate)
Automobilindustrie
Tätigkeitszeitraum

6/2021 – 12/2023

Tätigkeitsbeschreibung

- customer segmentation
- Creating new data pipelines
- maintaining established ones
- data analysis tasks
- creating tons of Tableau dashboards
- switching from Tableau to PowerBI
- ..

Eingesetzte Qualifikationen

Amazon Web Services (AWS), Big Data, Data Science, Python, Tableau

Junior Data Analyst (Festanstellung)
chargecloud GmbH, Köln
9/2020 – 3/2021 (7 Monate)
Automobilindustrie
Tätigkeitszeitraum

9/2020 – 3/2021

Tätigkeitsbeschreibung

Several data analysis tasks, maintaining, cleaning and restructuring the database.
Qualitative and quantitative market analysis, consisting of finding possible new EU markets. In the quantitative part, predicting the number of EVs with several data science methods in certain countries for the next 5 years.

Eingesetzte Qualifikationen

Data Science, Big Data, Data Warehousing

Ausbildung

Data Science
Master
Technische Universität Dortmund
2024
Dortmund
Wirtschaftsinformatik
Bachelor
Hochschule Bonn-Rhein-Sieg
2021
Bonn

Über mich

Als Data Scientist mit einem Masterabschluss von der TU Dortmund bringe ich fundierte Erfahrungen in der Entwicklung und Anwendung innovativer Technologien mit, darunter Kunden-Segmentierung und Machine Learning. In meiner Rolle als Mitgründer von SparMahl habe ich ein hybrides Produktklassifizierungsmodell entwickelt, das Supermarktprodukte und Rezeptzutaten in über 1.000 Kategorien einordnet. Durch den Einsatz von einem Large Language-, Knowledge- und Visionmodel erfassen wir selbst subtile Unterschiede präzise. Parallel dazu habe ich automatisierte Web-Crawler für alle großen deutschen Supermarktketten entwickelt, um die Angebote aus über allen 30.000 Filialen effizient zu erfassen.

Für Olympia-Verlag GmbH (Kicker App) habe ich das Fine-Tuning von Large Language Models wie GPT-3.5 und Mixtral 8x7b durchgeführt, um qualitativ hochwertige Fußballspielberichte mit diesen KIs zu generieren. Dabei kam unter anderem LoRa (Low-Rank Adaptation) zum Einsatz, um Ressourcen effizient zu nutzen. Die Modelle wurden erfolgreich trainiert, um Bundesliga- und Oberliga-Berichte im Stil des Kicker-Magazins zu erstellen.

Meine Expertise umfasst die Implementierung von spezialisierten Web-Crawlern, automatisierte Datenakquise mit GitHub Actions, sowie den Einsatz von Tools wie Transformers, PyTorch, und verschiedenen Machine Learning-Frameworks. Durch meine vielseitigen Projekte habe ich mir einen praxisnahen und innovativen Ansatz erarbeitet, um maßgeschneiderte Lösungen zu entwickeln, die sowohl im Bereich Machine Learning als auch bei der Automatisierung von Prozessen überzeugen.

Weitere Kenntnisse

Programmiersprachen:
Python, R, C++, Java, SQL, JavaScript

Technologien / Tools / Plattformen:
Pandas, Git, HTML, CSS, Docker, AWS EC2, AWS Sagemaker, Azure, Tableau, Power BI, Airflow, Git Actions
Python Programmierung / Pakete:
Data Science (Analysis): pandas, scikit-learn, statsmodels, numpy, scipy, pytorch
Natural Language Processing / AI: pytorch, Regex, openai, langchain, transformers, huggingface-hub, FAISS, tiktoken, bitsandbytes, peft, torchtext, torchvision, flash-attn
(Advanced) Clustering & Segmentation: K-means, DBSCAN, hierarchical clustering.
Advanced: CLIQUE, SUBCLU, SCHISM, PROCLUS, DOC, P3C, ENCLUS, HICS, LSA
Automatisierung & Web Scraping: scrapy, selenium, beautifulsoup4, lxml, urllib3, puppeteer, puppeteer-extra-plugin-stealth, Git Actions
Visualisierung & Plotting: matplotlib, seaborn, pillow
Data Pipelines & Workflow Automatisierung: Airflow, AWS EC2, Docker

Statistische / ML-Modelle:
Large Language Models, Knowledge Models, Neural Networks, Dimensionality Reduction
GPT fine-tuning, Mixtral 8x7b fine-tuning (with LoRa)
Model evaluation with custom metrics
Model training with SFTTrainer (transformers, trl, flash-attn)
Linear Models, Generalized Linear Models, Mixed Effects Models
Topic Models (PLSA, LDA, CTM, STM) for discovering hidden Topics/Schemas in Text
Time Series Modeling, Discriminant Analysis, KNN Classification
Clustering (K-means, DBSCAN, hierarchical clustering)

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Fließend)
  • Spanisch (Gut)
Reisebereitschaft
auf Anfrage
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
56
Alter
26
Berufserfahrung
5 Jahre und 2 Monate (seit 09/2019)

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden