AI Engineer/Berater & Data Scientist
- Verfügbarkeit einsehen
- 2 Referenzen
- 70€/Stunde
- 53797 Lohmar, Rheinland
- auf Anfrage
- de | en | es
- 25.10.2024
Kurzvorstellung
Auszug Referenzen (2)
"N. war uns bei unserem KI-Projekt eine große Hilfe. Er hat viele Ideen eingebracht, die er auch direkt umsetzen konnte."
3/2024 – 9/2024
TätigkeitsbeschreibungThe project's goal was to create an AI that can generate football reports in the writing style of the kicker journalist (the most famous German football app). I compared many LLMs, prompt engineered the best 2 und fine-tuned them to generate reports for the Bundesliga and Oberliga.
Eingesetzte QualifikationenData Mining, Data Science, Deeplearning4j, Google Cloud, Microsoft Azure, Natural Language Processing
"Alles ist sehr professionell abgelaufen und hat sehr gut funktioniert"
6/2021 – 12/2023
Tätigkeitsbeschreibung
- customer segmentation
- Creating new data pipelines
- maintaining established ones
- data analysis tasks
- creating tons of Tableau dashboards
- switching from Tableau to PowerBI
- ..
Amazon Web Services (AWS), Big Data, Data Science, Python, Tableau
Qualifikationen
Projekt‐ & Berufserfahrung
3/2024 – 9/2024
TätigkeitsbeschreibungThe project's goal was to create an AI that can generate football reports in the writing style of the kicker journalist (the most famous German football app). I compared many LLMs, prompt engineered the best 2 und fine-tuned them to generate reports for the Bundesliga and Oberliga.
Eingesetzte QualifikationenData Mining, Data Science, Deeplearning4j, Google Cloud, Microsoft Azure, Natural Language Processing
1/2024 – offen
Tätigkeitsbeschreibung
Ich bin einer von 3 Gründern von SparMahl.
SparMahl ist Check24 für den Lebensmittteleinkauf.
SparMahl ist eine App die wöchentliche Angebote und das bestehende Sortiment zu den billigsten Rezepten kombiniert und so Leuten beim Sparen helfen will.
Die App empfiehlt außerdem den billigsten Supermarkt in ihrer Nähe für ihre Einkaufsliste.
Bei SparMahl nutzen wir in allen möglichen Bereichen KI.
Ich habe z.B. ein Hybrides Produktklassifizierungsmodell entworfen und entwickelt, dass ein Knowledge Model, ein LLM und ein Vision Model nutzt um alle Lebensmittel in eine von über 1000 Kategorien zu klassifizieren.
Außerdem hab ich alle Crawler selbst programmiert die automatisiert alle 30.000 Supermarkt Filialen Deutschlandweit innerhalb einer Stunde scrapen, um genau zu wissen welches Angebot in welcher Filiale gültig ist.
Data Science, Natural Language Processing
6/2021 – 12/2023
Tätigkeitsbeschreibung
- customer segmentation
- Creating new data pipelines
- maintaining established ones
- data analysis tasks
- creating tons of Tableau dashboards
- switching from Tableau to PowerBI
- ..
Amazon Web Services (AWS), Big Data, Data Science, Python, Tableau
9/2020 – 3/2021
Tätigkeitsbeschreibung
Several data analysis tasks, maintaining, cleaning and restructuring the database.
Qualitative and quantitative market analysis, consisting of finding possible new EU markets. In the quantitative part, predicting the number of EVs with several data science methods in certain countries for the next 5 years.
Data Science, Big Data, Data Warehousing
Ausbildung
Technische Universität Dortmund
Dortmund
Hochschule Bonn-Rhein-Sieg
Bonn
Über mich
Für Olympia-Verlag GmbH (Kicker App) habe ich das Fine-Tuning von Large Language Models wie GPT-3.5 und Mixtral 8x7b durchgeführt, um qualitativ hochwertige Fußballspielberichte mit diesen KIs zu generieren. Dabei kam unter anderem LoRa (Low-Rank Adaptation) zum Einsatz, um Ressourcen effizient zu nutzen. Die Modelle wurden erfolgreich trainiert, um Bundesliga- und Oberliga-Berichte im Stil des Kicker-Magazins zu erstellen.
Meine Expertise umfasst die Implementierung von spezialisierten Web-Crawlern, automatisierte Datenakquise mit GitHub Actions, sowie den Einsatz von Tools wie Transformers, PyTorch, und verschiedenen Machine Learning-Frameworks. Durch meine vielseitigen Projekte habe ich mir einen praxisnahen und innovativen Ansatz erarbeitet, um maßgeschneiderte Lösungen zu entwickeln, die sowohl im Bereich Machine Learning als auch bei der Automatisierung von Prozessen überzeugen.
Weitere Kenntnisse
Python, R, C++, Java, SQL, JavaScript
Technologien / Tools / Plattformen:
Pandas, Git, HTML, CSS, Docker, AWS EC2, AWS Sagemaker, Azure, Tableau, Power BI, Airflow, Git Actions
Python Programmierung / Pakete:
Data Science (Analysis): pandas, scikit-learn, statsmodels, numpy, scipy, pytorch
Natural Language Processing / AI: pytorch, Regex, openai, langchain, transformers, huggingface-hub, FAISS, tiktoken, bitsandbytes, peft, torchtext, torchvision, flash-attn
(Advanced) Clustering & Segmentation: K-means, DBSCAN, hierarchical clustering.
Advanced: CLIQUE, SUBCLU, SCHISM, PROCLUS, DOC, P3C, ENCLUS, HICS, LSA
Automatisierung & Web Scraping: scrapy, selenium, beautifulsoup4, lxml, urllib3, puppeteer, puppeteer-extra-plugin-stealth, Git Actions
Visualisierung & Plotting: matplotlib, seaborn, pillow
Data Pipelines & Workflow Automatisierung: Airflow, AWS EC2, Docker
Statistische / ML-Modelle:
Large Language Models, Knowledge Models, Neural Networks, Dimensionality Reduction
GPT fine-tuning, Mixtral 8x7b fine-tuning (with LoRa)
Model evaluation with custom metrics
Model training with SFTTrainer (transformers, trl, flash-attn)
Linear Models, Generalized Linear Models, Mixed Effects Models
Topic Models (PLSA, LDA, CTM, STM) for discovering hidden Topics/Schemas in Text
Time Series Modeling, Discriminant Analysis, KNN Classification
Clustering (K-means, DBSCAN, hierarchical clustering)
Persönliche Daten
- Deutsch (Muttersprache)
- Englisch (Fließend)
- Spanisch (Gut)
- Europäische Union
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden