Unternehmensberatung

zuletzt online vor wenigen Stunden

Verfügbarkeit einsehen
0 Referenzen

auf Anfrage
20257 Eimsbüttel
Europa
de | fr | en
25.03.2025

Kurzvorstellung

			Mehrjährige Erfahrung in Machine Learning und Deep Learning mit Schwerpunkt Document Understanding/Document AI sowie Large Language Models (GPT-3.5, GPT-4, Llama, etc.)

Entwicklung von Prototypen und produktiven KI-Komponenten.

Qualifikationen

		 Data Science
 Data Warehousing
 Kundenberater1 J.
 Maschinelles Lernen
 Python15 J.
 Pytorch5 J.
 Rechnungswesen (allg.)
 Risikomanagement (Finan.)
 Tensorflow5 J.
 Vertriebscontrolling

		

Projekt‐ & Berufserfahrung

Researcher 
									Kundenname anonymisiert, Hamburg								

7/2024 – 9/2024 (3 Monate)

Details anzeigen

Tätigkeitszeitraum

7/2024 – 9/2024

Tätigkeitsbeschreibung

- Erstellung einer Studie für den Einsatz von LLM in der öffentlichen Verwaltung
- Übersichtsreport über Large Language Models allgemein: Architektur, Pre-Training, Instruct-Tuning, Reinforcement Learning, Safe Guarding
- Übersicht von kommerziellen Anbietern
- Übersicht von Open-Source Anbietern
- Herausforderung bei produktiven Einsatz

Eingesetzte Qualifikationen

IT-Berater

Data Scientist 
									Kundenname anonymisiert, Hamburg								

7/2024 – 8/2024 (2 Monate)

Details anzeigen

Tätigkeitszeitraum

7/2024 – 8/2024

Tätigkeitsbeschreibung

- Training- und Finetuning eines Modells für die Erkennung von Tabellen und Extraktion von Tabellenstrukturen aus Kontoauszügen
- Beratung bei der Produktivsetzung unter Low-Latency-Gesichtspunkten

Eingesetzte Qualifikationen

Python-Programmierer

Data Scientist 
									Kundenname anonymisiert, Hamburg								

2/2024 – offen (1 Jahr, 2 Monate)

Details anzeigen

Tätigkeitszeitraum

2/2024 – offen

Tätigkeitsbeschreibung

- Beratung bei der Suche von KI-Modellen für die Klassifikation und Entitäten-Extraktion von strukturierten Dokumenten ( PDF/Scan-Rechnungen, Quittungen, etc.)
- Erstellung von Training- und Evaluationspipelines basierend auf der eigens entwickelten Open-Source Library deepdoctection
- Erstellung einer Dockerfiles für die Produktivsetzung in einer EC2-Umgebung.
- Performance-Optimierung

Eingesetzte Qualifikationen

Kundenberater, Python

Architekt 
									Kundenname anonymisiert, Hamburg								

10/2023 – 2/2024 (5 Monate)

Details anzeigen

Tätigkeitszeitraum

10/2023 – 2/2024

Tätigkeitsbeschreibung

Konzeption bei der Erstellung einer Document AI Plattform:

- Vergleich von Cloud-Provider Angeboten
- Integration in die eigene Plattform via REST-API

Eingesetzte Qualifikationen

Python-Programmierer

Beratung/ Entwicklung 
									Kundenname anonymisiert, Hamburg								

1/2023 – 10/2023 (10 Monate)

Details anzeigen

Tätigkeitszeitraum

1/2023 – 10/2023

Tätigkeitsbeschreibung

Einführung der Document AI Plattform

 Automatisierte Verarbeitung der Anhänge des E-Mail-Posteingangs
 Klassifikation der Anhänge (Arztbrief, Rezept, etc.)
 Anleiten bei der Erstellung Annotationen
 Training von image transformer encoder (Donut type model)

Eingesetzte Qualifikationen

Pytorch

Berater, Entwickler 
									Kundenname anonymisiert, Hamburg								

8/2022 – 12/2022 (5 Monate)

Details anzeigen

Tätigkeitszeitraum

8/2022 – 12/2022

Tätigkeitsbeschreibung

Erstellung einer Datenbank von literarischen Quellverzeichnissen

 Extraktion von Literaturverzeichnissen aus wissenschaftlichen Publikationen
 Verwendung von Vision (Detectron2), OCR (AWS Textract) und NLP-Modellen (SpaCy)

Eingesetzte Qualifikationen

Python

Entwickler 
									Kundenname anonymisiert, Hamburg								

1/2020 – offen (5 Jahre, 3 Monate)

Details anzeigen

Tätigkeitszeitraum

1/2020 – offen

Tätigkeitsbeschreibung

Entwicklung des Open Source Python Packages deepdoctection
zum Parsen und Extrahieren von Informationen aus komplex strukturierten Dokumenten (1500+ Stars)

-Hyperlink entfernt-

 Deep-Learning basiertes adaptierbares Parsen von komplex strukturierten Dokumenten
 Layout-Erkennung, Tabellenerkennung und Segmentierung, OCR und strukturierte Ausgabe für Downstream Tasks (zum Beispiel Feed zu OpenAI)
 Adaption der integrierten Modelle auf eigene Dokumentstrukturen zur Erhöhung der Extraktionsqualität
 Orchestrierung der Pipeline (Speichern der gelieferten Daten, Logging)
 Einbindung von Python Drittpackages in Pipelines durch einfache Schnittstellen-API

Eingesetzte Qualifikationen

Pytorch, Tensorflow, Python

Berater 
									Kundenname anonymisiert, Frankfurt								

9/2008 – 12/2018 (10 Jahre, 4 Monate)

Details anzeigen

Tätigkeitszeitraum

9/2008 – 12/2018

Tätigkeitsbeschreibung

Diverse Projekte bei Finanzinstituten und Kapitalverwaltungsgesellschaften

 Diverse Themen bei der fachlichen Konzeption zur Einführung eines Finance-und Risk Datawarehouse bei einer deutschen Universalbank
- Automatisierte Abstimmung des Buchungsstoff zwischen Kernbank- und Accounting System
- Verwendung von NLP spezifischen Frameworks: SpaCy und Regex
- Anbindung diverse Quellsysteme. Konzeption von Schnittstellen für Zielsysteme (z.B. Meldewesen Abacus DaVinci/A360)
- Konzeption von Business-Logik, die in die ETL-Strecken abgebildet werden mussten.
 Fach- und Feinkonzeption sowie Implementierung einer Access-Datenbank (inkl. VBA und Interfacegestaltung) zur Erzeugung von Buchungen im Hauptbuch, die Hedge-Accounting Effekte betreffen
 Konzeption und Implementierung von Stress-Test Szenarien bei einer KVG. Berücksichtigung von Marktpreis-Zins- und Op-Risiken. Abstimmung der Abbildung mit der Geschäftsführung und dem internen Audit.

Eingesetzte Qualifikationen

Python, Microsoft Excel

Weitere Projekt‐ & Berufserfahrung anzeigen Weitere Projekt‐ & Berufserfahrung ausblenden

Ausbildung

Mathematik

Promotion

2005
TU Berlin

Über mich

			Mehrjährige Erfahrung in Machine Learning und Deep Learning mit Schwerpunkt Document Understanding/Document AI: Identifizierung Use-Case, Data-Annotation, Training, Evaluation und Integration im Produktionsprozess. Beratung und Unterstützung bei Auswahl eines Plattformanbieters

Entwicklung und Wartung der Open Source Library deepdoctection (>1700 Stars auf Github): Zusammenstellung von Pipelines (OCR, Computer Vision, Foundation Modelle) zur Prozessierung von unstrukturierten Dokumenten: Dokumenten Layout Analysis, Textklassifikation und Entitätenerkennung. Sprecher bei der PyData 2022 in Berlin.

Erfahrung bei der Konzeption und Prototyping von Use-Cases mit Large Language Models (Langchain, LLamaIndex, Hugging Face).  Data-Preparation für Fine-Tuning von LLMs auf Domain-spezifischen Gebiet.

Weitere Kenntnisse

Python, Data Science, SQL, Microsoft Office (Access, Excel, VBA), C, C++

Persönliche Daten

Sprache

							Deutsch (Muttersprache)
Französisch (Fließend)
Englisch (Fließend)

							

Reisebereitschaft

Europa

Arbeitserlaubnis

Europäische Union

Home-Office

bevorzugt

Profilaufrufe

2218

Alter

Berufserfahrung

							17 Jahre und 2 Monate
							(seit 01/2008)
							

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden