freiberufler Unternehmensberatung auf freelance.de

Unternehmensberatung

zuletzt online vor wenigen Stunden
  • auf Anfrage
  • 20257 Eimsbüttel
  • Europa
  • de  |  fr  |  en
  • 15.12.2024

Kurzvorstellung

Mehrjährige Erfahrung in Machine Learning und Deep Learning mit Schwerpunkt Document Understanding/Document AI sowie Large Language Models (GPT-3.5, GPT-4, Llama, etc.)

Entwicklung von Prototypen und produktiven KI-Komponenten.

Qualifikationen

  • Data Science
  • Data Warehousing
  • Kundenberater
  • Maschinelles Lernen
  • Python15 J.
  • Pytorch5 J.
  • Rechnungswesen (allg.)
  • Risikomanagement (Finan.)
  • Tensorflow5 J.
  • Vertriebscontrolling

Projekt‐ & Berufserfahrung

Researcher
Kundenname anonymisiert, Hamburg
7/2024 – 9/2024 (3 Monate)
Öffentliche Verwaltung
Tätigkeitszeitraum

7/2024 – 9/2024

Tätigkeitsbeschreibung

- Erstellung einer Studie für den Einsatz von LLM in der öffentlichen Verwaltung
- Übersichtsreport über Large Language Models allgemein: Architektur, Pre-Training, Instruct-Tuning, Reinforcement Learning, Safe Guarding
- Übersicht von kommerziellen Anbietern
- Übersicht von Open-Source Anbietern
- Herausforderung bei produktiven Einsatz

Eingesetzte Qualifikationen

IT-Berater

Data Scientist
Kundenname anonymisiert, Hamburg
7/2024 – 8/2024 (2 Monate)
Finanzdienstleister
Tätigkeitszeitraum

7/2024 – 8/2024

Tätigkeitsbeschreibung

- Training- und Finetuning eines Modells für die Erkennung von Tabellen und Extraktion von Tabellenstrukturen aus Kontoauszügen
- Beratung bei der Produktivsetzung unter Low-Latency-Gesichtspunkten

Eingesetzte Qualifikationen

Python-Programmierer

Data Scientist
Kundenname anonymisiert, Hamburg
2/2024 – offen (11 Monate)
Finanzdienstleister
Tätigkeitszeitraum

2/2024 – offen

Tätigkeitsbeschreibung

- Beratung bei der Suche von KI-Modellen für die Klassifikation und Entitäten-Extraktion von strukturierten Dokumenten ( PDF/Scan-Rechnungen, Quittungen, etc.)
- Erstellung von Training- und Evaluationspipelines basierend auf der eigens entwickelten Open-Source Library deepdoctection
- Erstellung einer Dockerfiles für die Produktivsetzung in einer EC2-Umgebung.
- Performance-Optimierung

Eingesetzte Qualifikationen

Kundenberater, Python

Architekt
Kundenname anonymisiert, Hamburg
10/2023 – 2/2024 (5 Monate)
Finanzdienstleister
Tätigkeitszeitraum

10/2023 – 2/2024

Tätigkeitsbeschreibung

Konzeption bei der Erstellung einer Document AI Plattform:

- Vergleich von Cloud-Provider Angeboten
- Integration in die eigene Plattform via REST-API

Eingesetzte Qualifikationen

Python-Programmierer

Beratung/ Entwicklung
Kundenname anonymisiert, Hamburg
1/2023 – 10/2023 (10 Monate)
Versicherungen
Tätigkeitszeitraum

1/2023 – 10/2023

Tätigkeitsbeschreibung

Einführung der Document AI Plattform

 Automatisierte Verarbeitung der Anhänge des E-Mail-Posteingangs
 Klassifikation der Anhänge (Arztbrief, Rezept, etc.)
 Anleiten bei der Erstellung Annotationen
 Training von image transformer encoder (Donut type model)

Eingesetzte Qualifikationen

Pytorch

Berater, Entwickler
Kundenname anonymisiert, Hamburg
8/2022 – 12/2022 (5 Monate)
Gesundheitswesen
Tätigkeitszeitraum

8/2022 – 12/2022

Tätigkeitsbeschreibung

Erstellung einer Datenbank von literarischen Quellverzeichnissen

 Extraktion von Literaturverzeichnissen aus wissenschaftlichen Publikationen
 Verwendung von Vision (Detectron2), OCR (AWS Textract) und NLP-Modellen (SpaCy)

Eingesetzte Qualifikationen

Python

Entwickler
Kundenname anonymisiert, Hamburg
1/2020 – offen (5 Jahre)
IT & Entwicklung
Tätigkeitszeitraum

1/2020 – offen

Tätigkeitsbeschreibung

Entwicklung des Open Source Python Packages deepdoctection
zum Parsen und Extrahieren von Informationen aus komplex strukturierten Dokumenten (1500+ Stars)

-Hyperlink entfernt-

 Deep-Learning basiertes adaptierbares Parsen von komplex strukturierten Dokumenten
 Layout-Erkennung, Tabellenerkennung und Segmentierung, OCR und strukturierte Ausgabe für Downstream Tasks (zum Beispiel Feed zu OpenAI)
 Adaption der integrierten Modelle auf eigene Dokumentstrukturen zur Erhöhung der Extraktionsqualität
 Orchestrierung der Pipeline (Speichern der gelieferten Daten, Logging)
 Einbindung von Python Drittpackages in Pipelines durch einfache Schnittstellen-API

Eingesetzte Qualifikationen

Pytorch, Tensorflow, Python

Berater
Kundenname anonymisiert, Frankfurt
9/2008 – 12/2018 (10 Jahre, 4 Monate)
Banken
Tätigkeitszeitraum

9/2008 – 12/2018

Tätigkeitsbeschreibung

Diverse Projekte bei Finanzinstituten und Kapitalverwaltungsgesellschaften

 Diverse Themen bei der fachlichen Konzeption zur Einführung eines Finance-und Risk Datawarehouse bei einer deutschen Universalbank
- Automatisierte Abstimmung des Buchungsstoff zwischen Kernbank- und Accounting System
- Verwendung von NLP spezifischen Frameworks: SpaCy und Regex
- Anbindung diverse Quellsysteme. Konzeption von Schnittstellen für Zielsysteme (z.B. Meldewesen Abacus DaVinci/A360)
- Konzeption von Business-Logik, die in die ETL-Strecken abgebildet werden mussten.
 Fach- und Feinkonzeption sowie Implementierung einer Access-Datenbank (inkl. VBA und Interfacegestaltung) zur Erzeugung von Buchungen im Hauptbuch, die Hedge-Accounting Effekte betreffen
 Konzeption und Implementierung von Stress-Test Szenarien bei einer KVG. Berücksichtigung von Marktpreis-Zins- und Op-Risiken. Abstimmung der Abbildung mit der Geschäftsführung und dem internen Audit.

Eingesetzte Qualifikationen

Python, Microsoft Excel

Ausbildung

Mathematik
Promotion
2005
TU Berlin

Über mich

Mehrjährige Erfahrung in Machine Learning und Deep Learning mit Schwerpunkt Document Understanding/Document AI: Identifizierung Use-Case, Data-Annotation, Training, Evaluation und Integration im Produktionsprozess. Beratung und Unterstützung bei Auswahl eines Plattformanbieters

Entwicklung und Wartung der Open Source Library deepdoctection (>1700 Stars auf Github): Zusammenstellung von Pipelines (OCR, Computer Vision, Foundation Modelle) zur Prozessierung von unstrukturierten Dokumenten: Dokumenten Layout Analysis, Textklassifikation und Entitätenerkennung. Sprecher bei der PyData 2022 in Berlin.

Erfahrung bei der Konzeption und Prototyping von Use-Cases mit Large Language Models (Langchain, LLamaIndex, Hugging Face). Data-Preparation für Fine-Tuning von LLMs auf Domain-spezifischen Gebiet.

Weitere Kenntnisse

Python, Data Science, SQL, Microsoft Office (Access, Excel, VBA), C, C++

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Französisch (Fließend)
  • Englisch (Fließend)
Reisebereitschaft
Europa
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
2150
Alter
48
Berufserfahrung
16 Jahre und 11 Monate (seit 01/2008)

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden