Unternehmensberatung
- Verfügbarkeit einsehen
- 0 Referenzen
- auf Anfrage
- 20257 Eimsbüttel
- Europa
- de | fr | en
- 15.11.2024
Kurzvorstellung
Entwicklung von Prototypen und produktiven KI-Komponenten.
Qualifikationen
Projekt‐ & Berufserfahrung
7/2024 – 9/2024
Tätigkeitsbeschreibung
- Erstellung einer Studie für den Einsatz von LLM in der öffentlichen Verwaltung
- Übersichtsreport über Large Language Models allgemein: Architektur, Pre-Training, Instruct-Tuning, Reinforcement Learning, Safe Guarding
- Übersicht von kommerziellen Anbietern
- Übersicht von Open-Source Anbietern
- Herausforderung bei produktiven Einsatz
IT-Berater
7/2024 – 8/2024
Tätigkeitsbeschreibung
- Training- und Finetuning eines Modells für die Erkennung von Tabellen und Extraktion von Tabellenstrukturen aus Kontoauszügen
- Beratung bei der Produktivsetzung unter Low-Latency-Gesichtspunkten
Python-Programmierer
2/2024 – offen
Tätigkeitsbeschreibung
- Beratung bei der Suche von KI-Modellen für die Klassifikation und Entitäten-Extraktion von strukturierten Dokumenten ( PDF/Scan-Rechnungen, Quittungen, etc.)
- Erstellung von Training- und Evaluationspipelines basierend auf der eigens entwickelten Open-Source Library deepdoctection
- Erstellung einer Dockerfiles für die Produktivsetzung in einer EC2-Umgebung.
- Performance-Optimierung
Kundenberater, Python
10/2023 – 2/2024
Tätigkeitsbeschreibung
Konzeption bei der Erstellung einer Document AI Plattform:
- Vergleich von Cloud-Provider Angeboten
- Integration in die eigene Plattform via REST-API
Python-Programmierer
1/2023 – 10/2023
Tätigkeitsbeschreibung
Einführung der Document AI Plattform
Automatisierte Verarbeitung der Anhänge des E-Mail-Posteingangs
Klassifikation der Anhänge (Arztbrief, Rezept, etc.)
Anleiten bei der Erstellung Annotationen
Training von image transformer encoder (Donut type model)
Pytorch
8/2022 – 12/2022
Tätigkeitsbeschreibung
Erstellung einer Datenbank von literarischen Quellverzeichnissen
Extraktion von Literaturverzeichnissen aus wissenschaftlichen Publikationen
Verwendung von Vision (Detectron2), OCR (AWS Textract) und NLP-Modellen (SpaCy)
Python
1/2020 – offen
Tätigkeitsbeschreibung
Entwicklung des Open Source Python Packages deepdoctection
zum Parsen und Extrahieren von Informationen aus komplex strukturierten Dokumenten (1500+ Stars)
-Hyperlink entfernt-
Deep-Learning basiertes adaptierbares Parsen von komplex strukturierten Dokumenten
Layout-Erkennung, Tabellenerkennung und Segmentierung, OCR und strukturierte Ausgabe für Downstream Tasks (zum Beispiel Feed zu OpenAI)
Adaption der integrierten Modelle auf eigene Dokumentstrukturen zur Erhöhung der Extraktionsqualität
Orchestrierung der Pipeline (Speichern der gelieferten Daten, Logging)
Einbindung von Python Drittpackages in Pipelines durch einfache Schnittstellen-API
Pytorch, Tensorflow, Python
9/2008 – 12/2018
Tätigkeitsbeschreibung
Diverse Projekte bei Finanzinstituten und Kapitalverwaltungsgesellschaften
Diverse Themen bei der fachlichen Konzeption zur Einführung eines Finance-und Risk Datawarehouse bei einer deutschen Universalbank
- Automatisierte Abstimmung des Buchungsstoff zwischen Kernbank- und Accounting System
- Verwendung von NLP spezifischen Frameworks: SpaCy und Regex
- Anbindung diverse Quellsysteme. Konzeption von Schnittstellen für Zielsysteme (z.B. Meldewesen Abacus DaVinci/A360)
- Konzeption von Business-Logik, die in die ETL-Strecken abgebildet werden mussten.
Fach- und Feinkonzeption sowie Implementierung einer Access-Datenbank (inkl. VBA und Interfacegestaltung) zur Erzeugung von Buchungen im Hauptbuch, die Hedge-Accounting Effekte betreffen
Konzeption und Implementierung von Stress-Test Szenarien bei einer KVG. Berücksichtigung von Marktpreis-Zins- und Op-Risiken. Abstimmung der Abbildung mit der Geschäftsführung und dem internen Audit.
Python, Microsoft Excel
Ausbildung
TU Berlin
Über mich
Entwicklung und Wartung der Open Source Library deepdoctection (>1700 Stars auf Github): Zusammenstellung von Pipelines (OCR, Computer Vision, Foundation Modelle) zur Prozessierung von unstrukturierten Dokumenten: Dokumenten Layout Analysis, Textklassifikation und Entitätenerkennung. Sprecher bei der PyData 2022 in Berlin.
Erfahrung bei der Konzeption und Prototyping von Use-Cases mit Large Language Models (Langchain, LLamaIndex, Hugging Face). Data-Preparation für Fine-Tuning von LLMs auf Domain-spezifischen Gebiet.
Weitere Kenntnisse
Persönliche Daten
- Deutsch (Muttersprache)
- Französisch (Fließend)
- Englisch (Fließend)
- Europäische Union
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden