freiberufler Data Science und Engineering | Bioinformatik auf freelance.de

Data Science und Engineering | Bioinformatik

zuletzt online vor wenigen Tagen
  • 90‐95€/Stunde
  • 13359 Mitte
  • DACH-Region
  • de  |  en  |  es
  • 01.03.2025

Kurzvorstellung

Data Engineer and Scientist. Specializing in ETL and Analytics, building and maintaining cost effective infrastructure and stakeholder communication.
Preferrably working in Biotech / Pharma and logistics

Auszug Referenzen (1)

"E. T. provided a great support to our data retrieval team and managed the signal management system Empirica Signal."
Data Scientist Consultant
Heiko Marzahn
Tätigkeitszeitraum

5/2020 – 2/2021

Tätigkeitsbeschreibung

Expert as well as technical consultancy for the provision of the results of the safety databases of various customers within the Merck Pharmacovigilance system.
Covering an the environment of "SQL", "SQL/PLSQL", "IBM Cognos Analytics" and "Spotfire".
Additional Subject Matter Expert in the Oracle Empirica Pharmacovigilance Signal Management application.

- Content translation of the existing requirements of external customers (physicians as well as operative units)
and members of the IT team

- Development and collection of the medical and scientific questions of the "Safety Data Retrieval Team" within the interviews with the team and translation of the questions into technical requirements for the database.

search strategies
- Programming new and improving existing complex SQL statements
- Development of innovative methods for analysis, evaluation and presentation of pharmacovigilance data
(ARISg, Argus Safety).
- Optimization of query operations by creating and quality checking the database output of the reporting and visualization software.

The aim of the activity is to achieve measurable improvements by automating and optimizing existing processes and tools.

Translating stakeholder requirements into validated systems.

Eingesetzte Qualifikationen

Data Mining, IBM Cognos, PL/SQL, Qualitätsmanagement / QS / QA (IT), Signalverarbeitung

Qualifikationen

  • Administration von Datenbanken
  • Big Data5 J.
  • Data Mining3 J.
  • Data Science7 J.
  • Data Warehousing4 J.
  • Datenanalyse
  • Natural Language Processing
  • Python3 J.
  • Statistiken1 J.
  • Tensorflow

Projekt‐ & Berufserfahrung

Data Scientist / NLP experte
Otto GmbH, Hamburg
11/2023 – 1/2025 (1 Jahr, 3 Monate)
Handel
Tätigkeitszeitraum

11/2023 – 1/2025

Tätigkeitsbeschreibung

Implementation of LLM based Text comprehension for the user facing suggest.
· Restructure prompt engineering and Vespa content retrieval ranking.
· Design and training of NN and LightGBM based suggest event responses.
· Timeseries forecasting for user preference assessment.
· Scale and integrate LLMs and RAGs into production with MLFlow monitoring.
· Statistical design of new exeriment analysis pipeline.

Eingesetzte Qualifikationen

Amazon Web Services (AWS), Data Science, Mathematischer Statistiker, MLOps, Python

Data Engineer
Deutsche Bank, Frankfurt / Remote
2/2023 – 8/2023 (7 Monate)
Banken
Tätigkeitszeitraum

2/2023 – 8/2023

Tätigkeitsbeschreibung

Data Engineer im Online Banking
Quality control and implementation of streaming data ingest approaches.
Implementation via Python and Java

Eingesetzte Qualifikationen

Cloud (allg.), Data Vault, Data Warehousing

Data Engineer
MediaMarkt Saturn, Remote
4/2021 – 10/2022 (1 Jahr, 7 Monate)
Konsumgüterindustrie
Tätigkeitszeitraum

4/2021 – 10/2022

Tätigkeitsbeschreibung

Data engineering
End to End Implementation of a data ingesiton pipeline in GCP.
Dataflow and Airflow batch data ingestion.
MPP Warehouse setup and implementation.
Data visualization via Dashboards. Ticketing system setup via Cherwell.
Data quality assurance automation and implementation.
Stakeholder expectation management and requirement translation.

Eingesetzte Qualifikationen

Big Data, Data Science, Data Warehousing, ETL, Google Cloud

Data Scientist Consultant
Merck KGaA, Darmstadt
5/2020 – 2/2021 (10 Monate)
Life Sciences
Tätigkeitszeitraum

5/2020 – 2/2021

Tätigkeitsbeschreibung

Expert as well as technical consultancy for the provision of the results of the safety databases of various customers within the Merck Pharmacovigilance system.
Covering an the environment of "SQL", "SQL/PLSQL", "IBM Cognos Analytics" and "Spotfire".
Additional Subject Matter Expert in the Oracle Empirica Pharmacovigilance Signal Management application.

- Content translation of the existing requirements of external customers (physicians as well as operative units)
and members of the IT team

- Development and collection of the medical and scientific questions of the "Safety Data Retrieval Team" within the interviews with the team and translation of the questions into technical requirements for the database.

search strategies
- Programming new and improving existing complex SQL statements
- Development of innovative methods for analysis, evaluation and presentation of pharmacovigilance data
(ARISg, Argus Safety).
- Optimization of query operations by creating and quality checking the database output of the reporting and visualization software.

The aim of the activity is to achieve measurable improvements by automating and optimizing existing processes and tools.

Translating stakeholder requirements into validated systems.

Eingesetzte Qualifikationen

Data Mining, IBM Cognos, PL/SQL, Qualitätsmanagement / QS / QA (IT), Signalverarbeitung

Data Scientist
Kundenname anonymisiert, Berlin
1/2020 – 3/2020 (3 Monate)
IT & Entwicklung
Tätigkeitszeitraum

1/2020 – 3/2020

Tätigkeitsbeschreibung

Implementierung einer Recommendationengine basierend auf vorhandenen Bild und verkaufsdaten.
Der Ansatz basiert auf der Walmart implementation via imagenet based quantitiative preprocessing. 

Eingesetzte Qualifikationen

Data Science, Data Mining, Tensorflow, Python

Data Scientist (Festanstellung)
AMBOSS, Berlin
5/2018 – 1/2020 (1 Jahr, 9 Monate)
IT & Entwicklung
Tätigkeitszeitraum

5/2018 – 1/2020

Tätigkeitsbeschreibung

Design und Aufbau einer Elasticsearch Search Engine.
Volltext Content-Suchmaschine für semi-intelligente Useranfragen. Auswertung mittels Text
crosslinking. Data Design und Technische Implementierung als Microservice. Inklusive ETL.
-> Verbesserte Exposition bestehenden Materials, increases NPS score

Implementierung einer Real-time Userperformance Analyse.
Statistische Auswertung von User sessions mit < 0.2 Sekunden delay
-> Verbesserte User interaktion

Statistische Vorhersagen von Userverhalten / Scoring.
Design eines Scoring systems zur vorhersage von realen Testergebnissen ohne vorhandene
Trainingsdaten.
-> Marketingpush mit hoher Organic-Social Marktwirkung.

Sentimentanalyse, AMBOSS.
Klassifikation von eingehenden Userkommentaren mittels Tensorflow.
-> Entlastung des Servicepersonals.

ETL Design / Airflow.
Design von ETL skripten zur Datenaufbereitung und Qualitätskontrolle.
-> Ein verbesserter Datenfluss spart mittelfristig Zeit und Geld

Eingesetzte Qualifikationen

Data Science, Statistiken, Data Mining, Data Warehousing, Deeplearning4j, Python

Data Scientist Bioinformatiker Forschung (Festanstellung)
CRG Barcelona, Barcelona
11/2013 – 11/2017 (4 Jahre, 1 Monat)
Life Sciences
Tätigkeitszeitraum

11/2013 – 11/2017

Tätigkeitsbeschreibung

Forschung in der Bioinformatik
NGS Data analysis
Datawarehousing
Algorythmic development ( Java and Python )
Deep Learning on Genomics
Statistical Analysis

Eingesetzte Qualifikationen

Data Science, Big Data, Maschinelles Lernen

Bioinformatiker (Festanstellung)
Kundenname anonymisiert, Wien
2/2013 – 10/2013 (9 Monate)
Life Sciences
Tätigkeitszeitraum

2/2013 – 10/2013

Tätigkeitsbeschreibung

Analysis of NGS data - assembly and alignment,
Annotation of bacterial genomes,
Implementation of a data warehouse solution (Intermine) and
Analysis of proteomics and transcriptomics data

Eingesetzte Qualifikationen

Data Mining, Data Warehousing

Ausbildung

Doktorat Bioinformatik
Cum Laude
2017
Barcelona, Spanien
Master Biotechnologie
Ausgezeichneter Erfolg
2013
BOKU, Wien / NUI Galway
Bakkalaureat Biotechnologie
Guter Erfolg
2011
BOKU, Wien
BORG / Gymnasium
Ausbildung
2005
Feldkirch, Austria

Über mich

Nach einer Promotion im Datenumfeld bin Ich seit 7 Jahren in der Wirtschaft als Data Scientist und Data Engineer tätig.

Zu meinen bisherigen Kunden gehören unter anderem die Otto GmbH, Media Markt Saturn und die Merck KgaA.

Mein Spezialgebiet ist die Kostenreduktion im Datenumfeld, sowie die effiziente implementierung von ML und AI fokusierten Pipelines.

Weitere Kenntnisse

Promotion Bioinformatik / Big Data
Python / Java / SQL
Erfahrung in GCP, AWS und Azure.
BigQuery / Data Warehousing / Airflow / Jenkins / Kubernetes / Docker

Lehrerfahrung in Biostatistik

Verschiedene Technologien, sowie Unternehmen bei denen diese zur Anwendung kamen:
SOAP, REST, GraphQL (Amboss, Otto, Media Markt)
Data Lake & Data Vault 2.0 (Deutsche Bank)
Tableau, Looker (Media Markt and Amboss)
Bayesian Inference (PyMC3), Descriptive analytics, Genetic algorithms
Spacy, NLTK, LangChain (Amboss, Media Markt, Otto)
ElasticStack, ElasticSearch + Vespa (Amboss, Otto)
VertexAI, Sagemaker, HuggingFace (Amboss, Otto, MMS)
XGBoost, ARIMA, (Amboss, MMS, Otto)

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Fließend)
  • Spanisch (Gut)
Reisebereitschaft
DACH-Region
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
3368
Alter
38
Berufserfahrung
12 Jahre und 5 Monate (seit 10/2012)
Projektleitung
2 Jahre

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden