Data Scientist
- Verfügbarkeit einsehen
- 0 Referenzen
- auf Anfrage
- 80803 München
- auf Anfrage
- de | en | vi
- 25.11.2024
Kurzvorstellung
Mein Name ist T. K. und ich bin zertifizierter Data Scientist.
Eigentlich komme ich aus dem Maschinenbau, wo ich in Berührung mit Datenverarbeitung und AI gekommen bin.
Die Arbeit, die ich ausübe, möchte ich wirklich so gut wie möglich machen.
Eigentlich komme ich aus dem Maschinenbau, wo ich in Berührung mit Datenverarbeitung und AI gekommen bin.
Die Arbeit, die ich ausübe, möchte ich wirklich so gut wie möglich machen.
Qualifikationen
Projekt‐ & Berufserfahrung
Software Engineer (Festanstellung)
BMW, München
7/2022
–
9/2023
(1 Jahr, 3 Monate)
Tätigkeitszeitraum
7/2022 – 9/2023
Tätigkeitsbeschreibung
• Erstellung eines automatisierten ALM-Verwaltungssystems unter Anwendung
von Python
• Aufruf, Umwandlung und Steuerung von Testfalldaten über entsprechende
API mittels HTTP-Requests
• Übertragung von ATX-Testfalldaten in unterschiedliche ALM-Systeme
• Unittests
Softwareentwickler
Zertifikate
Data Science
alfatraining Bildungszentrum GmbH
alfatraining Bildungszentrum GmbH
2024
Ausbildung
Mechanical and Process Engineering
Master of Science
TU Darmstadt
2022
Darmstadt
Darmstadt
Über mich
Meine Freunde bezeichnen mich als einen engagierten, kreativen und sehr aufgeschlossenen Menschen. Ich verbringe neben dem Berufsleben viel Zeit in der Turnhalle, wo ich neben Volleyball und Tischtennis auch sehr gerne turne. An der Tastatur klebe ich nicht nur zum Programmieren, sondern bereitet mir das Schneiden und Bearbeiten von Videos eine große Freude…im besten Fall auch ein zukünftiges Werbevideo für Sie.
Weitere Kenntnisse
In diesem Jahr durfte ich mich 5 Monate lang im Data-Science-Bereich in Vollzeit fortbilden. Basis dafür war der Lehrgangsinhalt von Alfa-Training, bei dem ich mein Wissen in SQL, Data Engineering, Data Analysis, Machine Learning und Deep Learning vertiefen konnte. So habe ich in verschiedenen Abschlussprojekten praktische Fälle für die Anwendung von Schemata (Data Warehouse, Snowflake, Galaxy-Schema), Datenvisualisierung, Datenmanagement selbst erleben dürfen. Besonders fasziniert hat mich jedoch die (Bild-, Text-, Video-)Klassifizierung mittels Neuronaler Netze und LLM sowie das Story-Telling mit geeigneten Visualisierungsmitteln wie beispielsweise Streamlit und Dash.
Die einmonatige Fortbildung zum Thema Deep Learning war eine großartige Möglichkeit, mein Wissen über neuronale Netze in Kombination mit Python zu vertiefen. Dabei habe ich mich intensiv mit verschiedenen Aktivierungsfunktionen auseinandergesetzt, wobei ich Sigmoid und ReLU bevorzugt habe.
Ich habe das Multilayer-Perzeptron in sklearn sowie TensorFlow für Klassifikationen genutzt. In der vierten und letzten Projektwoche habe ich eine CNN-RNN-Architektur gebildet, um eine Video-Klassifizierung durchzuführen. Dabei habe ich das InceptionV3-Modell (CNN) als Feature-Extractor eingesetzt und ein GRU-basiertes RNN für die eigentliche Klassifizierung unterschiedlicher Sportarten verwendet. Ich habe das Modell bewusst nicht zu komplex gestaltet und Dropout sowie Regularisierung eingebaut, um Overfitting zu reduzieren.
Während meiner Fortbildung zum Data Scientist habe ich wertvolle Erfahrung im Bereich Time-Series-Modelling gesammelt. Dabei habe ich Long Short Term Memory als speziellen Typ der rekurrenten neuronalen Netze verwendet, um Langzeitfolgen einzubeziehen. Mit meinem Modell konnte ich anhand von Daten eines Blumenverkaufs präzise vorhersagen, in welchem Zeitraum wie viele Blumen gekauft bzw. geschnitten werden müssen.
In meiner Projektwoche im einmonatigen Data-Analyst-Kurs hatte ich zuletzt die Möglichkeit, mich ausführlich mit LLM auseinanderzusetzen. Ich habe Kommentare bei Airbnb in eine qualitative Bewertungsform überführt – mit Spacy, neuronalen Netzen, sowie klassischen ML-Modellen wie Random Forest und Gradient Boosted Decision Trees.
Über die letzten Jahre habe ich vor allem in größeren Team-Projekten gelernt, wie wichtig Best Practices im Coding sind. So ist mir auch bei BMW im Team wichtig, im Rahmen der Projekt-Planung verständliche Variablennamen zu definieren und die Anzahl an Kommentaren übersichtlich zu halten. Der Code sollte ausnahmslos einfach zu testen, modular aufgebaut und ohne übermäßige Verschachtelungen aufgebaut sein. So konnte ich beispielsweise innerhalb meiner Masterarbeit unterschiedliche Parameterstudien automatisiert aufstellen, in dem ich lediglich gewisse Einstellungsparameter ändere.
Die einmonatige Fortbildung zum Thema Deep Learning war eine großartige Möglichkeit, mein Wissen über neuronale Netze in Kombination mit Python zu vertiefen. Dabei habe ich mich intensiv mit verschiedenen Aktivierungsfunktionen auseinandergesetzt, wobei ich Sigmoid und ReLU bevorzugt habe.
Ich habe das Multilayer-Perzeptron in sklearn sowie TensorFlow für Klassifikationen genutzt. In der vierten und letzten Projektwoche habe ich eine CNN-RNN-Architektur gebildet, um eine Video-Klassifizierung durchzuführen. Dabei habe ich das InceptionV3-Modell (CNN) als Feature-Extractor eingesetzt und ein GRU-basiertes RNN für die eigentliche Klassifizierung unterschiedlicher Sportarten verwendet. Ich habe das Modell bewusst nicht zu komplex gestaltet und Dropout sowie Regularisierung eingebaut, um Overfitting zu reduzieren.
Während meiner Fortbildung zum Data Scientist habe ich wertvolle Erfahrung im Bereich Time-Series-Modelling gesammelt. Dabei habe ich Long Short Term Memory als speziellen Typ der rekurrenten neuronalen Netze verwendet, um Langzeitfolgen einzubeziehen. Mit meinem Modell konnte ich anhand von Daten eines Blumenverkaufs präzise vorhersagen, in welchem Zeitraum wie viele Blumen gekauft bzw. geschnitten werden müssen.
In meiner Projektwoche im einmonatigen Data-Analyst-Kurs hatte ich zuletzt die Möglichkeit, mich ausführlich mit LLM auseinanderzusetzen. Ich habe Kommentare bei Airbnb in eine qualitative Bewertungsform überführt – mit Spacy, neuronalen Netzen, sowie klassischen ML-Modellen wie Random Forest und Gradient Boosted Decision Trees.
Über die letzten Jahre habe ich vor allem in größeren Team-Projekten gelernt, wie wichtig Best Practices im Coding sind. So ist mir auch bei BMW im Team wichtig, im Rahmen der Projekt-Planung verständliche Variablennamen zu definieren und die Anzahl an Kommentaren übersichtlich zu halten. Der Code sollte ausnahmslos einfach zu testen, modular aufgebaut und ohne übermäßige Verschachtelungen aufgebaut sein. So konnte ich beispielsweise innerhalb meiner Masterarbeit unterschiedliche Parameterstudien automatisiert aufstellen, in dem ich lediglich gewisse Einstellungsparameter ändere.
Persönliche Daten
Sprache
- Deutsch (Muttersprache)
- Englisch (Fließend)
- Vietnamesisch (Fließend)
- Chinesisch (Grundkenntnisse)
Reisebereitschaft
auf Anfrage
Arbeitserlaubnis
- Europäische Union
Profilaufrufe
22
Alter
28
Berufserfahrung
2 Jahre und 6 Monate
(seit 07/2022)
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden