Data Scientist
- Verfügbarkeit einsehen
- 0 Referenzen
- 80€/Stunde
- 65760 Eschborn
- Nähe des Wohnortes
- de | pl | en
- 20.09.2023
Kurzvorstellung
Qualifikationen
Projekt‐ & Berufserfahrung
1/2022 – 6/2022
Tätigkeitsbeschreibung
ASPEKT-BASIERTE SENTIMENTANALYSE VON KUNDENFEEDBACKS
Entwicklung von Deep Learning Methoden zur Aspekt-basierten Sentimentanalyse von Kundenfeedbacks
- Data Preprocessing von verschiedenen Datenquellen
- Training eines auf Worteinbettungen basierten Modells zur Erstellung von Pseudo-Labels für Aspekte und Sentiments
- Training von Convolutional Neural Networks auf Pseudo-Labels
- Training von self-learning Convolutional Neural Networks zur Verbesserung der Klassifikationsergebnisse für Aspekte und Sentiments
Methoden: Weakly-supervised Aspect-based Sentiment Analysis, Natural Language Processing, Deep Learning, Convolutional Neural Networks
Tools & Libraries: Pandas, NumPy, spaCy, nltk, PyTorch, Ray Tune, PyCharm, Git, SQL, Regex
E-Learning, Faltendes Neuronales Netzwerk (CNN), Maschinelles Lernen, Natural Language Processing, Python, Pytorch, SQL
3/2021 – 9/2021
Tätigkeitsbeschreibung
STUDENT TRACK PROGRAMM IM BEREICH DATA SCIENCE
Durchführung von Zeitreihenanalysen, Vorträge zum Thema Zeitreihenanalysen, Klassifikation von Kundenfeedbacks mit Methoden des maschinellen Lernens
- Vertiefung und Durchführung von Methoden der Zeitreihenanalysen auf verschiedenen Datenquellen
- Vorstellung der Methoden der Zeitreihenanalysen in Vorträgen
- Beratung hinsichtlich der Auswahl geeigneter statistischer Methoden
- Untersuchung der Methoden des IBM Planning Analytics Workspace und Vergleich mit anderen Methoden der Zeitreihenanalyse
- Training von Machine Learning Modellen zur Klassifikation von Kundenfeedbacks im Rahmen einer Hospitation bei DB Fernverkehr
Methoden: Zeitreihenanalysen, Facebook Prophet, ARIMA, SARIMA, Exponential smoothing
Tools & Libraries: NumPy, Pandas, TM1py, statsmodels, fbprophet, IBM Planning Analytics Workspace, git, jira, confluence, TM1
Business Intelligence (BI), Maschinelles Lernen, Python
10/2020 – 3/2021
Tätigkeitsbeschreibung
DEEP LEARNING METHODEN ZUR KLASSIFIKATION VON DEUTSCHEN ZEITUNGSARTIKELN
Forschungsprojekt im Universitätsumfeld
- Entwicklung von Deep Learning Methoden zur Klassifikation von deutschen Zeitungsartikeln
- Data Preprocessing von deutschen Texten
- Entwicklung und Evaluierung verschiedener Deep Learning und Machine Learning-Ansätze
Methoden: Klassifikation, Natural Language Processing, Deep Learning, Convolutional Neural Networks, Recurrent Neural Networks, Naïve Bayes
Tools & Libraries: Python, PyCharm, Tensorflow, Keras, kerastuner, SpaCy, flair, sklearn
Faltendes Neuronales Netzwerk (CNN), Keras, Maschinelles Lernen, Naive Bayes, Natural Language Processing, Rekurrentes Neuronales Netzwerk (RNN), Tensorflow
9/2018 – 6/2019
Tätigkeitsbeschreibung
METHODEN-FORSCHUNG IN BEREICH DER SEKUNDÄREN DATENGEWINNUNG
Praktikantin, Werkstudentin und Bachelorandin beim Statistischen Bundesamt
Untersuchung der Eignung von Mobilfunkdaten zur amtlichen Statistikproduktion: Analyse von statischen Mobilfunkdaten hinsichtlich der Bevölkerungsdarstellung, Analyse von dynamischen Mobilfunkdaten hinsichtlich der Pendlerstatistiken
- Abbildung und Vergleich der Wohn- und Tagesbevölkerung mithilfe von statischen Mobilfunkdaten von unterschiedlichen Mobilfunkanbietern
- Vergleich der Mobilfunkdaten von unterschiedlichen Mobilfunkanbietern mit den Zensusdaten
- Untersuchung von Pendler- und Touristenströmen mithilfe von dynamischen Mobilfunkdaten
- Graphische Darstellung der Mobilfunkdaten auf Kreis- und Gemeindeebene
Methoden: Mobile phone data, Spatial Statistics, Kernel Density Estimation, Visualisierung
Tools & Libraries: ggplot2, sp, Kernelheaping, lattice, rgeos, dplyr, RStudio, RMarkdown
Mobilfunknetze, R (Programmiersprache), Statistiken
Zertifikate
Ausbildung
Georg-August-Universität Göttingen
Weitere Kenntnisse
Projektmanagement: Scrum, Kanban, Jira, Confluence
Data Science: Data Mining, Machine Learning, Neuronale Netze, Zeitreihenanalysen, Clustering, Klassifikation, Regression, NLP, Räumliche Statistik
Persönlichkeit: Organisationstalent, Teamfähigkeit, Führungsqualitäten, Sorgfalt
Technisches Skillset
Programmiersprachen: Python, R, LaTeX
Frameworks: NumPy, Pandas, Scikit-Learn, Scikit-Image, Tensorflow, Keras, PyTorch, Matplotlib, Seaborn, Plotly, Python Unittests, Python Logging, nltk, spaCy, FastText, tidyr, dplyr, plotly, ggplot2, RColorBrewer, stats, RSelenium, sp, stringr, readr
Datenbanken: Oracle, SQLite, MongoDB, MySQL
Entwicklungsumgebungen: PyCharm, Visual Studio Code, Jupyter, RStudio, IntelliJ
Tools: Git, Jira, Sharepoint, MS Office, TexStudio
Systeme: Windows
Branchenkenntnisse
Mobilität, Forschung, Lehre
Zertifizierung
Scrum Master
Product Owner
AWS Certified Cloud Practitioner
AWS Certified Machine Learning Specialty in Vorbereitung
Tableau in Vorbereitung
Persönliche Daten
- Deutsch (Muttersprache)
- Englisch (Fließend)
- Polnisch (Muttersprache)
- Europäische Union
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden