Senior Data Scientist / Big Data Developer
- Verfügbarkeit einsehen
- 0 Referenzen
- auf Anfrage
- 10713 Berlin
- Europa
- ro | en | ru
- 26.08.2024
Kurzvorstellung
I’m an experienced data scientist with strong skills in programming, focused on big data
mining (Spark / Hadoop ecosystem). I worked successfully in Germany with Airbus and KPMG.
mining (Spark / Hadoop ecosystem). I worked successfully in Germany with Airbus and KPMG.
Qualifikationen
Projekt‐ & Berufserfahrung
Senior Data Scientist (Festanstellung)
KPMG, Berlin
8/2017
–
12/2019
(2 Jahre, 5 Monate)
Tätigkeitszeitraum
8/2017 – 12/2019
TätigkeitsbeschreibungAutomation of audit process. Text analytics of different text corpora. Extraction of most relevant information for new audit study from audit manuals and resolved audit cases.
Eingesetzte QualifikationenApache Hadoop, Natural Language Processing, Text Mining
Senior Data Scientist (Festanstellung)
Altran Deutschland S.A.S. & Co KG, Hamburg
9/2016
–
6/2017
(10 Monate)
Tätigkeitszeitraum
9/2016 – 6/2017
Tätigkeitsbeschreibung
Analysis of flights data in aerospace industry (Airbus Civil). Substitution of hard calculations, performed by flight
engineers with probabilistic high accuracy model. The goal - to speed up the development of new aircraft.
Apache Hadoop, Big Data, Entscheidungsbaum Lernen, Lineare Regression, Unüberwachtes Lernen
Ausbildung
Data Mining Specialisation
Ausbildung
2019
University of Illinois at Urbana-Champaign
University of Illinois at Urbana-Champaign
Über mich
Ich bin ein erfahrener Datenwissenschaftler mit ausgeprägten Programmierkenntnissen und Schwerpunkt auf Big Data Bergbau (Spark / Hadoop-Ökosystem). Auch ich habe Erfahrung als Systemarchitekt und IT-Manager. Ich habe effektive Spark / Hadoop-Anwendungen für verschiedene geliefert und präsentiert Unternehmen wie biomedizinische und biotechnologische Unternehmen aus den USA, Werbung und E-Commerce (Exactag, Deutschland), Luft- und Raumfahrtindustrie (Airbus Civil, Frankreich), Wirtschaftsprüfung / Finanzen (KPMG) usw. Außerdem habe ich große Erfahrung in der Analyse von Bank- und Einzelhandelsdaten wie bei Kunden. Segmentierung, Aufdeckung von Betrug, Klassifizierung von Krediten.
Ich habe eine klare Vision, wie eine leistungsstarke Big Data Analyse plattform implementiert werden soll. Mein Hauptziel ist es, das reale Geschäft durch die Implementierung nützlicher Tools und zu verbessern Lösungen. Meine ideale Rolle ist Datenwissenschaftler Box-to-Box. Ich kann Geschäftsanforderungen in übersetzen technische Beschreibung, verteilen Sie die Aufgaben im Team und implementieren Sie die kompliziertesten Teil des Projekts. Ich kann die Lösung als eine Mischung aus grundlegender, moderner Mathematik vorschlagen Algorithmen und meine heuristischen Methoden.
Ich habe eine klare Vision, wie eine leistungsstarke Big Data Analyse plattform implementiert werden soll. Mein Hauptziel ist es, das reale Geschäft durch die Implementierung nützlicher Tools und zu verbessern Lösungen. Meine ideale Rolle ist Datenwissenschaftler Box-to-Box. Ich kann Geschäftsanforderungen in übersetzen technische Beschreibung, verteilen Sie die Aufgaben im Team und implementieren Sie die kompliziertesten Teil des Projekts. Ich kann die Lösung als eine Mischung aus grundlegender, moderner Mathematik vorschlagen Algorithmen und meine heuristischen Methoden.
Weitere Kenntnisse
Expert level: clustering, classification, regression, outliers detection, dimensions reduction, frauds detection, parallel computing on Apache Spark
Data mining tools: MLlib, PySpark, R, Pandas, SciKit-Learn, PyTorch, SparkNLP, Gensim, SPSS
SQL Database: Oracle, SQL Server, PostgreSQL, MySQL
Big data sources: HDFS, Hive, Impala, Apache Parquet, Avro, ORC.
Cloud computing: Microsoft Azure, Databricks
Sreaming: Apache Kafka, Spark Streaming
Algorithmic languages: Scala, SQL, Java, Python, Delphi.
Development environment: Intellij Idea, PyCharm, R-Studio, Embarcadero RAD.
Target Platforms: Linux, Windows 32/64, Mac OS
Office software: MS Office, Google Docs, Acrobat Reader
Data mining tools: MLlib, PySpark, R, Pandas, SciKit-Learn, PyTorch, SparkNLP, Gensim, SPSS
SQL Database: Oracle, SQL Server, PostgreSQL, MySQL
Big data sources: HDFS, Hive, Impala, Apache Parquet, Avro, ORC.
Cloud computing: Microsoft Azure, Databricks
Sreaming: Apache Kafka, Spark Streaming
Algorithmic languages: Scala, SQL, Java, Python, Delphi.
Development environment: Intellij Idea, PyCharm, R-Studio, Embarcadero RAD.
Target Platforms: Linux, Windows 32/64, Mac OS
Office software: MS Office, Google Docs, Acrobat Reader
Persönliche Daten
Sprache
- Rumänisch (Muttersprache)
- Englisch (Fließend)
- Russisch (Fließend)
- Deutsch (Gut)
- Französisch (Gut)
Reisebereitschaft
Europa
Arbeitserlaubnis
- Europäische Union
- Schweiz
Profilaufrufe
1499
Alter
64
Berufserfahrung
36 Jahre und 8 Monate
(seit 05/1988)
Projektleitung
3 Jahre
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden