Cloud Infrastruktur Engineering für den Betrieb & Wartung

Firmenname für PREMIUM-Mitglieder sichtbar

  • Juli 2024
  • nicht angegeben
  • auf Anfrage
  • Remote
  • 27.06.2024
  • 15858

Projekt Insights

seit wann aktiv?
Projektansichten
Bewerbungen

Projektbeschreibung

Start: Juli oder August 2024
Dauer: 3 Monate
Auslastung: Vollzeit
Lokation: Remote & Berlin (mind. 1 Woche am Stück pro Monat vor Ort)

Projektbeschreibung:

Das EDP-Team baut eine interne Plattform für die Softwareproduktentwickler der Elia-Gruppe auf, um die Entwicklung und Bereitstellung von Softwareprodukten zur Bewältigung der großen Herausforderungen im Energiesektor zu beschleunigen. Die EDP-Plattform ist eine serviceorientierte, Cloud-native Plattform, die entwickelt wird, um Anwendungsteams mit Self-Service-Funktionen für die Entwicklung, den Betrieb und die Nutzung ihrer Softwareprodukte auszustatten. Die EDP-Plattform bietet Dienste für Anwendungsinfrastruktur, Daten, Service Lifecycle Management, Anwendungsentwicklung und -bereitstellung sowie Dienste für den Betrieb ihrer Softwareprodukte. Die EDP Platform wird als hybride Cloud eingesetzt, die sowohl private Clouds als auch ausgewählte öffentliche Clouds umfasst. Die Infrastruktur-Produktlinie bietet Rechenzentrumsdienste, die über einen Software-Stack bereitgestellt werden, der für andere Produktlinien innerhalb des Programms Infrastructure Cloud Engine (ICE) genannt wird. Diese Dienste werden innerhalb dieser Produktlinie entwickelt und betrieben.

Der ICE (Software) Operator (m/w/d) ist verantwortlich für den Betrieb und die Wartung des Software Stack in Übereinstimmung mit den technischen und betrieblichen Anforderungen, wie sie dokumentiert sind. Der Betrieb soll skriptbasiert sein, um die Arbeit zu standardisieren und menschliche Fehler zu reduzieren. Der Bediener muss die automatisierten Verfahren verstehen und wissen, wie sie zu verwenden sind.

Aufgaben:

* Betreiben der In-Scope-Umgebung wie definiert
* Integration in Prozesse: Befolgen der entworfenen Prozesse, um eine erfolgreiche Arbeit und Zusammenarbeit sowie eine detaillierte Dokumentation zu erreichen
* Kontinuierliche Verbesserung und Anpassung: Aktives Validieren des Status der Dokumentationen in seinem Verantwortungsbereich und Erstellung und Aktualisierung der Dokumentation (Operational Runbook)
* Informieren des Teamleiters und der Ingenieure aktiv über festgestellte Abweichungen und erforderliche Patches sowie Konfigurationsanpassungen
* Melden von Beobachtungen, wenn die Konfiguration nicht den erforderlichen Sicherheitsstandards entspricht
* Erklären von technischen Anforderungen
* Organisieren der übertragenen Arbeit entsprechend der Priorisierung und Komplexität
* Verfolgen des Status und aktive Berichterstattung
* Lösen von Problemen in Abstimmung mit den Ingenieuren

Muss-Anforderungen:

* Mindestens 3-5 Jahre Berufserfahrung im IT-Bereich, einschließlich Betriebserfahrung und Softwareentwicklung (z.B. mit Python, Terraform, Ansible)
* Beherrschung von IaaS-Technologien
* Solide Grundlagen in den Bereichen Skripting, Automatisierung und Systemkonfiguration
* Kenntnisse der Grundsätze der System- und Infrastrukturgestaltung, einschließlich Skalierbarkeit, Leistung und Sicherheit
* Kompetenzen in der Problemanalyse und -lösung, die die Abhängigkeiten zu Schichten oberhalb und unterhalb der Softwareebene im Rahmen der Hauptarbeit abdecken
* Starke analytische Fähigkeiten und kritisches Denken, um komplexe Probleme zu analysieren und innovative Lösungen zu entwickeln
* Außergewöhnliche Fähigkeiten zur Fehlersuche und Problemlösung mit Schwerpunkt auf Ursachenanalyse und nachhaltige Lösungen
* Kubernetes-Kenntnisse

* Wissen, wie Kubernetes intern funktioniert, wie man es einrichtet, seine Größe anpasst, Probleme behebt und Betrieb verschiedener Kubernetes-Versionen
* Verstehen, wie die Netzwerk- und Speicherfunktionen funktionieren
* Erfahrung mit in der Cloud bereitgestellten (wie AKS, GKE) sowie selbst verwalteten/vor Ort befindlichen K8s-Clustern

* Infrastruktur Management

* Erfahrung in der Verwaltung von Infrastrukturkomponenten und Kenntnisse in Infrastructure as Code (IaC) ist ein Muss
* Ausgeprägtes Verständnis dafür, wie Daten gespeichert, gemeinsam genutzt und gesichert werden (Speicher) und wie sich Informationen innerhalb der Umgebung aus der Netzwerkperspektive bewegen, ist erforderlich
* Gutes Verständnis der internen und externen Ein- und Ausgänge, einschließlich der Verbindung über die Cloud
* Werkzeuge wie Terraform und Terragrunt
* Kenntnisse in Shell, Bash, Unix, Linux und Automatisierung

* CI/CD

* Nachgewiesene Fähigkeit, CI/CD-Pipelines mit Tools wie GitLab, Jenkins, Tekton, Argo Workflows und Argo CD zu verwalten
* GitOps-Kenntnisse ArgoCD / Flux
* Implementierung und Betrieb vollautomatisierter Build- und Deployment-Pipelines

* Observability-Systeme

* Kenntnisse in der Verwaltung von Überwachungs- und Protokollierungssystemen für Echtzeit-Einblicke in die Systemleistung
* Vertrautheit mit Tools wie Prometheus, Grafana und optional anderen ähnlichen Stacks (wie EFK - Elasticsearch, Fluentd, Kibana) und Überwachungstechnologien wie Splunk und Datadog

* Sprachkenntnisse: Mindestens fließendes Englisch

Soll-Anforderungen:

* Wünschenswert sind: RHEL, LDAP, OIDC, OAUTH, PKI Zertifikate, HashiCorp Vault and Packer, CIS Hardening, NetApp, Ceph, Apache Webserver, Nginx, PostgreSQL und ITIL 4 Foundation Zertifizierung

Kontaktdaten

Als registriertes Mitglied von freelance.de können Sie sich direkt auf dieses Projekt bewerben.

Sie suchen Freelancer?

Schreiben Sie Ihr Projekt aus und erhalten Sie noch heute passende Angebote.

Jetzt Projekt erstellen