Senior Site Reliability Engineer (SRE) (m/w/d)

Natuvion

82d•Remote

About The Position

Als Senior Site Reliability Engineer übernimmst du die Verantwortung für den stabilen, sicheren und skalierbaren Betrieb unserer Kubernetes- und Cloud-Infrastruktur – hands-on, eigenständig und mit echtem Ownership. Deine Aufgaben: Betrieb und Optimierung von Kubernetes-Clustern (EKS) und AWS-Infrastruktur Debugging komplexer Probleme (Performance, Scheduling, OOM, CrashLoops) Aufbau und Betrieb von Self-Hosted Services (z. B. Istio, OpenSearch, RabbitMQ) Umsetzung von GitOps (ArgoCD/Flux) und Observability (Logging, Metrics, Tracing) Definition von SLIs/SLOs sowie Alerting-Strategien Entwicklung von Backup- und Disaster-Recovery-Konzepten (inkl. RTO/RPO) Analyse und Verbesserung von Systemarchitekturen (Skalierung, Sicherheit, SPOFs)

Requirements

Mehrjährige Erfahrung mit Kubernetes (inkl. Internals) und AWS (EKS, VPC, RDS, IAM)
Sicher im Umgang mit Helm, GitOps und Container-Technologien
Erfahrung mit Observability-Stacks (z. B. Prometheus, Grafana, OpenTelemetry)
Know-how in Netzwerkarchitektur und Security (IAM, Least Privilege)
Erfahrung im Betrieb stateful Workloads (z. B. OpenSearch, PostgreSQL)
Sehr gute Englischkenntnisse

Nice To Haves

PostgreSQL-Administration (inkl. pgbouncer)
Service Mesh (Istio, Linkerd)
CI/CD & Developer Experience Themen
Incident Management & Post-Mortems

Responsibilities

Betrieb und Optimierung von Kubernetes-Clustern (EKS) und AWS-Infrastruktur
Debugging komplexer Probleme (Performance, Scheduling, OOM, CrashLoops)
Aufbau und Betrieb von Self-Hosted Services (z. B. Istio, OpenSearch, RabbitMQ)
Umsetzung von GitOps (ArgoCD/Flux) und Observability (Logging, Metrics, Tracing)
Definition von SLIs/SLOs sowie Alerting-Strategien
Entwicklung von Backup- und Disaster-Recovery-Konzepten (inkl. RTO/RPO)
Analyse und Verbesserung von Systemarchitekturen (Skalierung, Sicherheit, SPOFs)

Benefits

Ein Umfeld, dass jederzeit offen für Veränderungen und Optimierungen ist. Ein „das war schon immer so“ gibt es bei uns nicht. Du hast die Chance dein Wissen einzubringen, Prozesse zu gestalten, vorhandenen Themen zu standardisieren oder Abläufe zu optimieren. Sei Impulsgeber und bringe uns mit deiner Expertise noch weiter nach vorne!
Wir schaffen Rahmenbedingungen, in denen du dich wohlfühlst: Home-Office Verträge & absolute Flexibilität durch freie Gestaltung der Arbeitszeit
Unbefristete Festanstellung und 30 Tage Urlaub
FlexWork: Bis zu 3 Monate pro Jahr remote aus dem europäischen Ausland arbeiten
Monatliches Budget für individuell wählbare Benefits aus über 50 möglichen Angeboten über emplu, verschiedene Angebote über Corporate Benefits, sowie Fahrrad- und Autoleasing per Gehaltsumwandlung
Mental Health Benefit 'Nilo' – 10 kostenlose Sessions mit Psycholog:innen jährlich sowie Zugang zu Meditationen und Kursen
Wir unterstützen dich gezielt bei deiner fachlichen und persönlichen Entwicklung bei Natuvion Mentorenprogramm für eine strukturierte und persönliche Einarbeitung
Werde Teil des #teamgreen - Bei Natuvion arbeitest du an innovativen Projekten als Teil eines Teams, das füreinander einsteht. Wir setzen auf Zusammenarbeit, Offenheit und Vertrauen
Modernes Equipment und zentrale Büros in Walldorf, Berlin, München und Leipzig
Uns ist deine langfristige Perspektive wichtig, deshalb bezuschussen wir deine betriebliche Altersvorsorge sowie vermögenswirksame Leistungen