About The Position

Als Senior Site Reliability Engineer übernimmst du die Verantwortung für den stabilen, sicheren und skalierbaren Betrieb unserer Kubernetes- und Cloud-Infrastruktur – hands-on, eigenständig und mit echtem Ownership. Deine Aufgaben: Betrieb und Optimierung von Kubernetes-Clustern (EKS) und AWS-Infrastruktur Debugging komplexer Probleme (Performance, Scheduling, OOM, CrashLoops) Aufbau und Betrieb von Self-Hosted Services (z. B. Istio, OpenSearch, RabbitMQ) Umsetzung von GitOps (ArgoCD/Flux) und Observability (Logging, Metrics, Tracing) Definition von SLIs/SLOs sowie Alerting-Strategien Entwicklung von Backup- und Disaster-Recovery-Konzepten (inkl. RTO/RPO) Analyse und Verbesserung von Systemarchitekturen (Skalierung, Sicherheit, SPOFs)

Requirements

  • Mehrjährige Erfahrung mit Kubernetes (inkl. Internals) und AWS (EKS, VPC, RDS, IAM)
  • Sicher im Umgang mit Helm, GitOps und Container-Technologien
  • Erfahrung mit Observability-Stacks (z. B. Prometheus, Grafana, OpenTelemetry)
  • Know-how in Netzwerkarchitektur und Security (IAM, Least Privilege)
  • Erfahrung im Betrieb stateful Workloads (z. B. OpenSearch, PostgreSQL)
  • Sehr gute Englischkenntnisse

Nice To Haves

  • PostgreSQL-Administration (inkl. pgbouncer)
  • Service Mesh (Istio, Linkerd)
  • CI/CD & Developer Experience Themen
  • Incident Management & Post-Mortems

Responsibilities

  • Betrieb und Optimierung von Kubernetes-Clustern (EKS) und AWS-Infrastruktur
  • Debugging komplexer Probleme (Performance, Scheduling, OOM, CrashLoops)
  • Aufbau und Betrieb von Self-Hosted Services (z. B. Istio, OpenSearch, RabbitMQ)
  • Umsetzung von GitOps (ArgoCD/Flux) und Observability (Logging, Metrics, Tracing)
  • Definition von SLIs/SLOs sowie Alerting-Strategien
  • Entwicklung von Backup- und Disaster-Recovery-Konzepten (inkl. RTO/RPO)
  • Analyse und Verbesserung von Systemarchitekturen (Skalierung, Sicherheit, SPOFs)

Benefits

  • Ein Umfeld, dass jederzeit offen für Veränderungen und Optimierungen ist. Ein „das war schon immer so“ gibt es bei uns nicht. Du hast die Chance dein Wissen einzubringen, Prozesse zu gestalten, vorhandenen Themen zu standardisieren oder Abläufe zu optimieren. Sei Impulsgeber und bringe uns mit deiner Expertise noch weiter nach vorne!
  • Wir schaffen Rahmenbedingungen, in denen du dich wohlfühlst: Home-Office Verträge & absolute Flexibilität durch freie Gestaltung der Arbeitszeit
  • Unbefristete Festanstellung und 30 Tage Urlaub
  • FlexWork: Bis zu 3 Monate pro Jahr remote aus dem europäischen Ausland arbeiten
  • Monatliches Budget für individuell wählbare Benefits aus über 50 möglichen Angeboten über emplu, verschiedene Angebote über Corporate Benefits, sowie Fahrrad- und Autoleasing per Gehaltsumwandlung
  • Mental Health Benefit 'Nilo' – 10 kostenlose Sessions mit Psycholog:innen jährlich sowie Zugang zu Meditationen und Kursen
  • Wir unterstützen dich gezielt bei deiner fachlichen und persönlichen Entwicklung bei Natuvion Mentorenprogramm für eine strukturierte und persönliche Einarbeitung
  • Werde Teil des #teamgreen - Bei Natuvion arbeitest du an innovativen Projekten als Teil eines Teams, das füreinander einsteht. Wir setzen auf Zusammenarbeit, Offenheit und Vertrauen
  • Modernes Equipment und zentrale Büros in Walldorf, Berlin, München und Leipzig
  • Uns ist deine langfristige Perspektive wichtig, deshalb bezuschussen wir deine betriebliche Altersvorsorge sowie vermögenswirksame Leistungen
© 2024 Teal Labs, Inc
Privacy PolicyTerms of Service