Kubernetes Cluster

Loading model info...

KI-gesteuerte Cluster-Verwaltung

Production-Ready RKE2 Cluster • Commits gesamt • Aktualisierung läuft

Commit-Statistiken werden geladen...

0 Commits (90d)
0 Top Contributor %
0 Pods Running
- Cluster Uptime
Explore Live Dashboard

Live Dashboard

Real-time metrics from production cluster

LIVE • Auto-refresh 30s

Cluster Overview

-
Cluster Nodes
-
Running Pods
-
Namespaces
-
Cluster Uptime

Resource Utilization

CPU Usage
-%
Memory Usage
-%

Service Health Status

Loading services...

GitOps Workflow

Watch the KI-powered deployment process in action

zsh

Was ist Kubernetes?

Container-Orchestrierung für moderne Cloud-Native Anwendungen

Das Kubernetes-Ökosystem

Kubernetes (K8s) ist die führende Open-Source-Plattform für Container-Orchestrierung - entwickelt von Google, jetzt von der CNCF verwaltet.

  • Automatisches Deployment & Scaling
    Horizontale Pod-Skalierung basierend auf CPU/Memory-Auslastung
  • Self-Healing
    Automatischer Neustart fehlerhafter Container, Node-Ausfälle werden kompensiert
  • Service Discovery & Load Balancing
    Integriertes DNS, automatisches Load Balancing über Pods
  • Declarative Configuration (GitOps-ready)
    Infrastruktur als Code - versioniert, reviewbar, rollback-fähig
  • Storage Orchestration
    Automatisches Mounting von lokalen, Cloud- oder Netzwerkspeichern

Warum Kubernetes?

Cloud-Portabilität
AWS, Azure, GCP, On-Prem - eine Config für alle

Skalierbarkeit
Von 1 Node bis 1000+ Nodes möglich

Riesiges Ökosystem
CNCF mit 100+ integrierten Tools

Warum RKE2?

Security-focused Kubernetes Distribution für Production

RKE2 - "RKE Government"

Von Rancher (SUSE) entwickelte, security-hardened Kubernetes-Distribution

Security-First Ansatz

FIPS 140-2 Compliant
CIS Kubernetes Benchmark
NIST 800-190 konform

Vorteile vs Standard Kubernetes

  • Einfachere Installation - Single Binary, keine komplexen Dependencies
  • Integrierte Security Hardening - Production-ready Security out-of-the-box
  • Besserer Windows-Support - Erste Wahl für Mixed-OS-Cluster
  • Automatische etcd Snapshots - Backup & Disaster Recovery eingebaut
  • Embedded Container Runtime - Containerd vorinstalliert und konfiguriert
  • Production-ready out-of-the-box - Keine komplexe Nachkonfiguration nötig

Unser Production-Setup

6
Cluster Nodes
rke2-prod-1 bis -6
34
CPU Cores
Distributed Computing
85GB
RAM Total
Clustered Memory
16TB
Storage
TrueNAS NFS (NVMe+HDD)
Architecture: Mixed Worker/Control-Plane Design für High Availability

Live Monitoring mit Grafana

43 Dashboard-Panels mit Real-time Metriken und Good/Bad Indicators

Zugriff auf Live Dashboard

Alle Metriken in Echtzeit - 30-Sekunden Aktualisierung

Zum Dashboard

https://grafana.rke2.local.cstrube.de

Dashboard Features

43
Monitoring Panels
Alle mit Beschreibungen
30s
Refresh-Intervall
Echtzeit-Metriken
100%
Dokumentiert
Good/Bad Indicators

Panel-Kategorien

Status Panels
Prometheus Ready, Up-Status, Build Info
HTTP Requests
Request Rates, Fehlerraten, Status Codes
Query Performance
Query Latency, Query Duration, Active Queries
Runtime Metriken
Goroutines, Memory, GC Pause, Threads
Storage Metriken
WAL Operations, TSDB Status, Compaction
Database Monitoring
Redis, PostgreSQL, MongoDB Status

Good vs Bad Indicators

Jedes Panel enthält klare Beschreibungen mit "Good" und "Bad" Beispielen

Gut

  • Prometheus Ready = 1
    System funktioniert normal
  • Error Rate = 0
    Keine Fehler aufgetreten
  • Query Latency < 1s
    Optimale Performance
  • GC Pause < 50ms
    Gesunde Memory-Nutzung
  • Redis Up = 1
    Datenbank erreichbar
  • WAL Corruptions = 0
    Storage gesund

Schlecht

  • Prometheus Ready = 0
    System-Neustart erforderlich!
  • Error Rate > 0
    Fehlerursache untersuchen!
  • Query Latency > 5s
    Performance-Problem!
  • GC Pause > 200ms
    Memory Pressure!
  • Redis Up = 0
    Datenbank nicht erreichbar!
  • WAL Corruptions > 0
    Storage-Fehler beheben!

Pro-Tip: Panel-Beschreibungen nutzen!

Bewege die Maus über das "i"-Symbol in jedem Panel für detaillierte Erklärungen mit konkreten Good/Bad-Schwellwerten und Troubleshooting-Hinweisen.

Dashboard öffnen

Alle 43 Panels live erleben • Authentik SSO-Login erforderlich

Cluster Metrics

Real-time monitoring and performance indicators

1,247
IPs Blocked (CrowdSec)
14
Helm Releases
35
FluxCD Kustomizations
22
ServiceMonitors

Infrastructure Services

Core networking, load balancing, and storage infrastructure

Traefik

Ingress Controller • Go
Modern HTTP reverse proxy and load balancer with automatic service discovery and CrowdSec security integration.
Replicas 2/2
Namespace networking
Integration CrowdSec v1.4.5

MetalLB

Load Balancer • Layer 2/BGP
Bare-metal load balancer providing external IP addresses for Kubernetes services in on-premises environments.
Mode Layer 2
IP Pool 10.0.40.0/24
Status Active

TrueNAS NFS

Network Storage • ZFS
Enterprise-grade network storage with two performance tiers: NVMe for speed-critical apps and HDD for bulk storage.
NVMe-Fast High Performance
HDD-Standard 16TB Mirror
Filesystem ZFS

Security Stack

Multi-layered security with SSO, threat intelligence, and runtime protection

Authentik

Identity Provider • Python/Django
Modern identity provider with OAuth2/SAML support, high availability deployment with dedicated worker pods for background tasks.
Server Replicas 2
Workers 1
Version v2025.4.0

CrowdSec

Threat Intelligence • Go
Collaborative security engine with 50+ detection scenarios, HTTP CVE protection, and Traefik integration for real-time threat blocking.
Scenarios 50+ Active
Agents 3
Version v1.7.0

Falco

Runtime Security • eBPF
Cloud-native runtime security using eBPF for deep kernel visibility, detecting anomalous behavior and policy violations.
Pods 6 DaemonSet
Driver Modern eBPF
Chart v6.2.5

Wazuh

SIEM • Security Monitoring
Open-source security platform providing unified XDR and SIEM protection with threat detection, compliance monitoring, and incident response.
Type SIEM Platform
Integration Cluster-wide
Status Active

Cluster Architecture

Multi-layer security and observability stack

GitOps Layer

FluxCD v2 GitHub Repository 1min Sync 35 Kustomizations

Infrastructure Layer

Traefik Ingress MetalLB Cert-Manager TrueNAS Storage Sealed Secrets

Security Layer

Authentik SSO Falco (eBPF) CrowdSec Wazuh SIEM Runtime Security Threat Intel

Application Layer

SearXNG GitLab Passbolt Open WebUI Ollama Rancher Monitoring

Performance Metrics

Real-time cluster health and performance data

Hallo! Frag mich alles über den Cluster!

Cluster AI Assistant

Frage den Cluster alles!

Willkommen!

Ich bin dein KI-Assistent für den Kubernetes-Cluster. Frag mich alles!

Datenschutzhinweis

Der KI-Assistent verwendet eine lokale Ollama-Instanz (Llama 3.2 3B) im Cluster. Deine Chat-Nachrichten werden ausschließlich lokal verarbeitet und nicht an externe Dienste gesendet.

Was wird gespeichert?
• Chat-Nachrichten (lokal in PostgreSQL)
• Session-ID (lokal in deinem Browser)
• Feedback (Thumbs Up/Down)

Was wird NICHT gespeichert?
• Keine IP-Adressen
• Keine persönlichen Daten
• Keine Cookies für Tracking

v Loading...
Impressum