
Zabbix’in gelişmiş yetenekleri ile kaynaklarınızı kontrol altında tutun, performans kaybına geçit vermeyin.
Sanallaştırma Altyapıları Neden İzlenmeli?
Günümüz BT altyapılarında VMware ESXi, Proxmox, Hyper-V, KVM gibi sanallaştırma platformları yaygın olarak kullanılıyor, ancak bu sistemlerin arkasındaki görünmeyen detaylar, eğer bir sorun oluşmadan önce fark edilmez ise kritik kesintilere ve performans problemlerine yol açabiliyor, bu durum da hem BT ekipleri için sorunların çözülme süresini uzatıyor, hem proaktif önlemlerin uygulanabilmesini engelliyor, hem de kurumun imajını zedeliyor.
Örneğin, sanallaştırma ortamınızda;
- Bir fiziksel sunucunun CPU’su %95’e çıktığında, üzerinde çalışan tüm VM’ler bundan etkilenir.
- Storage I/O darboğazı oluştuğunda veritabanı sunucularınız cevap veremez hale gelir.
- Bir hypervisor down olduğunda 10+ sanal makine birden devre dışı kalabilir.
İşte bunlara benzer sebeplerden dolayı bu altyapılar, sıradan sistemler gibi değil, katmanlı ve ilişkilendirilmiş şekilde izlenmelidir.
Zabbix bize ne sağlıyor?
Zabbix, açık kaynaklı ve esnek yapısı sayesinde sanallaştırma katmanlarını uçtan uca izlemenizi sağlar:
- Hipervizör Seviyesi İzleme: CPU, RAM, Disk I/O, Ağ trafiği
- VM Seviyesi İzleme: Her bir sanal makinenin performans metrikleri
- Cluster Durumu: Failover/HA durumu, host down senaryoları
- Storage Performansı: LUN I/O, latency, kapasite uyarıları
- Ağ İzleme: Sanal switch’ler, port kullanımı, VLAN’lar
Tüm bunlar, tek bir merkezi arayüz üzerinden, gelişmiş keşif yetenekleri ile yapılabilir.
ISO 27001 ve CBDDO Uyumlu İzleme
Sanallaştırma altyapısının izlenmesi, aşağıdaki regülasyonlar kapsamında kritik öneme sahiptir;

- ISO27001 Md. A.8.1.1 Varlıkların envanteri
- ISO27001 Md. A.12.3.1 Bilgi yedekleme
- ISO27001 Md. A.13.1.1 Ağ kontrolleri
- ISO27001 Md. A.17.2.1 Bilgi işleme olanaklarının erişilebilirliği
- CBDDO Md. 3.1.1 Donanım Varlıklarının Envanter Yönetimi
- CBDDO Md. 3.1.6 Ağ Güvenliği
- CBDDO Md. 3.1.9 Sanallaştırma Güvenliği
- CBDDO Md. 3.1.13 Felaket Kurtarma ve İş Sürekliliği Yönetimi
Yaşanmış bir olay: Geç fark edilen CPU darboğazı
Daha önce güvenlik hizmeti vermiş olduğumuz ancak NOC hizmeti almayan bir müşterimizde şöyle bir durum yaşanmıştı;
BT ekibi, yoğunluk sebebiyle uzun süredir sanallaştırma sistemlerinin performans durumunu düzenli olarak kontrol edemiyormuş ancak kurum içindeki çeşitli birimlerden özellikler belirli saat aralıklarında, belirli kurum içi uygulamalarda yavaşlık yaşanması ile ilgili şikayetler geliyormuş ancak bir gün, gün içerisinde ve muhasebe uygulamaları başta olmak üzere önemli kurum içi uygulamalara erişilemediği şeklinde şikayetler gelince sanallaştırma sunucusu üzerinde yapılan kontrollerde sunucunun CPU kaynağının yetersiz geldiği ve bu sebeple tabiri caizse “kilitlendiği” BT ekibi tarafından tespit edilmişti, kuruma ait websiteler, mail altyapısı ve SQL sunucuları da bu sorundan nasibini almıştı, neyseki yedek bir sunucuları olması sebebiyle, sunucu fiziksel müdahale ile yeniden başlatıldıktan sonra üzerindeki sanal makinelerin bir kısmı hızla yedek sunucu üzerine taşınarak sorun giderilmişti, sorun çözümü sonrası yapılan kontrollerde sunucuya en son eklenen 2 sanal makine oluşturulurken kaynak kullanımı göz önünde bulundurulmadan oluşturulduğu, yüksek CPU ve Memory kullanımına sebep olduğu ve sanallaştırma sunucusunun uzun süredir mesai saatlerindeki CPU kullanımının %98 bandında seyrettiği tespit edildi.
Halbuki bu sistemin metrikleri Zabbix ile toplansa ve NOC hizmeti ile takip edilseydi, yüksek kaynak kullanımı aylar öncesinden tespit edilerek yedek sunucu ile bir cluster oluşturma çalışması yapılabilir ve yük dengelenebilirdi, ancak izlenmediği için kurumun en yoğun saat aralığında tüm sistemleri etkileyen bir kesinti yaşandı, bazı uygulamalarda veri kaybına sebep olan bu durum aslında bize NOC hizmetinin ne kadar önemli olduğunu gösteriyor.

Neden Zabbix ile izlenmeli?
Şimdi haklı olarak şöyle bir soru soracaksınız, iyi güzel hoş, NOC hizmeti önemli, metrikleri takip etmek gerekiyor ama niye Zabbix?
Çünkü;
- Maliyet avantajı: Zabbix’in kullanımı için herhangi bir lisans ücreti yok ve bu AGPLv3 lisansı ile korunuyor, tamamen açık kaynaklı ve özelleştirilebilir ancak açık kaynak yazılım kullananların çok iyi bileceği birşey var ve oldukça önemli birşey daha var, Zabbix’in oldukça büyük bir topluluğa sahip.
- Otomatik keşif: Gerekli bilgileri verdiğiniz takdirde Zabbix bu altyapıları otomatik keşfedebiliyor.
- Şablon desteği: vCenter, Proxmox ve Hyper-V için oluşturulan resmi şablonlar ile dakikalar içinde birçok temel konfigürasyonu yapabilirsiniz, eğer bu sizin için yeterli değilse topluluk şablonlarına ulaşmak oldukça kolay.
- Görselleştirme: Zabbix’in özellikle 7.0 sürümünden sonraki görselleştirme yetenekleri çok iyi bir noktaya geldi, açıkçası birçok kurum için artık Grafana gibi görselleştirme yazılımlarına gerek yok ancak yine de gerekli ise Zabbix’in resmi Grafana entegrasyonu ile cluster & VM bazlı performans panoları oluşturabilirsiniz.
- Alarm yönetimi: Kaynak yetersizliği, host düşmesi, snapshot uyarıları gibi onlarca ön tanımlı alarm halihazırda mevcut, dilerseniz buna yenilerini de çok kolay bir şekilde ekleyebilirsiniz.
Sonuç

Sanallaştırma altyapınızın verimli çalışması, tüm sistemlerin sağlığı için kritik, bu sebeple Zabbix ile proaktif izleme yaparak kaynaklarınızı daha verimli kullanabilir, sorunları oluşmadan öngörebilir, BT operasyonlarını daha sürdürülebilir hale getirebilirsiniz, ayrıca BT ekipleri tarafından düzenli olarak yapılan manuel kontrollerin birçoğunu Zabbix’e yaptırabilir ve BT ekibinizin iş yükünü azaltabilirsiniz.