
Blog
RAID Arıza Rehberi:
Sunucu ve Veri Depolama Sistemlerinde Çökme Nedenleri ve Kurtarma Stratejileri
İşletmeler için veri, en değerli varlıktır.
Bu verilerin güvenliğini ve erişilebilirliğini sağlamak için
RAID Arıza Rehberi: Sunucu ve Veri Depolama Sistemlerinde Çökme Nedenleri ve Kurtarma Stratejileri
İşletmeler için veri, en değerli varlıktır. Bu verilerin güvenliğini ve erişilebilirliğini sağlamak için kullanılan RAID (Redundant Array of Independent Disks) yapıları, her ne kadar hata toleransı sağlasa da, fiziksel veya yazılımsal nedenlerle çökebilir. Bir RAID dizisinin arızalanması, tek bir diskin bozulmasından çok daha karmaşık bir durumdur çünkü veri birden fazla diske parçalanmış (stripping) veya aynalanmış (mirroring) durumdadır.
İşte RAID sistemlerinde karşılaşılan arıza türleri, belirtileri ve yapılması gerekenler üzerine kapsamlı bir rehber:
1. Sık Karşılaşılan RAID Arıza Türleri
Fiziksel Disk Arızaları
RAID yapılarında en yaygın sorun, disklerin fiziksel ömrünü tamamlaması veya üretim hatası nedeniyle bozulmasıdır.
RAID 5: Bir disk bozulduğunda sistem “Degraded” modda çalışmaya devam eder. Ancak ikinci bir disk bozulursa tüm yapı çöker.
RAID 0: Tek bir disk bile arızalansa verilerin tamamı erişilmez hale gelir çünkü veri yedeksiz şekilde dağıtılmıştır.
RAID Kontrolcü (Controller) Arızaları
Diskler sağlam olsa dahi, veriyi yöneten donanım (RAID kartı) arızalanabilir. Voltaj dalgalanmaları veya aşırı ısınma buna neden olabilir. Kontrolcü bozulduğunda, diskler yeni bir kontrolcüye takılsa bile yapılandırma (config) uyuşmazlığı nedeniyle veriler görünmeyebilir.
Yazılımsal ve Mantıksal Hatalar
Hatalı Yeniden Yapılandırma (Rebuild Errors): Arızalı diski değiştirirken yanlışlıkla sağlam olan diski çıkarıp “Rebuild” işlemini başlatmak, parite bilgisini bozar ve veriyi kalıcı olarak silebilir.
RAID Konfigürasyon Kaybı: NVRAM üzerindeki yapılandırma bilgilerinin silinmesi sonucu sistem diskleri “Foreign” (yabancı) veya “Unconfigured” olarak görür.
2. RAID Arızasının Belirtileri
Sisteminizin tehlikede olduğunu gösteren kritik işaretler şunlardır:
Sunucudan gelen sürekli “Beep” sesleri.
Okuma/Yazma hızlarında aşırı yavaşlama.
Yönetim panelinde “Degraded”, “Offline” veya “Logical Drive Failed” uyarıları.
İşletim sisteminin açılmaması (Blue Screen veya “No Boot Device found” hatası).
3. Kritik Müdahale: Arıza Anında Ne Yapılmalı?
Bir RAID arızası fark edildiğinde yapılan ilk 10 dakika, verilerin kurtarılıp kurtarılamayacağını belirler.
Sistemi Kapatın ve Gücü Kesin: Arızalı bir RAID yapısını çalışır durumda tutmak, hasarlı disklerin daha fazla çizilmesine (head crash) neden olur.
Disk Sıralamasını İşaretleyin: Diskleri yuvalarından çıkaracaksanız mutlaka üzerlerine hangi yuvadan (Slot 0, Slot 1, vb.) çıktığını yazın. RAID yapısı için disk sırası hayati önem taşır.
CHDSK veya FSCK Çalıştırmayın: İşletim sisteminin otomatik onarma araçları, bozulmuş bir RAID yapısında dosya sistemini düzeltmeye çalışırken verilerin üzerine rastgele veriler yazabilir.
Zorla Online Yapmayın (Force Online): Kontrolcü üzerinden “Force Online” komutu vermek, senkronizasyonu bozulmuş bir diski sisteme dahil ederek tüm verinin bozulmasına (corruption) yol açabilir.
4. Profesyonel Veri Kurtarma Süreci Nasıl İşler?
RAID sistemlerinden veri kurtarmak, standart bir bilgisayardan veri kurtarmaya benzemez. Profesyonel süreç şu adımlardan oluşur:
Sektörel Klonlama: Disklerin tek tek imajları (sektör bazlı kopyaları) alınır. Orijinal diskler üzerinde asla işlem yapılmaz.
RAID Analizi: Blok boyutu (block size), başlangıç sektörü (offset), disk sırası ve parite tipi (Left Synchronous vb.) laboratuvar ortamında analiz edilir.
Sanal RAID İnşası: Elde edilen parametrelerle sistem sanal olarak birleştirilir.
Veri Çıkarımı: Yapı başarılı şekilde kurulduktan sonra dosya sistemi onarılır ve veriler yeni bir birime aktarılır.
5. Gelecekteki Kayıpları Önlemek İçin Öneriler
Yedekleme RAID Değildir: RAID, sistemin kesintisiz çalışmasını sağlar; ancak yangın, hırsızlık veya fidye yazılımı (Ransomware) saldırılarına karşı koruma sağlamaz. Mutlaka bulut veya farklı bir fiziksel birimde yedek bulundurun.
Hot Spare Kullanın: RAID yapınızda boşta bekleyen bir “Sıcak Yedek” (Hot Spare) disk bulundurmak, bir arıza anında sistemin otomatik olarak onarılmasını sağlar.
Düzenli Disk Kontrolleri: SMART testlerini düzenli yaparak ömrü azalan diskleri önceden tespit edin.
Önemli Not: Eğer RAID yapınızda kritik verileriniz varsa ve sistem “Failed” durumuna düştüyse, internetteki ücretsiz kurtarma yazılımlarıyla deneme yapmak yerine profesyonel bir veri kurtarma merkezine başvurmanız verilerinizi kurtarma şansını %90 artıracaktır.