Saturs

·         1 Ievads

o    1.1 Atšķirība starp fiziskajiem un loģiskajiem diskiem

o    1.2 Datu lasīšana un rakstīšana

o    1.3 Kas ir RAID?

o    1.4 Kāpēc izmantot RAID?

o    1.5 Vēsture

·         2 RAID sistēmās izmantotie pamatjēdzieni

o    2.1 Kešatmiņa

o    2.2 Spoguļattēls: Vairāk nekā viena datu kopija

o    2.3 Svītru joslu veidošana: Daļa datu atrodas citā diskā

o    2.4 Kļūdu labošana un defekti

o    2.5 Karstie rezerves diski: vairāk disku izmantošana, nekā nepieciešams

o    2.6 Datu joslu izmērs un gabalu izmērs: datu izkliedēšana vairākos diskos

o    2.7 Diska salikšana: JBOD, apvienošana vai sadalīšana

o    2.8 Diska klons

o    2.9 Dažādi iestatījumi

·         3 Pamati: vienkārši RAID līmeņi

o    3.1 Bieži izmantotie RAID līmeņi

§  3.1.1 RAID 0 "striping"

§  3.1.2 RAID 1 "dublēšana"

§  3.1.3 RAID 5 "izvietošana ar sadalītu paritāti"

§  3.1.4 Attēli

o    3.2 Mazāk izmantotie RAID līmeņi

§  3.2.1 RAID 2

§  3.2.2 RAID 3 "svītru pārklāšana ar īpašu paritāti"

§  3.2.3 RAID 4 "svītru pārklāšana ar īpašu paritāti"

§  3.2.4 RAID 6

§  3.2.5 Attēli

o    3.3 Nestandarta RAID līmeņi

§  3.3.1 Dubultā paritāte / diagonālā paritāte

§  3.3.2 RAID-DP

§  3.3.3 RAID 1.5

§  3.3.4 RAID 5E, RAID 5EE un RAID 6E

§  3.3.5 RAID 7

§  3.3.6 Intel Matrix RAID

§  3.3.7 Linux MD RAID draiveris

§  3.3.8 RAID Z

§  3.3.9 Attēli

·         4 RAID līmeņu savienošana

·         5 RAID izveide

o    5.1 Programmatūras RAID

o    5.2 Aparatūras RAID

o    5.3 Aparatūras atbalstīts RAID

·         6 Dažādi termini, kas saistīti ar aparatūras kļūmēm

o    6.1 Neveiksmju biežums

o    6.2 Vidējais laiks līdz datu zudumam

o    6.3 Vidējais laiks līdz atveseļošanai

o    6.4 Neatgūstamo bitu kļūdu īpatsvars

·         7 Problēmas ar RAID

o    7.1 Disku pievienošana vēlāk

o    7.2 Saistītās kļūdas

o    7.3 Atomicitāte

o    7.4 Neatgūstamie dati

o    7.5 Ierakstīšanas kešatmiņas uzticamība

o    7.6 Iekārtu savietojamība

·         8 Ko RAID var un ko nevar

o    8.1 Ko spēj RAID

o    8.2 Ko RAID nevar izdarīt

·         9 Piemērs

·         10 Atsauces

·         11 Citas tīmekļa vietnes

RAID ir akronīms, kas apzīmē "Redundant Array of Inexpensive Disks" jeb "Redundant Array of Independent Disks". RAID ir termins, ko izmanto skaitļošanas tehnikā. Izmantojot RAID, vairāki cietie diski tiek apvienoti vienā loģiskā diskā. To var izdarīt dažādos veidos. Katrai no metodēm, kas apvieno cietos diskus, ir dažas priekšrocības un trūkumi, salīdzinot ar to, ja diski tiek izmantoti kā atsevišķi, viens no otra neatkarīgi diski. Galvenie iemesli, kāpēc tiek izmantots RAID, ir šādi:

  • Lai datu zaudēšana notiktu retāk. Tas tiek panākts, izveidojot vairākas datu kopijas.
  • Lai iegūtu vairāk glabāšanas vietas, izmantojot daudzus mazākus diskus.
  • Lai iegūtu lielāku elastību (diskus var mainīt vai pievienot, kamēr sistēma turpina darboties).
  • Lai ātrāk iegūtu datus.

Visus šos mērķus nav iespējams sasniegt vienlaikus, tāpēc ir jāizvēlas.

Ir arī dažas sliktas lietas:

  • Dažas izvēles var pasargāt no datu zaudēšanas, jo viens (vai vairāki) diski ir sabojājušies. Tomēr tās neaizsargā pret datu dzēšanu vai pārrakstīšanu.
  • Dažās konfigurācijās RAID var pieļaut viena vai vairāku disku kļūmi. Pēc tam, kad bojātie diski ir nomainīti, dati ir jāatjauno. Atkarībā no konfigurācijas un disku lieluma šī atjaunošana var aizņemt ilgu laiku.
  • Dažu veidu kļūdas neļauj nolasīt datus.

Lielākā daļa darbu par RAID ir balstīti uz 1988. gadā rakstītu darbu.

Uzņēmumi ir izmantojuši RAID sistēmas, lai uzglabātu savus datus, kopš šī tehnoloģija tika radīta. RAID sistēmas var izveidot dažādos veidos. Kopš RAID sistēmas atklāšanas tās izveides izmaksas ir ievērojami samazinājušās. Šā iemesla dēļ pat dažiem datoriem un ierīcēm, ko izmanto mājās, ir dažas RAID funkcijas. Šādas sistēmas var izmantot, piemēram, mūzikas vai filmu glabāšanai.

Paplašināts skaidrojums un svarīgākie jēdzieni

RAID būtība — datu izvietošana (striping), replikācija (mirroring) un paritāte — ietekmē veiktspēju, izturību un kopējo pieejamo ietilpību. Šeit ir īss pārskats par biežāk sastopamajiem terminiem:

  • Svītrošana (striping) — dati tiek dalīti bloku līmenī un izkliedēti pa vairākiem diskiem, kas uzlabo sekvenciālu lasīšanu/rakstīšanu.
  • Spoguļattēls (mirroring) — viena un tā pati informācija tiek saglabāta uz vairākiem diskiem, nodrošinot augstu datu drošību, bet samazinot lietojamo ietilpību (piem., RAID 1).
  • Paritāte — aprēķinātas informācijas daļa, kas ļauj atjaunot datus, ja disks neizdodas (piem., RAID 5, RAID 6). Paritāte aizņem daļu vietas, bet ir efektīvāka nekā pilna kopija.
  • Karstais rezerves disks (hot spare) — disks, kas stāv gaidītājā režīmā un automātiski tiek izmantots atjaunošanai, ja kāds disks izgāžas.
  • Joslas (stripe) izmērs — blokuzņēmuma lielums, kas nosaka, cik daudz datu tiek ierakstīts uz katra diska pirms pārejas uz nākamo. Tas ietekmē veiktspēju atkarībā no darba slodzes.
  • JBOD — "Just a Bunch Of Disks", disku apvienošana bez RAID loģikas (vienkārši virkne vai apvienots loģiskais disks).

Biežāk lietotie RAID līmeņi — priekšrocības un trūkumi

  • RAID 0 (striping)
    • Priekšrocības: augsta sekvenciāla lasīšanas un rakstīšanas ātruma iespēja; visa disku ietilpība tiek izmantota.
    • Trūkumi: nav redundances — viena diska kļūme nozīmē datu zudumu.
    • Lietojums: pagaidu datu apstrāde, kešs, veiktspējas optimizācija, kur zudums nav kritisks.
  • RAID 1 (mirroring)
    • Priekšrocības: ļoti augsta datu pieejamība (vienkārša atjaunošana, lasīšanu var veikt no vairākām kopijām).
    • Trūkumi: efektīvā ietilpība ir puse no kopējās (divu disku RAID 1), izmaksas par vienu glabāšanas vienību ir lielākas.
    • Lietojums: sistēmu diski, kritiski dati ar augstām pieejamības prasībām.
  • RAID 5 (svītrošana ar sadalītu paritāti)
    • Priekšrocības: laba ietilpība un aizsardzība pret vienas diska kļūmi, salīdzinoši efektīva paritātes izmantošana.
    • Trūkumi: rakstīšanas veiktspēja var samazināties (paritātes aprēķini), atjaunošanas (rebuild) laikā liela slodze uz sistēmu; pieaug risks, ka otrais disks bojājas atjaunošanas laikā, īpaši lieliem diskiem un vecākiem RAID kontrolieriem.
    • Lietojums: vispārēja uzglabāšana ar kompromisu starp veiktspēju, cenu un drošību.
  • RAID 6 (divkāršā paritāte)
    • Priekšrocības: var izturēt divu disku kļūmes, piemērots lieliem diskdzinējiem un RAID masīviem.
    • Trūkumi: vēl lielāks paritātes aprēķinu režīms — samazināta rakstīšanas veiktspēja un nedaudz mazāka ietilpība nekā RAID 5.
    • Lietojums: lielas kapacitātes sistēmas, kur atjaunošanas laikā risks ir būtisks.
  • RAID 10 (1+0, spoguļi + svītrošana)
    • Priekšrocības: apvieno RAID 1 drošību ar RAID 0 veiktspēju; ātra atjaunošana.
    • Trūkumi: nepieciešami vismaz 4 diski; efektīvā ietilpība 50%.
    • Lietojums: datubāzes un lietojumprogrammas ar augstām I/O prasībām.

Nestandarta un modernie risinājumi

Ir daudz papildu un patentētu variantu: RAID-DP (NetApp), RAID Z (ZFS), Intel Matrix RAID, RAID 5E/6E u.c. Tie mēģina risināt paritātes vājās vietas, paātrināt atjaunošanu vai nodrošināt elastīgāku disku izmantošanu. ZFS un līdzīgi failu sistēmu līmeņa risinājumi piedāvā papildu datu integritātes pārbaudes (checksums), kas palīdz atklāt un novērst "silent corruption".

RAID izveide — programmatūra pret aparatūru

  • Programmatūras RAID (OS līmenī, piemēram, Linux MD, Windows Storage Spaces)
    • Priekšrocības: elastība, nav nepieciešams dārgs kontrolieris, vieglāka migrācija starp sistēmām.
    • Trūkumi: nedaudz lielāka CPU slodze; veiktspēja atkarīga no sistēmas resursiem.
  • Aparatūras RAID (raid kontrolieri ar iebūvētu loģiku)
    • Priekšrocības: bieži labāka veiktspēja, write-back kešatmiņa ar baterijas atbalstu (BBU) uzlabo ierakstus.
    • Trūkumi: kontrolieru saderība, izsekojamība; dārgi; dažkārt kontrolleri izmanto patentētus metadatus, kas apgrūtina masīva pārvietošanu uz citu kontrolieri.

Problēmas, riski un atveseļošanās

  • Atjaunošanas laiks (rebuild) — lielākiem diskiem atjaunošana var ilgt stundas vai dienas; šajā laikā RAID ir ievainojams pret papildu kļūdām.
  • Neatgūstamie bitu kļūdu (URE) ietekme — mūsdienu HDD URE norma var nozīmēt, ka atjaunošanas laikā parādās nolasīšanas kļūdas, kas var novest pie pilnīga masīva zaudējuma, īpaši RAID 5.
  • Atomicitāte un kešēšana — rakstīšanas kešs var izraisīt datu nekonsistenci pēc strāvas zuduma, ja nav akumulatora vai UPS. Rakstīšanas režīmi (write-back vs write-through) būtiski ietekmē veiktspēju un drošību.
  • Iekārtu savietojamība — dažādu ražotāju kontrolieri un disku firmas nosaka, cik vienkārši ir pārvietot masīvu vai atjaunot datus uz cita kontroliera.

Ko RAID var un ko nevar

  • RAID var:
    • palielināt pieejamību pret atsevišķu disku kļūmēm (atkarībā no līmeņa),
    • uzlabot lasīšanas vai rakstīšanas veiktspēju,
    • palielināt lietojamo kapacitāti vai tās efektivitāti,
    • nodrošināt iespēju mainīt vai nomainīt diskus ar minimālu dīkstāvi (hot-swap).
  • RAID nevar:
    • aizstāt regulārus dublējumus (backup) vai versiju vadību — RAID nenodrošina aizsardzību pret kļūdainu datu dzēšanu vai vīrusu,
    • novērst datu bojāšanos, ko izraisījusi programmatūras kļūme vai cilvēka kļūda,
    • aizsargāt pret fizikāliem datu bojājumiem, kas skar visus diskus vienlaikus (piem., strāvas pārspriegums bez UPS).

Praktiski padomi un labākā prakse

  • Vienmēr saglabājiet ārējus dublējumus (off-site vai mākonī) — RAID nav backup.
  • Izmantojiet disku grupas ar līdzīgu veiktspēju un izturību (labāk — vienas ražotāja un modeļa diski).
  • Uzraudziet SMART rādītājus un RAID veselības statusu automātiski (alerts uz e-pastu vai SNMP).
  • Ja iespējams, izmantojiet RAID līmeņus ar divkāršu paritāti (RAID 6 vai ekvivalenti) lielākos masīvos.
  • Darbiniet RAID kontrolieri un serveri ar UPS, lai novērstu datu nekonsistenci strāvas zuduma gadījumā.
  • Izmēģiniet atjaunošanas procedūras ārpus ražošanas vidi — zināt, cik ilgi process prasa un kā rīkoties kļūmes gadījumā.

Piemērs

Piemēram, uzņēmuma datubāzes serverim ar augstām I/O prasībām var izvēlēties RAID 10: tas nodrošina ātru lasīšanu/rakstīšanu un atjaunošanos, ja disks sabojājas. Savukārt datu arhīvam, kur prioritāte ir kapacitāte un izmaksu efektivitāte, piemērotāks var būt RAID 6. Mājas NAS, kur svarīga ir gan ietilpība, gan drošība, bieži izmanto RAID 5 vai RAID 6 ar hot-spare disku un regulāru dublēšanu uz mākoni.

Nobeigums

RAID ir spēcīgs instruments datu uzglabāšanas arhitektūrā, taču tas nav burvju risinājums. Pareiza RAID līmeņa izvēle, regulāra uzraudzība, atbilstoša aparatūra un ārējie dublējumi ir nepieciešami, lai nodrošinātu gan veiktspēju, gan datu drošību. Pirms RAID ieviešanas izvērtējiet veiktspējas prasības, atjaunošanas laiku, izmaksas un dublēšanas politiku.

Papildus informācijai skatiet sadaļas tabulā sarakstītās tēmas (Saturs) un atsauces par RAID vēsturi un tehniskajiem aprakstiem.