Inhoud
Inleiding
Wat is RAID?
Wat is RAID?
Geschiedenis van RAID
RAID-levels
Levels
Raid0
Raid1
Raid10
Raid 0+1
Raid2
Raid3
Raid4
Raid53
Raid5
Raid6
Raid7 Hot-swappable
Hot-swappable Conclusie
Conclusie en advies Bijlagen
Woordenlijst
Bronvermelding Inleiding Onderwerpkeuze Korte inhoud
In deze inleiding wil ik o.a. vertellen hoe ik bij mijn onderwerpkeuze gekomen ben, wat mijn eerste indrukken over deze technologie waren vóórdat ik me er in ging verdiepen, en ik wil alvast enkele punten uitlichten die ik in het verslag wil verdiepen. Hoe ben ik bij mijn onderwerp gekomen? Ik had al meerdere keren van de RAID-systemen gehoord, o.a. via computermagazines en het internet. Ik had al eens een verslag gezien van iemand die ook geïnteresseerd was in de mogelijkheden van deze techniek, en hij vertelde me dat het heel goed mogelijk was om dit onderwerp te gebruiken voor een stageverslag. Zoals ik al zei, was een van mijn eerste bronnen het internet. Op een site die ik vaak bezoek, is een test van IDE-RAID ter sprake gekomen. (www.tweakers.net) Via deze site ben ik te weten gekomen dat RAID ondermeer gebruikt wordt om van meerdere harde schijven één logische schijf te maken. Ik vond dit allemaal wel interessant, maar verdiepte me er verder niet in. Een tijdje later, gedurende mijn stage, kwam het weer ter sprake. Op de afdeling assemblage van PCR/Bilderbeek moest ik een PC in elkaar zetten. Op het moederbord zat een RAID-controller. Het onderwerp schoot me ineens weer te binnen, en ik besloot dit als onderwerp te nemen voor mijn stageverslag. Ik heb me in het begin vooral georiënteerd met behulp van Tweakers. In het artikel werd kort iets verteld over de geschiedenis van RAID en de verschillende varianten. Ik heb besloten me vooral te richten op de hardwarematige kant van de zaak, en dan met name op de verscheidene varianten. Allereerst wil ik in het kort iets vertellen over de voorgeschiedenis en de ontwikkeling die de technologie heeft doorgemaakt.
Wat is RAID?
Redundant Array of Independent Disks
Verbetering van opslag
Levels
Hot swappable
RAID is, van oorsprong, een manier van combineren van harde schijven, waardoor er uit meerdere kleine HD’s een grote schijf ontstaat. Deze functie is in de loop der tijd, toen grotere schijven goedkoper werden, verloren gegaan en vervangen door andere eisen, namelijk het verbeteren van de betrouwbaarheid of de prestaties van een harde schijf configuratie. De afkorting RAID staat voor Redundant Array of Independent Disks, een groep onafhankelijke schijven waarop informatie wordt opgeslagen. Er zijn verschillende varianten van RAID, ‘levels’ genaamd. De twee meest gangbare levels zijn Raid 1 en Raid 5. Ik zal later dieper ingaan op de verschillen tussen de verscheidene levels. RAID zorgt ervoor dat een server kan doorgaan met zijn werkzaamheden, wanneer een van zijn harde schijven defect raakt. Er is weinig tot niets dat wijst op een defecte schijf, een tijdelijke vermindering van de prestaties (m.a.w. de server lijkt ‘langzamer’ te lopen) kan voorkomen. De schijf kan vervangen worden, terwijl de server kan doordraaien. Men noemt dit een hot-swappable systeem. RAID maakt het openen en opslaan van bestanden en applicaties sneller, doordat hij het lezen en schrijven over meerdere schijven verdeelt. Of hier in huis-tuin-en-keuken situaties ook voordeel mee wordt behaald, hangt voornamelijk af van het soort programma’s, dat er gedraaid wordt. Bij het werken met bijvoorbeeld grote audiovisuele bestanden zijn er zeker voordelen te bemerken, doordat de tijd die nodig is voor het opslaan en terughalen van zulke bestanden behoorlijk wordt ingekort. Ook in het bedrijfsleven heeft het gebruik van een RAID-systeem zeker voordelen. Doordat alle gegevens als het ware ‘dubbel’ opgeslagen worden, is een verlies van belangrijke data bijna volkomen uitgesloten. Door het gebruik van hot-swappable schijven kan een server die 24 uur per dag moet werken, ook echt de garantie geven dat hij 24/7 kan draaien. Bij een eventueel defect in een van zijn schijven kan deze vervangen worden zonder dat de PC uitgeschakeld moet worden. Natuurlijk biedt dit ook mogelijkheden voor thuissituaties waar belangrijke data op de computer is opgeslagen. Geschiedenis Hoe is RAID ontstaan? Waarom ontwikkelde men RAID? In de jaren 80, aan het ‘begin’ van het Personal Computing tijdperk zoals we dat nu kennen, lagen de prijzen van allerlei hardware onderdelen behoorlijk wat hoger dan tegenwoordig, nu de artikelen voor bodemprijzen over de toonbank vliegen. Zo ook de prijzen van HD’s. Vooral ‘grotere’ harde schijven (bijvoorbeeld een harddisk van 20 MB, wat in die tijd al heel wat was), waren relatief gezien veel hoger geprijsd dan de kleinere. Met dit gegeven in hun achterhoofd hebben een aantal mensen het plan gevat om die kleinere HD’s aan elkaar te koppelen m.b.v. een array, om zo 1 grote schijf te creëren. Vier harde schijven van 5 MB in plaats van een schijf van 20 MB zou namelijk een aanzienlijke prijsbesparing opleveren. Zie hier het eerste geval van RAID. In 1988 kwam de Californische Berkeley University met een publicatie, waarin zij het bouwen van zulke arrays beschrijven. Deze publicatie was getiteld ‘A case for Redundant Arrays of Inexpensive Disks’. In de loop van de tijd is RAID veranderd. Er zijn meer vormen (levels) bijgekomen, en de betekenis van de afkorting RAID is gewijzigd. Vroeger lag bij de functie van RAID het accent veel meer op kostenbesparing. Dit is ook te zien in de betekenis van de afkorting. Redundant Arrays of Inexpensive Disks, vrij vertaald als overtollige groepen van goedkope schijven, is later veranderd in Redundant Arrays of Independent Disks, overtollige groepen van onafhankelijke schijven. Het accent is verschoven van kostenbesparing naar fouttolerantie. Lange tijd hebben alleen SCSI configuraties gebruik kunnen maken van de RAID technologie. Omdat voor het gebruik van RAID de aansluiting van meerdere harde schijven op een controller noodzakelijk is, was het zeer moeilijk om deze techniek toe te passen op een IDE configuratie, aangezien deze slechts 2 apparaten per controller toelaat, waar SCSI er 7 kan herbergen. Om gebruik te maken van RAID op een IDE configuratie is een zogenaamde RAID controller nodig. In 1997 kwam het bedrijf Promise met de allereerste RAID controller voor IDE configuraties. Inmiddels is IDE-RAID definitief doorgebroken en bouwen verscheidene fabrikanten de RAID controllers op hun moederborden. RAID levels Verschillende varianten Verdeelbaar in groepen
Zoals ik net al heb gezegd, zijn er verschillende varianten van de RAID-technologie. Deze varianten noemt men levels. Kort samengevat zitten de verschillen tussen deze levels vooral in de manieren waarop de gegevens over de schijven verdeeld worden (striping), waarop er redundantie ontstaat (mirroring), waarop de fouten worden gecontroleerd (pariteit en ECC) en de manier waarop de foutcontrolegegevens over de schijven verdeeld worden. Je kunt de RAID-levels grofweg indelen in de volgende groepen. Levels Karakteristieke eigenschappen
Raid0 Alleen striping
Raid1 Alleen mirroring
Raid10
Raid 0+1 Combinatie van Raid0 en Raid1
Raid2 Striping met ECC
Raid3
Raid4 Opslag pariteitsbit op gespecialiseerde schijf
Raid53 Combinatie Raid3 en Raid0
Raid5
Raid6 Verdeling pariteitdata over schijven
Raid7 Pariteitdata op gespecialiseerde schijf
Controle door real-time OS
In de komende hoofdstukken zal ik dieper ingaan op de levels. RAID 0 Striping 1 logische schijf Redundantie
Raid0 is het eerste RAID level die ik zal beschrijven. Dit is de techniek die in 1988 door de Berkeley Universiteit werd beschreven, als een methode om van verschillende HD’s 1 logische schijf te maken. Deze techniek geeft geen redundantie, en wordt daarom niet echt als een RAID-techniek beschouwd, vandaar de aanduiding Raid0 i.p.v. bijvoorbeeld Raid1. Raid0 combineert de ongeformatteerde vrije ruimte van meerdere schijven (vanaf 2 tot maximaal 32) tot één grote logische drive. Bij alle vormen van RAID is het zo, dat als meerdere schijven worden verenigd tot een logische drijf, de capaciteit van deze schijf gelijk is aan de allerkleinste in de array. Een voorbeeld: je hebt 3 schijven, een van 3, een van 4 en een 5 GB. De totale capaciteit in een RAID-configuratie is dan 9 (3x3) i.p.v. 10 (3+4+5) GB. Gegevens worden in blokken verdeeld en over alle schijven verdeeld, telkens een blok tegelijk. Dit proces van in stukken delen en verdelen over meerdere schijven wordt ‘striping’ genoemd. Sommige systemen stripen op een bepaald aantal blokken (alle data wordt in een vast aantal blokken verdeeld), andere stripen op een bepaalde grootte van de blokken (de data wordt verdeeld in een aantal blokken van een vastgestelde grootte). Doordat bij Raid0 de data over meerdere schijven wordt verdeeld, wordt de lees- en schrijfsnelheid van de PC aanzienlijk vergroot. Hoe meer schijven er in een configuratie geplaatst worden, hoe meer de I/O load gespreid wordt, en hoe meer de prestaties van het systeem zullen verbeteren. Theoretisch is een verbetering van 100% mogelijk. Dit is het grootste voordeel van Raid0. Het grote nadeel van Raid0 ligt in het totaal ontbreken van redundantie. Wanneer een schijf in de stripe-set het begeeft, is alle data verloren. Dit zorgt ervoor dat Raid0 onbruikbaar is voor het opslaan van belangrijke gegevens. Het ontbreken van redundantie zorgt echter ook weer voor een tweede voordeel, namelijk het volledig behoud van de schijfruimte. Wanneer er sprake is van redundantie wordt de schijf nooit volledig gebruikt, omdat (een deel van) de gegevens dubbel op de schijf gezet wordt. Raid0 kan met name gebruikt worden wanneer de snelheid belangrijker is dan het behoud van de gegevens, zoals bij het opslaan van tijdelijke bestanden. Hier is een illustratie die het stripen misschien nog iets kan verduidelijken. RAID 1 Mirroring Redundantie
Raid 1 is de eerste RAID-level waarbij je echt kunt spreken van Redundant Arrays of Independent Disks. Bij Raid 1 worden alle gegevens op zowel de eerste als de tweede schijf geschreven, zodat de tweede schijf een exacte kopie wordt van de eerste. Dit is dus een wezenlijk verschil met RAID 0, waarbij er totaal geen redundantie voorkomt.
Deze techniek van het precies overnemen van informatie van schijf 1 naar schijf 2 wordt mirroring (spiegelen) genoemd. Een Raid1 configuratie wordt daarom ook wel een mirror configuratie genoemd.
Het ophalen van gegevens vanaf een systeem dat werkt volgens een Raid1 principe, gaat twee keer zo snel als het ophalen van data vanaf een ‘gewone’ configuratie, omdat van beide schijven de helft van de data wordt gelezen. Het opslaan gaat echter langzamer, omdat de data naar twee schijven tegelijkertijd moet worden geschreven.
Het grote voordeel van Raid1 is niet de grotere leessnelheid, maar vooral de veiligheid. Mocht onverhoopt een van de schijven kapot gaan, dan is er altijd een exacte kopie van deze schijf bij de hand. Het herstellen of vervangen van beschadigde bestanden gaat zeer snel, doordat er zo’n exacte kopie bestaat.
Aan Raid1 kleeft helaas ook een groot nadeel: de hoge kosten. Het draaien van een Raid1 systeem kost twee keer zoveel schijfruimte als een gewone configuratie. De hoeveelheid gegevens die opgeslagen kan worden, wordt bepaald door de kleinste schijf. Dit levert dus als automatisch een verlies van 100% op, wat eventueel nog kan oplopen door het combineren van 2 schijven van verschillende grootte.
Raid1 is vooral geschikt voor PC’s die belangrijke informatie bevatten. Omdat de snelheid die je wint bij het lezen, weer verloren wordt door het langzame schrijven, heeft Raid1 geen echte voordelen voor persoonlijk gebruik. Voor bedrijven echter, die bijvoorbeeld hun boekhouding en bestellingen van de computer halen, is dit een zeer goede oplossing om er zeker van te zijn dat er geen data verloren gaat.
RAID 10
Combinatie Raid0 en Raid1
Schijven verdeeld in takken
Eerst striping, dan mirroring
Het is zeer goed mogelijk om de verschillende RAID-levels te combineren. De bekende combinatievormen zijn Raid 0+1, Raid10 en Raid 53. Raid 10 is een samenvoeging van een niveau-0 en een niveau-1 RAID-configuratie. Bij Raid0 en Raid1 staan het stripen en het mirroren van de gegevens centraal. Door het stripen van de gegevens is een verhoogde lees- en schrijfsnelheid mogelijk, maar is er geen enkele redundantie. Bij mirroring is er sprake van een extra beveiliging d.m.v. het kopiëren van gegevens naar een tweede schijf, waardoor er redundantie ontstaat. Door het combineren van striping en mirroring hef je het grootste nadeel van het stripen op, terwijl de voordelen behouden blijven. De schijven worden in takken verdeeld, elke tak bestaat uit 2 schijven. Zoals te zien is, wordt de data eerst over de takken verdeeld. Dit is het striping-gedeelte van het proces. De stripes worden op beide schijven van een tak geschreven, zodat beide schijven dezelfde informatie bevatten. Dit is het mirroren. Voor een Raid10 configuratie zijn minimaal 4 schijven nodig. Een configuratie moet bestaan uit 2 takken, waar de gegevens over gestriped worden. Elke tak bestaat uit 2 schijven, zodat de ene schijf de andere kan spiegelen. Een Raid10 configuratie levert een grotere leessnelheid, doordat de I/O load over meerdere schijven verdeeld wordt. Een groot nadeel van zulk een configuratie is echter de dubbele hoeveelheid schijven die je nodig hebt. Dit drijft de kosten huizenhoog op. Een groot voordeel van Raid10 is het feit dat er een onbeperkt aantal schijven mag uitvallen, zolang er maar niet 2 schijven uit een tak defect raken. RAID 0+1 Combinatie van Raid0 en Raid1 Vaak verward met Raid10
Twee RAID-levels die vaak met elkaar verward worden, zijn Raid10 en Raid 0+1. Beide zijn combinaties van Raid0 en Raid1, maar ze zijn (ondanks dat veel mensen dit denken) niet hetzelfde! Het venijn zit hem in de manier op er gestriped wordt. Bij Raid10 wordt de informatie over takken gestriped en gemirrored op de 2 schijven die een tak vormen. Bij Raid 0+1 worden de data gestriped over de helft van de harde schijven, en deze helft wordt gemirrored over de andere helft van de schijven. In het voorbeeld op de illustratie wordt de data eerst gestriped over de eerste twee schijven. Hierna wordt de data van deze twee schijven gemirrored over twee volgende schijven. Raid 0+1 heeft dezelfde nadelen als een Raid10 configuratie, namelijk een opslagcapaciteit die door twee gedeeld wordt. Als er een schijf uitvalt, verandert de complete configuratie in een Raid0 systeem. De data is dan alleen nog gestriped, omdat de gemirrorde schijf is uitgevallen. In essentie kun je dan spreken van een Raid0 config. RAID 2 ECC Niet meer gebruikt
Een RAID-level die tegenwoordig (bijna) niet meer gebruikt wordt, is Raid2. Raid2 werkt, net als Raid0, op basis van het stripen van gegevens. De stripe set laat vervolgens zijn ECC-functie los op de gegevens en schrijft de Hamming Code op de tweede set schijven. De code wordt ook eerst gestriped. Bij het lezen wordt met behulp van de Hamming Code eerst gecheckt of de data correct is, en kunnen enkelvoudige fouten verholpen worden.
Raid2 wordt tegenwoordig niet meer toegepast, omdat moderne HD’s de ECC-functie zelf al hebben ingebouwd. Hierdoor is Raid2 alleen relevant voor oudere systemen.
Het voordeel van Raid2 is natuurlijk de foutcorrectie, als deze al niet zelf in de PC is ingebouwd. Verder wordt de leessnelheid verhoogd. Het nadeel is vooral de hoge instapkosten, omdat er zoveel schijven voor nodig zijn.
Nu de meeste computers de ECC-functie al ingebouwd hebben, wegen de voordelen bij lange na niet meer op tegen de nadelen. Verhoging van de leessnelheid is ook een gevolg van de andere RAID-levels, dus zal een consument sneller kiezen voor bijvoorbeeld een Raid1 of Raid5 dan een Raid2 configuratie.
RAID 3
Pariteitschijf
Het derde RAID level wordt gevormd door een configuratie met tenminste 3 schijven. Een van deze schijven dient enkel om een pariteitsbit op te slaan. De informatie wordt gestriped over de 2 eerste schijven, en op de derde schijf wordt een pariteitsbit geschreven. Doordat deze schijf meer gebruikt wordt dan de andere 2, heeft hij meer kans om uit te vallen. De blauwe schijven 1 t/m 4 zijn de opslagschijven, de rode schijf 5 is de pariteitschijf. Mocht er onverhoopt een schijf uitvallen, dan kan alle data hersteld worden door deze te reconstrueren uit de informatie van de andere schijven. Het verlies van twee schijven tegelijkertijd is echter onoverkoombaar. Het voordeel van Raid3 is vooral de verhoging van het read- and write tempo door het verdelen van de taken over meerdere schijven. Door de pariteitcontrole is het mogelijk om zonder problemen 1 schijf te verliezen. De verhouding pariteitschijven/opslagschijven is zo laag mogelijk, omdat er maar 1 pariteitschijf nodig is. Het aantal beschikbare opslagschijven is dus het totaal aantal schijven min 1. RAID 4 Verdeling in blokken Pariteitschijf
Raid4 werkt op eenzelfde manier als Raid3. Bij Raid3 wordt de data in stripes verdeeld en deze stripes worden over de schijven gedeeld. Bij Raid4 worden de gegevens in grote blokken verdeeld, en deze worden over de schijven gezet. Weer wordt een aparte disk gebruikt om de pariteitsbit op te slaan. Raid4 werkt op eenzelfde manier als Raid3, zoals te zien is als je deze illustratie vergelijkt met die van een Raid3 configuratie. Het lezen van de gegevens gaat sneller dan bij een Raid3 configuratie, omdat de gegevens in grote blokken op de schijf staan. Raid4 geeft dezelfde voordelen als een Raid3 systeem. Tegenwoordig wordt Raid4 weinig meer gebruikt, omdat het geen voordelen biedt tegenover het bekende Raid5. RAID 53 Combinatie van Raid0 en Raid3 Schijven verdeeld in takken Vergelijkbare opbouw met Raid10
Raid53 is ook een combinatie van twee simpelere RAID-levels. Een betere naam voor dit niveau van Raid-configuraties zou zijn Raid30. Het is een combinatie van Raid0 en Raid3, en zijn opbouw is te vergelijken met Raid10.
Ook Raid53 werkt met takken. Een Raid53 configuratie bestaat uit minstens 2 takken, en elke tak bestaat uit minstens 3 schijven. De informatie wordt over de takken gestriped, zie hier de overeenkomst met Raid0 en Raid10. Een tak is opgebouwd als een Raid3 configuratie.
Je ziet dat het rode bolletje (de data) gedeeld wordt over 2 takken, en dat bij elke tak een wit bolletje met pariteitgegevens wordt toegevoegd, die op de onderste schijf wordt opgeslagen. De bovenste 3 HD’s zijn dataschijven, waarover de inkomende data gedeeld wordt. De onderste HD is een gespecialiseerde pariteitschijf.
Raid53 is vergelijkbaar met Raid3, alleen zijn de lees- en schijfprestaties verhoogd door het extra stripen.
RAID 5
Verdeling pariteitsbit
Als je een server onderzoekt, waar beschikbaarheid van de gegevens van vitaal belang is, heb je groot kans dat je een Raid5 configuratie vindt. Raid5 combineert alle voordelen van de RAID-technologie (redundantie, verhoogde leessnelheid) en reduceert de nadelen (extra schijven) tot een minimum. Het systeem stripet de gegevens over de harde schijven, en maakt een pariteitsbit. De verscheidende pariteitsbits worden ook over de harde schijven verdeeld, zodat er geen speciale pariteitschijf nodig is. Mocht er een schijf uitvallen, dan is dit geen ramp. Met behulp van de pariteitsbits en de gegevens op de andere schijven kan het systeem de data van de verloren schijf restoren. Dit terugrekenen kost processorkracht en gaat niet zo snel als bij bijv. een Raid1 configuratie, waar de gegevens alleen van de mirrorschijf naar de dataschijf moeten worden gekopieerd. De voordelen van Raid5 zijn de hoge leessnelheid, de foutcontrole en de mogelijkheid om de data te herstellen als er een schijf uitvalt. Een nadeel is de verlaagde schrijfsnelheid. Dit alles maakt Raid5 erg geschikt voor read-only systemen. RAID6 Tweede set pariteitsdata
Raid6 is duidelijk een voortborduursel op het Raid5 systeem. Waar bij Raid5 er maar een schijf defect mocht raken, is het bij Raid 6 mogelijk om de configuratie door te laten draaien als er meerdere schijven uitvallen. Bij dit RAID-level worden de gegevens over de schijven gestriped, zoals bij Raid5 ook het geval is. Er worden pariteitsbits aangemaakt, die over de schijven worden verdeeld. Het grote verschil met Raid5 zit hem in deze pariteitsbits. Waar Raid5 gebruik maakt van een pariteitsbit, berekent het Raid6 systeem nog een tweede set pariteitgegevens. Hierdoor is het mogelijk dat de gegevens teruggezet worden als er meerdere schijven uitvallen. Verder is Raid6 compleet gelijk aan Raid5, met dezelfde voor- en nadelen. RAID 7 Pariteit langs een real-time OS Pariteitsdata geïntegreerd in cache
Het zevende RAID-level is meteen ook de meest gecompliceerde. Ook Raid7 maakt gebruik van pariteitsbits voor foutcontrole en herstelmogelijkheden, mocht er een schijf uitvallen.
De data wordt gestriped, en de pariteit wordt op een aparte schijf geschreven. De pariteitgegevens worden niet gestriped, en worden op een of meer schijven geschreven.
Tot zover lijkt dit verhaal erg veel op Raid 3 en Raid4. Ware het niet dat bij Raid7 de gegevens langs een real-time OS gaan, die de stroom gegevens oriënteert en controleert. De pariteitdata worden geïntegreerd in de cache.
Raid7 wordt vrij weinig gebruikt, vooral omdat een behoorlijk moeilijk systeem is. Je moet er nogal wat verstand van hebben om hiermee om te kunnen gaan. Verder stelt Raid7 een aantal eisen aan je configuratie, die andere Raid-levels niet vragen. Zo moet je systeem een SCSI-configuratie zijn en is IDE niet voldoende. De stroomvoorziening moet UPS hebben om verlies van cache-data te voorkomen.
Hot swappable
Vervangen zonder uitschakelen van het systeem
Hot-swappable wil zeggen dat een onderdeel van een configuratie kan worden vervangen, terwijl de server gewoon doordraait. Dit is meestal van toepassingen op de harde schijven van een server en heeft belangrijke voordelen. Het voordeel van hot-swappable harddrives is dat storingen sneller kunnen worden verholpen en, in combinatie met harddisks in een RAID-configuratie, de gebruikers van een server niet eens hoeven te merken dat een harde schijf wordt vervangen. Ook kunnen de werkzaamheden dan overdag worden uitgevoerd, hetgeen een kostenbesparing met zich mee brengt en er voor kan zorgen dat de storing minder lang voortduurt. Bij het falen van een harde schijf, die is opgenomen in een RAID-configuratie, hoeft dus niet te worden gewacht tot het gebruik van de server minimaal is en de server offline kan, mits de harde schijven hot-swappable zijn. Het gebruik van hot-swappable HD’s heeft het meeste zin in combinatie met een RAID-configuratie, omdat alleen dan een server blijft functioneren wanneer een harde schijf het begeeft. De harde schijf kan dan uit de server worden getrokken en een nieuwe schijf kan worden teruggezet. Dit alles terwijl de server gewoon door blijft serveren. Om harde schijven hot-swappable te maken, moet de server een controller bevatten die dat ondersteunt en ook de serverkast moet er geschikt voor zijn. Vanzelfsprekend moeten de harde schijven zelf ook hot-swappable zijn, anders kunnen deze defect raken en andere storingen veroorzaken. Conclusie Afweging kosten/veiligheid Thuissituatie/bedrijfsleven
Na alle informatie die ik heb kunnen verkrijgen, wil ik bij deze tot een slotoverweging komen. Het is natuurlijk erg simpel om te zeggen dat de RAID-technologie alleen maar voordelen biedt, of omdat de voordelen de nadelen bij verre overtreffen. Het is meer mijn idee om hier een voorbeeld te nemen van het meest gebruikte RAID-level, en zijn voor– en nadelen nog een keer duidelijk tegen elkaar af te wegen. Het meest gebruikte RAID-level is Raid5. De nadelen van een dergelijk systeem onder SCSI (SCSI omdat bij grootschalig professioneel gebruik 2 schijven niet voldoende zijn) zijn vooral de kosten. Je hebt allereerst de afweging SCSI/IDE, waarbij een SCSI controller in elk geval duurder is dan een IDE controller. Een verdere verhoging van de kosten wordt bewerkstelligd doordat je een deel van de schijfruimte verliest aan de pariteitsbit. Deze schijfruimte had je behouden als je de schijven in een normale master/slave configuratie had geplaatst. De voordelen van een Raid5 configuratie beperken zich niet alleen tot prestatieverhoging (verhoogde leessnelheid), maar leveren ook een verbeterde veiligheid door de redundantie. Door de redundantie is het mogelijk dat er een schijf uitvalt, en alle data van deze schijf hersteld kan worden m.b.v. van de pariteitgegevens op de andere schijven. Verder maakt Raid5 het mogelijk om defecte schijven te vervangen terwijl de PC doordraait, als men gebruik maakt van een hot-swappable systeem met hot-swappable schijven. Voor een gewone huis-tuin-en-keuken PC heeft het gebruik van RAID op deze manier geen enkel nut, of beter gezegd: de nadelen wegen niet op tegen de voordelen. Het is gewoon de moeite niet, de kosten niet waard. Maar in een situatie waar een PC 24/7 operationeel moet zijn en waar verlies van data onvermijdelijk tot problemen zou leiden, bijvoorbeeld de server die een website continu online moet houden, wordt het gebruik van zo’n systeem ineens in een heel ander licht geplaatst. Nu zijn de voordelen ineens van immens belang. De eigenaar van de voorgenoemde server heeft er hoogstwaarschijnlijk het extra geld wel voor over, als er een systeem wat hem kan garanderen dat de PC continu kan doordraaien als er een harddisk defect raakt. Raid53 kan die garantie geven, als hij gebruik maakt van hot-swappable schijven. Voor het bedrijfsleven biedt RAID dus zeker mogelijkheden, en is het gebruik van dit systeem de moeite waard, in ieder geval om het te bekijken en te overwegen. Verklarende Woordenlijst Array
Een groep harde schijven dat gebruikt wordt voor fault tolerance opties.
Cache
Een speciaal geheugen-subsysteem als onderdeel van het RAM waarin veelgebruikte gegevens worden gekopieerd om snel toegang te hebben. Configuratie
Alle onderdelen die samen een computersysteem vormen. ECC-functie
Error Checking and Correction. Het proces van foutcontrole en foutherstel. Hamming Code
Een bitpatroon dat werd aangevuld extra controlebits, om enkelvoudige fouten en burst-fouten te ontdekken. Hot-swappable
De mogelijkheid om een onderdeel van een toestel te vervangen zonder dat de werking van het toestel wordt onderbroken. IDE controller
Intelligent Drive Electronics. Deze standaard houdt onder andere in, dat er geen intelligentie aanwezig is in de controller en er veel intelligentie in de harddisk zit. Er kunnen maximaal maar twee drivers op een IDE controller worden aangesloten. Levels
Een niveau of variatie waarop de RAID-technologie wordt toegepast. Logische Schijf
Een harde schijf, die fysiek niet als zodanig aanwezig is, maar door de software wel als zodanig wordt herkend. Een voorbeeld hiervan is een gepartitioneerde harde schijf, die op die manier aanwezig is als één schijf, maar de software ziet twee logische schijven.
Master/slave configuratie
Een IDE-configuratie waarbij twee IDE-apparaten worden aangesloten op de IDE-controller. Een van de apparaten wordt benoemd als master, de ander als slave. Mirror Configuratie
Raid1 configuratie. Mirroring
Een maatregel voor fouttolerantie waarbij gegevens via een controller op verschillende redundante vaste schijfstations worden geschreven. Dit verhindert dat fouten op een station leiden tot gegevensverlies. OS
Operating System. Besturingssysteem. Pariteit
Bij computers verwijst pariteit gewoonlijk naar een procedure voor foutcontrole waarbij het aantal enen altijd hetzelfde moet zijn - oneven of even - voor elke groep bits die zonder fouten verzonden wordt. Pariteit wordt gebruikt voor het controleren van gegevens binnen een computer of tussen computers. Pariteitsbit
Extra bit die aan een byte of een word wordt toegevoegd om te zorgen dat de pariteit altijd even of oneven is. RAID
Redundant Arrays of Inexpensive Disks.
Redundant Arrays of Independent Disks.
Een standaard voor fouttollerantie met verscheidene niveaus. De niveaus bieden verscheidene combinaties van prestaties, betrouwbaarheid en kosten.
Redundantie
Herhaald voorkomen van dezelfde informatie. Restoren
Het herstellen van gegevens van een defecte harde schijf. SCSI controller
Small Computer Systems Interface. Een interface om maximaal 7 apparaten per controller aan te sluiten. SCSI (skoezi) bestaat in vele varianten en wordt veel gebruikt om harde schijven en CD-ROM\'s aan te sluiten op high-end PC\'s, werkstations en minicomputers. Striping
Het verdelen van gegevens over een aantal logische schijven om zo de prestatie van een disksysteem te vergroten. RAID maakt hier o.a. ook gebruik van. Stripe-set
Een stripe set combineert meerdere gebieden met ongeformatteerde vrije ruimte tot één grote logische drive. Stripe sets kunnen gebieden op verschillende soorten schijven combineren, zoals SCSI-, ESDI- en IDE-schijven. Bronvermelding Zoals ik al zei in de inleiding, heb ik o.a. met RAID kennisgemaakt via het internet. Ik ben hier dus ook het eerste weer gaan zoeken. Er bleek weinig aanbod te zijn in informatie die ik nodig heb. Ik ben ook bij de bibliotheek langs geweest. Ik heb hier niets relevants kunnen vinden. Ik heb niet meer informatie kunnen vinden, dus ben ik verder gaan spitten op het World Wide Web. Bronnen
Advanced Computer & Network Corporation
http://www.acnc.com/ Nederlands Computerwoordenboek
http://www.computerwoorden.nl/ Tip World
http://www.geocities.com/gearcy1031/Tipworld/ Tweakers
http://www.tweakers.net/ Ming Automatisering
http://www.ming-automatisering.nl/ Nedcomp Hosting
http://www.nedcomp.nl/ P&R Systemen
http://www.p-rsystemen.nl/
Levels
Raid0
Raid1
Raid10
Raid 0+1
Raid2
Raid3
Raid4
Raid53
Raid5
Raid6
Raid7 Hot-swappable
Hot-swappable Conclusie
Conclusie en advies Bijlagen
Woordenlijst
Bronvermelding Inleiding Onderwerpkeuze Korte inhoud
In deze inleiding wil ik o.a. vertellen hoe ik bij mijn onderwerpkeuze gekomen ben, wat mijn eerste indrukken over deze technologie waren vóórdat ik me er in ging verdiepen, en ik wil alvast enkele punten uitlichten die ik in het verslag wil verdiepen. Hoe ben ik bij mijn onderwerp gekomen? Ik had al meerdere keren van de RAID-systemen gehoord, o.a. via computermagazines en het internet. Ik had al eens een verslag gezien van iemand die ook geïnteresseerd was in de mogelijkheden van deze techniek, en hij vertelde me dat het heel goed mogelijk was om dit onderwerp te gebruiken voor een stageverslag. Zoals ik al zei, was een van mijn eerste bronnen het internet. Op een site die ik vaak bezoek, is een test van IDE-RAID ter sprake gekomen. (www.tweakers.net) Via deze site ben ik te weten gekomen dat RAID ondermeer gebruikt wordt om van meerdere harde schijven één logische schijf te maken. Ik vond dit allemaal wel interessant, maar verdiepte me er verder niet in. Een tijdje later, gedurende mijn stage, kwam het weer ter sprake. Op de afdeling assemblage van PCR/Bilderbeek moest ik een PC in elkaar zetten. Op het moederbord zat een RAID-controller. Het onderwerp schoot me ineens weer te binnen, en ik besloot dit als onderwerp te nemen voor mijn stageverslag. Ik heb me in het begin vooral georiënteerd met behulp van Tweakers. In het artikel werd kort iets verteld over de geschiedenis van RAID en de verschillende varianten. Ik heb besloten me vooral te richten op de hardwarematige kant van de zaak, en dan met name op de verscheidene varianten. Allereerst wil ik in het kort iets vertellen over de voorgeschiedenis en de ontwikkeling die de technologie heeft doorgemaakt.
RAID is, van oorsprong, een manier van combineren van harde schijven, waardoor er uit meerdere kleine HD’s een grote schijf ontstaat. Deze functie is in de loop der tijd, toen grotere schijven goedkoper werden, verloren gegaan en vervangen door andere eisen, namelijk het verbeteren van de betrouwbaarheid of de prestaties van een harde schijf configuratie. De afkorting RAID staat voor Redundant Array of Independent Disks, een groep onafhankelijke schijven waarop informatie wordt opgeslagen. Er zijn verschillende varianten van RAID, ‘levels’ genaamd. De twee meest gangbare levels zijn Raid 1 en Raid 5. Ik zal later dieper ingaan op de verschillen tussen de verscheidene levels. RAID zorgt ervoor dat een server kan doorgaan met zijn werkzaamheden, wanneer een van zijn harde schijven defect raakt. Er is weinig tot niets dat wijst op een defecte schijf, een tijdelijke vermindering van de prestaties (m.a.w. de server lijkt ‘langzamer’ te lopen) kan voorkomen. De schijf kan vervangen worden, terwijl de server kan doordraaien. Men noemt dit een hot-swappable systeem. RAID maakt het openen en opslaan van bestanden en applicaties sneller, doordat hij het lezen en schrijven over meerdere schijven verdeelt. Of hier in huis-tuin-en-keuken situaties ook voordeel mee wordt behaald, hangt voornamelijk af van het soort programma’s, dat er gedraaid wordt. Bij het werken met bijvoorbeeld grote audiovisuele bestanden zijn er zeker voordelen te bemerken, doordat de tijd die nodig is voor het opslaan en terughalen van zulke bestanden behoorlijk wordt ingekort. Ook in het bedrijfsleven heeft het gebruik van een RAID-systeem zeker voordelen. Doordat alle gegevens als het ware ‘dubbel’ opgeslagen worden, is een verlies van belangrijke data bijna volkomen uitgesloten. Door het gebruik van hot-swappable schijven kan een server die 24 uur per dag moet werken, ook echt de garantie geven dat hij 24/7 kan draaien. Bij een eventueel defect in een van zijn schijven kan deze vervangen worden zonder dat de PC uitgeschakeld moet worden. Natuurlijk biedt dit ook mogelijkheden voor thuissituaties waar belangrijke data op de computer is opgeslagen. Geschiedenis Hoe is RAID ontstaan? Waarom ontwikkelde men RAID? In de jaren 80, aan het ‘begin’ van het Personal Computing tijdperk zoals we dat nu kennen, lagen de prijzen van allerlei hardware onderdelen behoorlijk wat hoger dan tegenwoordig, nu de artikelen voor bodemprijzen over de toonbank vliegen. Zo ook de prijzen van HD’s. Vooral ‘grotere’ harde schijven (bijvoorbeeld een harddisk van 20 MB, wat in die tijd al heel wat was), waren relatief gezien veel hoger geprijsd dan de kleinere. Met dit gegeven in hun achterhoofd hebben een aantal mensen het plan gevat om die kleinere HD’s aan elkaar te koppelen m.b.v. een array, om zo 1 grote schijf te creëren. Vier harde schijven van 5 MB in plaats van een schijf van 20 MB zou namelijk een aanzienlijke prijsbesparing opleveren. Zie hier het eerste geval van RAID. In 1988 kwam de Californische Berkeley University met een publicatie, waarin zij het bouwen van zulke arrays beschrijven. Deze publicatie was getiteld ‘A case for Redundant Arrays of Inexpensive Disks’. In de loop van de tijd is RAID veranderd. Er zijn meer vormen (levels) bijgekomen, en de betekenis van de afkorting RAID is gewijzigd. Vroeger lag bij de functie van RAID het accent veel meer op kostenbesparing. Dit is ook te zien in de betekenis van de afkorting. Redundant Arrays of Inexpensive Disks, vrij vertaald als overtollige groepen van goedkope schijven, is later veranderd in Redundant Arrays of Independent Disks, overtollige groepen van onafhankelijke schijven. Het accent is verschoven van kostenbesparing naar fouttolerantie. Lange tijd hebben alleen SCSI configuraties gebruik kunnen maken van de RAID technologie. Omdat voor het gebruik van RAID de aansluiting van meerdere harde schijven op een controller noodzakelijk is, was het zeer moeilijk om deze techniek toe te passen op een IDE configuratie, aangezien deze slechts 2 apparaten per controller toelaat, waar SCSI er 7 kan herbergen. Om gebruik te maken van RAID op een IDE configuratie is een zogenaamde RAID controller nodig. In 1997 kwam het bedrijf Promise met de allereerste RAID controller voor IDE configuraties. Inmiddels is IDE-RAID definitief doorgebroken en bouwen verscheidene fabrikanten de RAID controllers op hun moederborden. RAID levels Verschillende varianten Verdeelbaar in groepen
Zoals ik net al heb gezegd, zijn er verschillende varianten van de RAID-technologie. Deze varianten noemt men levels. Kort samengevat zitten de verschillen tussen deze levels vooral in de manieren waarop de gegevens over de schijven verdeeld worden (striping), waarop er redundantie ontstaat (mirroring), waarop de fouten worden gecontroleerd (pariteit en ECC) en de manier waarop de foutcontrolegegevens over de schijven verdeeld worden. Je kunt de RAID-levels grofweg indelen in de volgende groepen. Levels Karakteristieke eigenschappen
Raid0 Alleen striping
Raid10
Raid 0+1 Combinatie van Raid0 en Raid1
Raid2 Striping met ECC
Raid3
Raid4 Opslag pariteitsbit op gespecialiseerde schijf
Raid53 Combinatie Raid3 en Raid0
Raid5
Raid6 Verdeling pariteitdata over schijven
Raid7 Pariteitdata op gespecialiseerde schijf
Controle door real-time OS
In de komende hoofdstukken zal ik dieper ingaan op de levels. RAID 0 Striping 1 logische schijf Redundantie
Raid0 is het eerste RAID level die ik zal beschrijven. Dit is de techniek die in 1988 door de Berkeley Universiteit werd beschreven, als een methode om van verschillende HD’s 1 logische schijf te maken. Deze techniek geeft geen redundantie, en wordt daarom niet echt als een RAID-techniek beschouwd, vandaar de aanduiding Raid0 i.p.v. bijvoorbeeld Raid1. Raid0 combineert de ongeformatteerde vrije ruimte van meerdere schijven (vanaf 2 tot maximaal 32) tot één grote logische drive. Bij alle vormen van RAID is het zo, dat als meerdere schijven worden verenigd tot een logische drijf, de capaciteit van deze schijf gelijk is aan de allerkleinste in de array. Een voorbeeld: je hebt 3 schijven, een van 3, een van 4 en een 5 GB. De totale capaciteit in een RAID-configuratie is dan 9 (3x3) i.p.v. 10 (3+4+5) GB. Gegevens worden in blokken verdeeld en over alle schijven verdeeld, telkens een blok tegelijk. Dit proces van in stukken delen en verdelen over meerdere schijven wordt ‘striping’ genoemd. Sommige systemen stripen op een bepaald aantal blokken (alle data wordt in een vast aantal blokken verdeeld), andere stripen op een bepaalde grootte van de blokken (de data wordt verdeeld in een aantal blokken van een vastgestelde grootte). Doordat bij Raid0 de data over meerdere schijven wordt verdeeld, wordt de lees- en schrijfsnelheid van de PC aanzienlijk vergroot. Hoe meer schijven er in een configuratie geplaatst worden, hoe meer de I/O load gespreid wordt, en hoe meer de prestaties van het systeem zullen verbeteren. Theoretisch is een verbetering van 100% mogelijk. Dit is het grootste voordeel van Raid0. Het grote nadeel van Raid0 ligt in het totaal ontbreken van redundantie. Wanneer een schijf in de stripe-set het begeeft, is alle data verloren. Dit zorgt ervoor dat Raid0 onbruikbaar is voor het opslaan van belangrijke gegevens. Het ontbreken van redundantie zorgt echter ook weer voor een tweede voordeel, namelijk het volledig behoud van de schijfruimte. Wanneer er sprake is van redundantie wordt de schijf nooit volledig gebruikt, omdat (een deel van) de gegevens dubbel op de schijf gezet wordt. Raid0 kan met name gebruikt worden wanneer de snelheid belangrijker is dan het behoud van de gegevens, zoals bij het opslaan van tijdelijke bestanden. Hier is een illustratie die het stripen misschien nog iets kan verduidelijken. RAID 1 Mirroring Redundantie
Het is zeer goed mogelijk om de verschillende RAID-levels te combineren. De bekende combinatievormen zijn Raid 0+1, Raid10 en Raid 53. Raid 10 is een samenvoeging van een niveau-0 en een niveau-1 RAID-configuratie. Bij Raid0 en Raid1 staan het stripen en het mirroren van de gegevens centraal. Door het stripen van de gegevens is een verhoogde lees- en schrijfsnelheid mogelijk, maar is er geen enkele redundantie. Bij mirroring is er sprake van een extra beveiliging d.m.v. het kopiëren van gegevens naar een tweede schijf, waardoor er redundantie ontstaat. Door het combineren van striping en mirroring hef je het grootste nadeel van het stripen op, terwijl de voordelen behouden blijven. De schijven worden in takken verdeeld, elke tak bestaat uit 2 schijven. Zoals te zien is, wordt de data eerst over de takken verdeeld. Dit is het striping-gedeelte van het proces. De stripes worden op beide schijven van een tak geschreven, zodat beide schijven dezelfde informatie bevatten. Dit is het mirroren. Voor een Raid10 configuratie zijn minimaal 4 schijven nodig. Een configuratie moet bestaan uit 2 takken, waar de gegevens over gestriped worden. Elke tak bestaat uit 2 schijven, zodat de ene schijf de andere kan spiegelen. Een Raid10 configuratie levert een grotere leessnelheid, doordat de I/O load over meerdere schijven verdeeld wordt. Een groot nadeel van zulk een configuratie is echter de dubbele hoeveelheid schijven die je nodig hebt. Dit drijft de kosten huizenhoog op. Een groot voordeel van Raid10 is het feit dat er een onbeperkt aantal schijven mag uitvallen, zolang er maar niet 2 schijven uit een tak defect raken. RAID 0+1 Combinatie van Raid0 en Raid1 Vaak verward met Raid10
Twee RAID-levels die vaak met elkaar verward worden, zijn Raid10 en Raid 0+1. Beide zijn combinaties van Raid0 en Raid1, maar ze zijn (ondanks dat veel mensen dit denken) niet hetzelfde! Het venijn zit hem in de manier op er gestriped wordt. Bij Raid10 wordt de informatie over takken gestriped en gemirrored op de 2 schijven die een tak vormen. Bij Raid 0+1 worden de data gestriped over de helft van de harde schijven, en deze helft wordt gemirrored over de andere helft van de schijven. In het voorbeeld op de illustratie wordt de data eerst gestriped over de eerste twee schijven. Hierna wordt de data van deze twee schijven gemirrored over twee volgende schijven. Raid 0+1 heeft dezelfde nadelen als een Raid10 configuratie, namelijk een opslagcapaciteit die door twee gedeeld wordt. Als er een schijf uitvalt, verandert de complete configuratie in een Raid0 systeem. De data is dan alleen nog gestriped, omdat de gemirrorde schijf is uitgevallen. In essentie kun je dan spreken van een Raid0 config. RAID 2 ECC Niet meer gebruikt
Het derde RAID level wordt gevormd door een configuratie met tenminste 3 schijven. Een van deze schijven dient enkel om een pariteitsbit op te slaan. De informatie wordt gestriped over de 2 eerste schijven, en op de derde schijf wordt een pariteitsbit geschreven. Doordat deze schijf meer gebruikt wordt dan de andere 2, heeft hij meer kans om uit te vallen. De blauwe schijven 1 t/m 4 zijn de opslagschijven, de rode schijf 5 is de pariteitschijf. Mocht er onverhoopt een schijf uitvallen, dan kan alle data hersteld worden door deze te reconstrueren uit de informatie van de andere schijven. Het verlies van twee schijven tegelijkertijd is echter onoverkoombaar. Het voordeel van Raid3 is vooral de verhoging van het read- and write tempo door het verdelen van de taken over meerdere schijven. Door de pariteitcontrole is het mogelijk om zonder problemen 1 schijf te verliezen. De verhouding pariteitschijven/opslagschijven is zo laag mogelijk, omdat er maar 1 pariteitschijf nodig is. Het aantal beschikbare opslagschijven is dus het totaal aantal schijven min 1. RAID 4 Verdeling in blokken Pariteitschijf
Raid4 werkt op eenzelfde manier als Raid3. Bij Raid3 wordt de data in stripes verdeeld en deze stripes worden over de schijven gedeeld. Bij Raid4 worden de gegevens in grote blokken verdeeld, en deze worden over de schijven gezet. Weer wordt een aparte disk gebruikt om de pariteitsbit op te slaan. Raid4 werkt op eenzelfde manier als Raid3, zoals te zien is als je deze illustratie vergelijkt met die van een Raid3 configuratie. Het lezen van de gegevens gaat sneller dan bij een Raid3 configuratie, omdat de gegevens in grote blokken op de schijf staan. Raid4 geeft dezelfde voordelen als een Raid3 systeem. Tegenwoordig wordt Raid4 weinig meer gebruikt, omdat het geen voordelen biedt tegenover het bekende Raid5. RAID 53 Combinatie van Raid0 en Raid3 Schijven verdeeld in takken Vergelijkbare opbouw met Raid10
Als je een server onderzoekt, waar beschikbaarheid van de gegevens van vitaal belang is, heb je groot kans dat je een Raid5 configuratie vindt. Raid5 combineert alle voordelen van de RAID-technologie (redundantie, verhoogde leessnelheid) en reduceert de nadelen (extra schijven) tot een minimum. Het systeem stripet de gegevens over de harde schijven, en maakt een pariteitsbit. De verscheidende pariteitsbits worden ook over de harde schijven verdeeld, zodat er geen speciale pariteitschijf nodig is. Mocht er een schijf uitvallen, dan is dit geen ramp. Met behulp van de pariteitsbits en de gegevens op de andere schijven kan het systeem de data van de verloren schijf restoren. Dit terugrekenen kost processorkracht en gaat niet zo snel als bij bijv. een Raid1 configuratie, waar de gegevens alleen van de mirrorschijf naar de dataschijf moeten worden gekopieerd. De voordelen van Raid5 zijn de hoge leessnelheid, de foutcontrole en de mogelijkheid om de data te herstellen als er een schijf uitvalt. Een nadeel is de verlaagde schrijfsnelheid. Dit alles maakt Raid5 erg geschikt voor read-only systemen. RAID6 Tweede set pariteitsdata
Raid6 is duidelijk een voortborduursel op het Raid5 systeem. Waar bij Raid5 er maar een schijf defect mocht raken, is het bij Raid 6 mogelijk om de configuratie door te laten draaien als er meerdere schijven uitvallen. Bij dit RAID-level worden de gegevens over de schijven gestriped, zoals bij Raid5 ook het geval is. Er worden pariteitsbits aangemaakt, die over de schijven worden verdeeld. Het grote verschil met Raid5 zit hem in deze pariteitsbits. Waar Raid5 gebruik maakt van een pariteitsbit, berekent het Raid6 systeem nog een tweede set pariteitgegevens. Hierdoor is het mogelijk dat de gegevens teruggezet worden als er meerdere schijven uitvallen. Verder is Raid6 compleet gelijk aan Raid5, met dezelfde voor- en nadelen. RAID 7 Pariteit langs een real-time OS Pariteitsdata geïntegreerd in cache
Hot-swappable wil zeggen dat een onderdeel van een configuratie kan worden vervangen, terwijl de server gewoon doordraait. Dit is meestal van toepassingen op de harde schijven van een server en heeft belangrijke voordelen. Het voordeel van hot-swappable harddrives is dat storingen sneller kunnen worden verholpen en, in combinatie met harddisks in een RAID-configuratie, de gebruikers van een server niet eens hoeven te merken dat een harde schijf wordt vervangen. Ook kunnen de werkzaamheden dan overdag worden uitgevoerd, hetgeen een kostenbesparing met zich mee brengt en er voor kan zorgen dat de storing minder lang voortduurt. Bij het falen van een harde schijf, die is opgenomen in een RAID-configuratie, hoeft dus niet te worden gewacht tot het gebruik van de server minimaal is en de server offline kan, mits de harde schijven hot-swappable zijn. Het gebruik van hot-swappable HD’s heeft het meeste zin in combinatie met een RAID-configuratie, omdat alleen dan een server blijft functioneren wanneer een harde schijf het begeeft. De harde schijf kan dan uit de server worden getrokken en een nieuwe schijf kan worden teruggezet. Dit alles terwijl de server gewoon door blijft serveren. Om harde schijven hot-swappable te maken, moet de server een controller bevatten die dat ondersteunt en ook de serverkast moet er geschikt voor zijn. Vanzelfsprekend moeten de harde schijven zelf ook hot-swappable zijn, anders kunnen deze defect raken en andere storingen veroorzaken. Conclusie Afweging kosten/veiligheid Thuissituatie/bedrijfsleven
Na alle informatie die ik heb kunnen verkrijgen, wil ik bij deze tot een slotoverweging komen. Het is natuurlijk erg simpel om te zeggen dat de RAID-technologie alleen maar voordelen biedt, of omdat de voordelen de nadelen bij verre overtreffen. Het is meer mijn idee om hier een voorbeeld te nemen van het meest gebruikte RAID-level, en zijn voor– en nadelen nog een keer duidelijk tegen elkaar af te wegen. Het meest gebruikte RAID-level is Raid5. De nadelen van een dergelijk systeem onder SCSI (SCSI omdat bij grootschalig professioneel gebruik 2 schijven niet voldoende zijn) zijn vooral de kosten. Je hebt allereerst de afweging SCSI/IDE, waarbij een SCSI controller in elk geval duurder is dan een IDE controller. Een verdere verhoging van de kosten wordt bewerkstelligd doordat je een deel van de schijfruimte verliest aan de pariteitsbit. Deze schijfruimte had je behouden als je de schijven in een normale master/slave configuratie had geplaatst. De voordelen van een Raid5 configuratie beperken zich niet alleen tot prestatieverhoging (verhoogde leessnelheid), maar leveren ook een verbeterde veiligheid door de redundantie. Door de redundantie is het mogelijk dat er een schijf uitvalt, en alle data van deze schijf hersteld kan worden m.b.v. van de pariteitgegevens op de andere schijven. Verder maakt Raid5 het mogelijk om defecte schijven te vervangen terwijl de PC doordraait, als men gebruik maakt van een hot-swappable systeem met hot-swappable schijven. Voor een gewone huis-tuin-en-keuken PC heeft het gebruik van RAID op deze manier geen enkel nut, of beter gezegd: de nadelen wegen niet op tegen de voordelen. Het is gewoon de moeite niet, de kosten niet waard. Maar in een situatie waar een PC 24/7 operationeel moet zijn en waar verlies van data onvermijdelijk tot problemen zou leiden, bijvoorbeeld de server die een website continu online moet houden, wordt het gebruik van zo’n systeem ineens in een heel ander licht geplaatst. Nu zijn de voordelen ineens van immens belang. De eigenaar van de voorgenoemde server heeft er hoogstwaarschijnlijk het extra geld wel voor over, als er een systeem wat hem kan garanderen dat de PC continu kan doordraaien als er een harddisk defect raakt. Raid53 kan die garantie geven, als hij gebruik maakt van hot-swappable schijven. Voor het bedrijfsleven biedt RAID dus zeker mogelijkheden, en is het gebruik van dit systeem de moeite waard, in ieder geval om het te bekijken en te overwegen. Verklarende Woordenlijst Array
Een speciaal geheugen-subsysteem als onderdeel van het RAM waarin veelgebruikte gegevens worden gekopieerd om snel toegang te hebben. Configuratie
Alle onderdelen die samen een computersysteem vormen. ECC-functie
Error Checking and Correction. Het proces van foutcontrole en foutherstel. Hamming Code
Een bitpatroon dat werd aangevuld extra controlebits, om enkelvoudige fouten en burst-fouten te ontdekken. Hot-swappable
De mogelijkheid om een onderdeel van een toestel te vervangen zonder dat de werking van het toestel wordt onderbroken. IDE controller
Intelligent Drive Electronics. Deze standaard houdt onder andere in, dat er geen intelligentie aanwezig is in de controller en er veel intelligentie in de harddisk zit. Er kunnen maximaal maar twee drivers op een IDE controller worden aangesloten. Levels
Een niveau of variatie waarop de RAID-technologie wordt toegepast. Logische Schijf
Een IDE-configuratie waarbij twee IDE-apparaten worden aangesloten op de IDE-controller. Een van de apparaten wordt benoemd als master, de ander als slave. Mirror Configuratie
Raid1 configuratie. Mirroring
Een maatregel voor fouttolerantie waarbij gegevens via een controller op verschillende redundante vaste schijfstations worden geschreven. Dit verhindert dat fouten op een station leiden tot gegevensverlies. OS
Operating System. Besturingssysteem. Pariteit
Bij computers verwijst pariteit gewoonlijk naar een procedure voor foutcontrole waarbij het aantal enen altijd hetzelfde moet zijn - oneven of even - voor elke groep bits die zonder fouten verzonden wordt. Pariteit wordt gebruikt voor het controleren van gegevens binnen een computer of tussen computers. Pariteitsbit
Extra bit die aan een byte of een word wordt toegevoegd om te zorgen dat de pariteit altijd even of oneven is. RAID
Herhaald voorkomen van dezelfde informatie. Restoren
Het herstellen van gegevens van een defecte harde schijf. SCSI controller
Small Computer Systems Interface. Een interface om maximaal 7 apparaten per controller aan te sluiten. SCSI (skoezi) bestaat in vele varianten en wordt veel gebruikt om harde schijven en CD-ROM\'s aan te sluiten op high-end PC\'s, werkstations en minicomputers. Striping
Het verdelen van gegevens over een aantal logische schijven om zo de prestatie van een disksysteem te vergroten. RAID maakt hier o.a. ook gebruik van. Stripe-set
Een stripe set combineert meerdere gebieden met ongeformatteerde vrije ruimte tot één grote logische drive. Stripe sets kunnen gebieden op verschillende soorten schijven combineren, zoals SCSI-, ESDI- en IDE-schijven. Bronvermelding Zoals ik al zei in de inleiding, heb ik o.a. met RAID kennisgemaakt via het internet. Ik ben hier dus ook het eerste weer gaan zoeken. Er bleek weinig aanbod te zijn in informatie die ik nodig heb. Ik ben ook bij de bibliotheek langs geweest. Ik heb hier niets relevants kunnen vinden. Ik heb niet meer informatie kunnen vinden, dus ben ik verder gaan spitten op het World Wide Web. Bronnen
http://www.acnc.com/ Nederlands Computerwoordenboek
http://www.computerwoorden.nl/ Tip World
http://www.geocities.com/gearcy1031/Tipworld/ Tweakers
http://www.tweakers.net/ Ming Automatisering
http://www.ming-automatisering.nl/ Nedcomp Hosting
http://www.nedcomp.nl/ P&R Systemen
http://www.p-rsystemen.nl/
REACTIES
1 seconde geleden
E.
E.
Bedankt voor het werkstuk, nu hoef ik het tenminste niet meer te maken!
21 jaar geleden
AntwoordenV.
V.
hey tamara ik heb je verslag gelezen heb je iets meer over raid toevallig ik moet ook ove het pakket raid 5 file server verslag maken kan je me wat latern horen alvast bedankt xxx vaqzs xxx
20 jaar geleden
AntwoordenP.
P.
Het is een mooi werkstuk! Ik vind het alleen jammer dat de plaatsjes er niet op staan.
gr.
20 jaar geleden
Antwoorden