Bez diskova se ne može
- autor Ivan Voras
- pon 12.1.2009
- 12:36
Diskovi su danas neizbježni uređaji za pohranu podataka u svim prilikama, ali daleko od toga da su svi jednakih karakteristika. Zbog naravi tehnologije, ali i zahvaljujući tome što kod diskova dugo nije bilo značajnog tržišnog monopola (za razliku od nekih drugih komponenata kao što su procesori), ponuda je vrlo šarena i različitih karakteristika. Ako se u priču doda stvaranje RAID kombinacija, izbor postaje neuobičajeno težak. Kod komponenata kao što su memorija i procesori izbor je u principu jednodimenzionalan: jednom kada se ustanove tehnologija i mogućnosti, izbor se svodi na “više je bolje.” Kod diskova je situacija složenija: brži diskovi su manji, više se griju i dolaze s posebnim tehnologijama spajanja na računalo. RAID strukture imaju različite karakteristike performansi koje ovise o podacima koji su pohranjeni te različite garancije pouzdanosti koje ovise o vanjskim utjecajima. Na sve ovo dolaze datotečni sustavi koji imaju različite pretpostavke, performanse i garancije. Da bi situacija bila još zanimljivija, upravo je u tijeku smjena tehnologija i početak masovnog korištenja elektroničkih diskova bez pokretnih (mehaničkih) dijelova. Zbirni rezultat ovih faktora neobična je kompliciranost u izboru ispravne i ekonomične infrastrukture za pohranu podataka.
Karakteristike diskova
Klasični mehanički diskovi imaju nekoliko važnih osobina koje su izravna posljedica načina na koji rade. Najuočljivije su među njima rotacijska latencija (vrijeme dok se ispod glave za čitanje ili pisanje ne nađe traženi dio stalno rotirajuće ploče) i latencija pomicanja glave (vrijeme dok se glava ne pomakne na ispravnu poziciju da dočeka traženi dio ploče). Ove su dvije fizikalne osobine u modernim diskovima povezane jer elektronika često odlučuje izvoditi operacije nad cijelim kružnim segmentom diska (track) te se korisniku predstavlja jedna mjerljiva osobina: vrijeme traženja (seek time). Ovo vrijeme nije konstantno za sve pozicije na disku jer je linearna brzina rotacije ploča veća pri sredini ploča, a manja na krajevima, zbog čega variraju brzine čitanja i pisanja. Kombinacijom vremena traženja i brzine čitanja i pisanja dolazi se do osobine koja je zapravo korisna u stvarnoj primjeni: broj (slučajnih) operacija u sekundi (IOPS - IOs per second).
Na temu optimizacije broja operacija u sekundi napravljeno je mnogo istraživanja, ali na kraju ostaje rezultat da se od fizikalnih osobina ne može daleko pobjeći i jedini siguran način da se ovo vrijeme smanji jest povećanje brzine rotacije ploča u diskovima. Povećana brzina rotacije zahtjeva bržu i precizniju mehaniku i elektroniku, čime sve postaje skuplje, a ima za posljedice veću osjetljivost na mehaničke događaje (trešnja, udarci) i znatno povećano grijanje. Cilj, dakle, nije u svakom slučaju uzeti najbrže diskove, nego samo kada su oni stvarno potrebni.
Brzi diskovi (misli se na brzinu okretanja odnosno broj okretaja u sekundi) potrebni su u slučajevima kada je na aplikacijskoj razini važno imati što više transakcija u sekundi. Klasični su primjer za ovo baze podataka: ako je baza dovoljno velika i stalno se koristi, proizvoljna će dva podatka u njoj biti pohranjena dovoljno daleko na disku da će ih trebati zasebno tražiti i pročitati, što znači barem dvije zasebne operacije. Pri ovome je važno imati na umu da je “baza podataka” ovdje širok pojam koji obuhvaća, među ostalim, i današnje e-mail sandučiće, te na kraju i sam datotečni sustav.
Zbog toga što su slučajne transakcije raštrkane po trakama, za diskove brzine 7.200 okretaja u minuti (RPM) se uzima da mogu izvesti maksimalno 120 operacija u sekundi. Ovaj rezultat linearno raste s brojem okretaja, što znači da najbrži diskovi (15.000 RPM) mogu dati tek oko 250 IOPS u najboljem slučaju, a često se za ostavljanje margine uzima sigurna vrijednost od 200 IOPS. Vrijedi podsjetiti da ovaj rezultat vrijedi u slučaju sinkronih operacija (bez cachea) koje rade s podacima koji nisu “blizu” na disku. Današnje baze podataka i datotečni sustavi mogu postići rezultate puno veće od toga korištenjem cachea i optimiziranjem smještaja podataka tako da se nalaze na istoj traci diska. Ideja kod ovoga jest da jedna logička operacija pročita što veći broj podataka, na primjer ako su direktorij datoteka i indeks baze relativno mali i smješteni slijedno na disku te se jednim upitom može dohvatiti cijeli traženi skup podataka.
Jedna od bitnijih razlika između diskova za desktop i onih za poslužitelje jest način korištenja cache memorije ugrađene u elektroniku diska. Diskovi za desktop imaju određene količine memorije (tipično 16 MB ili 32 MB) koja se koristi za čitanje, ali i za pisanje. Korištenje cache memorije za čitanje je uvijek sigurno, ali podaci koji su zapisani samo u cache, a ne i fizički na diskove bit će nepovratno izgubljeni u slučaju nestanka struje (a u slučaju lošijih diskova starije generacije, čak i ako se dogodi iznenadni reboot računala). Koliko ovo može biti štetno ovisi o tome koji podaci se pohranjuju – ako se zapisuje sektor unutar velike datoteke s filmom, sve što je izgubljeno jest nekoliko piksela slike, ali ako se zapisuje indeks baze ili direktorij datotečnog sustava, rezultati mogu biti katastrofalni.
izdvojeni tekstovi - veljača 2009.
Equisys Zetadocs PDF
Tvornica dokumenata uto 20.1.2009
Veljača 2009.
Gazda sistema pon 12.1.2009
Cisco ACE Web Application Firewall i XML Gateway
Pametni vatrozid pon 12.1.2009
System Center Essentials
Jedan za sve pon 12.1.2009
Microsoft Expression Studio 2
Od igle do lokomotive pon 12.1.2009
RAID i datotečni sustavi
Bez diskova se ne može pon 12.1.2009
DMCA
Kako je DMCA promijenio Internet pon 12.1.2009
IT i gospodarska kriza
Nezvani gost pred vratima pon 12.1.2009
FER i Siemens: Maslinet
Priča iz maslinika 2 pon 12.1.2009
Web 3.0
Lik stvari koje dolaze pon 12.1.2009
Oleg Maštruko
Zimsko smrzavanje pon 12.1.2009















