HP Proliant szerver, raid, debian és egyéb finomságok.

Fórumok

Sziasztok!

Vásárolt a cégünk egy HP Proliant ML110 G5 típusú kis szervergépet és az én feladatom életet lehelni belé. Viszont lenne pár dolog, amiben nem vagyok biztos, úgyhogy ezeket inkább kérdés formájában teszem fel itt. (Kéretik nem letépni a fejem, nem vagyok kimondott linux guru és ez az első témaindításom itt.)

Tehát: Két HP által aláírt SATA-II-es diszk van került bele, ezeket az alaplapi RAID vezérlővel RAID-1 módba állítottam (azaz állítom, mert épp most írja tele nullákkal a diszkeket.) Azért RAID-1 mivel webhosting célokra lesz használva a gép. Ezenkívül került még bele egy PCI-os IDE vezérlő, rá a két másik merevlemezzel megegyező méretű másik IDE lemez, ez azért kell, hogy a tükrözés mellé még legyen egy különálló diszk a biztonsági mentéseknek.
Na mármost, első kérdés: Ez az elgondolás mennyire állja meg a helyét? Második és egyben izgalmasabb kérdés: Debian fog kerülni rá, melyiket ajánljátok? Etch, Etch'n'half vagy lenny? Valamint fel fogja ismerni nekem a telepítéskor a létrehozott RAID-1 tömböt vagy szívni fogok vele egy jó nagy sort? Igazából a sima Etch-t ha lehet hanyagolnám, mert a default kernellel nem működnek rendesen a verlihubok.

Na előre is köszönöm, ha valaki erre téved és segítő szándékú hozzászólással bombáz meg.

Üdv.!

Hozzászólások

"ezeket az alaplapi RAID vezérlővel RAID-1 módba állítottam"

Ez az alaplapi RAID vezérlő nekem gyanús. Írom ezt úgy hogy nem ismerem a HP gépet. Szerintem vagy vegyél bele egy RAID kártyát (ez megközelíti a géped árát), vagy SW raidet csinálj rajta.

Amúgy meg azt rakj fel OS-nek, amit ismersz és stabil.

Én egy ugyanilyen típusú gépen ezt a kérdést ubuntu server 8.04 64bit rendszeren szoftver raid-el oldottam meg. tökéletesen működik és stabil.
::sumo.conf::

Na hát már megérte kérdezni, ugyanis nem tudtam, hogy az alaplapi megoldás ennyire rossz minőségű lenne. Akkor azt mondjátok egyáltalán ne is erőltessem, hanem maradjak a szoftveres raidnél? Ugyanolyan biztonságos, mintha hardveres raid végezné a tükrözést? (Mert itt elsősorban a biztonság lenne a lényeg.)

Valamint, hogyha Debian alatt szeretném életre kelteni ezt a szoftveres megoldást, akkor merre induljak el? Egy link, vagy oldal, ami ezt taglalja nagy segítség lenne.

A szoftver raid elvileg rosszabb hatásfokú, mint a hardveres, de amint a tények mutatják, a modern számítógépeknél ez már nem mindig van így. Valóban, Google-vel sok jó raid-es oldalt találsz, én is így csináltam meg, nagyjából tíz perc után megvolt. (Na jó, tudtam hogyan, csak a paraméterek pontosítása könnyebb így, mint manualt böngészni).

Nem azt mondtam, hogy mindenhova hw raid kell, hanem azt, hogy a hw raid gyorsabb. Amikor azt írtad, hogy az sw raid néha nagyobb hatásfokú mint a hw raid, akkor szerintem az ilyen kamu hw raidekre gondoltál, mert egy igazi hw raidtől soha nem lesz nagyobb hatásfokú az sw.

Azt aláírom, hogy sokszor felesleges a hw raid.

Nekem ML150G5-om van, Ubuntu 8.04 server ment ra, egyetlen kis fennakadas volt: a lilo-nak a large-memory opciot meg kellett adni, es ez kicsit nehezen volt megoldhato. Mielott a grub-al jottok, valamiert nekem a lilo-t dobta fel az Ubuntu telepito, gondolom az LVM miatt.

Az alaplapi "raid" vezerlot felejtsd el. Sokkal gyengebb teljesitmenyu mint akar a kernel sw raid.

Az alaplapi a ML110-ben csak fakeraid tudtommal, legalábbis a G3-ban még az volt. Jobban jársz a soft-raiddal.

Nem kapcsolódik szervesen a témához, viszont gondoltam megkérdezek más ml110g5 használókat.
Kb 3-4 hete sikerült hozzájutnom egy használt darabhoz.Ubuntu 8.0.4 került rá, minden szép és jó volt, amig nem néztem egy smartctl kimenetet.


smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     GB0250C8045
Serial Number:    9SF0F4C0
Firmware Version: HPG2
User Capacity:    250.059.350.016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 4a
Local Time is:    Wed Oct 29 20:03:38 2008 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 ( 642) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  60) minutes.
Conveyance self-test routine
recommended polling time:        (   3) minutes.
SCT capabilities:              (0x103f) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   079   063   044    Pre-fail  Always       -       93635755
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       25
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   069   060   030    Pre-fail  Always       -       8509314
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       284
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       25
184 Unknown_Attribute       0x0033   100   100   003    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Unknown_Attribute       0x0032   100   095   000    Old_age   Always       -       46
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   070   069   045    Old_age   Always       -       30 (Lifetime Min/Max 27/31)
194 Temperature_Celsius     0x0022   030   040   000    Old_age   Always       -       30 (0 19 0 0)
195 Hardware_ECC_Recovered  0x001a   052   039   000    Old_age   Always       -       93635755
196 Reallocated_Event_Count 0x0033   100   100   036    Pre-fail  Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%       133         -
# 2  Short offline       Completed without error       00%       121         -
# 3  Extended offline    Interrupted (host reset)      00%       120         -
# 4  Short offline       Completed without error       00%       118         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

A Raw_Read_Error_Rate mennyire kritikus érték?Ugy értem, hogy a self-testen átmegy a hdd, adatvesztést eddig nem tapasztaltam.Mennyire megbizhato ml110g5-ön a smartctl(természetesen az original HP hdd van benne)?

És szerinted a RAID -ség mennyiben befolyásolja egy-egy HDD fizikai működését? Tekintet nélkül hogy sw vagy hw RAID.
Szerintem ennek a RAID -hez semmi köze, viszont ha ennyit hibázik az kicsit furcsa. Nem lehet hogy valamit félre értelmez a smart?
Végül is a RAID erre is jó, két sz'ros HDD = egy működő tömb.

* Én egy indián vagyok. Minden indián hazudik.

Ahogy a legelso mondatban is emlitettem, nem kapcsolodik szervesen a temahoz(nem hw-sw raid).Azert itt kerdeztem, mert nekem is ml110g5-om van ubuntu-val.(ahogy par hozzaszolonak is)
A hozzaszolasom utolso reszeben pedig epp az altalad is felvett problemara keresem a valaszt(megbizhatok a smartctl adataiban?)

Nézz körül a kompatibilitási listában. Egyébként úgy tűnik ez az adat kivételesen bevan betonozva, azaz még a legrégebbi, smart -ot ismerő HDD -m is mutatja - de nem ilyen értékekkel.
(egy ismerősöm cégénél pár éve vettek HP/RAID szervereket, az összes HDD -t 3 hónapon belül ki kellett cserélni)

* Én egy indián vagyok. Minden indián hazudik.

ezen mi is csodálkoztunk:

volt 5 haldokló diszkünk, gondoltuk csinálunk belőle raid5-öt (4 diszk + 1 spare) de amint le akartuk formázni ext3-ra vagy akármire, sorban kihajigálta a diszkeket a tömbből. jó, akkor legyen raid10: ugyanez. Ekkor elegünk lett és beraktuk raid0-ba, onnan nem dobálja ki őket :P persze fontos adatot nem bíznék rá az biztos. Amolyan átmeneti tároló.

RAID bus controller: Intel Corporation 82801 SATA RAID Controller (rev02)

fakeraid

t

Na csak igazatok lett, maradtam a szoftveres raidnél, kis google bújás után sikerült is könnyedén beállítanom, azt hiszem minden úgy működik neki, ahogy kellene, egy valamivel viszont nem boldogulok az pedig a grub beállítása, hogy drive failure esetén automatikusan használja a másik merevlemezt.

Ezen oldal leírása alapján dolgoztam:http://www200.pair.com/mecham/raid/raid1-page3.html Lépésről lépésre elvégeztem az itt leírtakat, módosítottam a menu.lst-t a linken látható forma szerint, a grub command shellben is megadtam a parancsokat, de aztán amikor jönne a reboot csak az az üzenet fogad, hogy a lemez nem található. Ugyan dehogynem... Valamit elírtam vagy elnéztem, de nem tudok rájönni mi az. Aztán természetesen a régi menüpontokról bootolva tökéletesen indul a rendszer és töltődik valamint a raid is inicializálásra kerül, az mdadm --detail /dev/md0 parancsot kiadva és minden optimálisnak tűnik valamin a cat /proc/mdstat kimenetén sem látok semmi rendelleneset.

Mit rontottam el?