Új HP DL-180G5 smart array gondok

Sziasztok!

Adott a subj., és az a gondom vele hogy rendszeresen összekuszálja a filerendszert. LVM2-vel van a logikai lemezkezelés megoldva.

Disztrib: debian, mert az elődjén is ez volt, így lehet(ne) csökkenteni a configurációs költségeket.HP supportnál azt mondták használjak HP drivert. Könyörgöm a linux mainlineban az van!

Eredetileg debian alól 2.6.26-os distrib kernellel csinálta, de berakva ubuntu live cd-t 2.6.24-el uaz történik.
A kártya P400 már lett cserélve és a rajta lévő BBWC modul is. Sajna nem segített.

A boot elején még működik rendesen aztán ha hagyom állni kb 1 nap uptime után próbálok megint hozzáférni a lemezhez és timeouttal elszáll. Sajna a filerendszert is elrontja fsck utánna mindíg hibákat jelez, akár elvesztett fileokat is.

Légszi segítsetek. Mi legyen a következő lépés?
Arra gondoltam felrakok rá egy win2k3-at úgy ki tudnám szűrni, hardware hibával van-e dolgom.

Egyébként déli híd, vagy driver hibára gondolok most már leginkább.

syslogban:


Jan 7 06:27:36 server kernel: [4523085.072934] cciss: cmd f7100000 has CHECK CONDITION sense key = 0x3
Jan 7 06:27:36 server kernel: [4523085.072934] end_request: I/O error, dev cciss/c0d0, sector 1242513992
Jan 7 06:31:07 server kernel: [4523349.371161] cciss: cmd f7100000 has CHECK CONDITION sense key = 0x3
Jan 7 06:31:07 server kernel: [4523349.371161] end_request: I/O error, dev cciss/c0d0, sector 1242514640
Jan 7 06:33:05 server kernel: [4523496.028111] cciss: cmd f7102500 has CHECK CONDITION sense key = 0x3
Jan 7 06:33:05 server kernel: [4523496.028111] end_request: I/O error, dev cciss/c0d0, sector 1242514640
Jan 7 06:35:31 server kernel: [4523677.931075] cciss: cmd f7100250 has CHECK CONDITION sense key = 0x3
Jan 7 06:35:31 server kernel: [4523677.931075] end_request: I/O error, dev cciss/c0d0, sector 1242514248
Jan 7 06:37:29 server kernel: [4523823.971215] cciss: cmd f7100940 has CHECK CONDITION sense key = 0x3
Jan 7 06:37:29 server kernel: [4523823.971215] end_request: I/O error, dev cciss/c0d0, sector 1242514248
Jan 7 06:39:27 server kernel: [4523969.351712] cciss: cmd f7101720 has CHECK CONDITION sense key = 0x3
Jan 7 06:39:27 server kernel: [4523969.351712] end_request: I/O error, dev cciss/c0d0, sector 1242514248
Jan 7 06:41:24 server kernel: [4524117.978135] cciss: cmd f71004a0 has CHECK CONDITION sense key = 0x3
Jan 7 06:43:22 server kernel: [4524117.978135] end_request: I/O error, dev cciss/c0d0, sector 1242728104
Jan 7 06:43:22 server kernel: [4524263.803102] cciss: cmd f7102500 has CHECK CONDITION sense key = 0x3
Jan 7 06:43:22 server kernel: [4524263.803102] end_request: I/O error, dev cciss/c0d0, sector 1242728104
Jan 7 06:45:24 server kernel: [4524417.452634] cciss: cmd f7100000 has CHECK CONDITION sense key = 0x3
Jan 7 06:45:24 server kernel: [4524417.452634] end_request: I/O error, dev cciss/c0d0, sector 1242728104
Jan 7 06:47:22 server kernel: [4524564.621328] cciss: cmd f7100b90 has CHECK CONDITION sense key = 0x3
Jan 7 06:47:22 server kernel: [4524564.621385] end_request: I/O error, dev cciss/c0d0, sector 1242727040
Jan 7 06:49:24 server kernel: [4524719.069472] cciss: cmd f7102500 has CHECK CONDITION sense key = 0x3
Jan 7 06:49:24 server kernel: [4524719.069472] end_request: I/O error, dev cciss/c0d0, sector 1242727040
Jan 7 06:53:10 server kernel: [4524991.999961] cciss: cmd f7100250 has CHECK CONDITION sense key = 0x3
Jan 7 06:53:10 server kernel: [4524991.999961] end_request: I/O error, dev cciss/c0d0, sector 1242729024
Jan 7 06:55:08 server kernel: [4525136.831215] cciss: cmd f7100de0 has CHECK CONDITION sense key = 0x3
Jan 7 06:55:08 server kernel: [4525136.831215] end_request: I/O error, dev cciss/c0d0, sector 1242729024

------------

arrayprobe ilyeneket is mond, de nem hiszem hogy winyó gond lenne.


Event code 5/1/0 with tag 99
at 1-21-2009 17:42:32
with message: Fatal drive error, Port=1I Box=1 Bay=2

Event code 5/1/0 with tag 99
at 1-21-2009 17:44:25
with message: Fatal drive error, Port=1I Box=1 Bay=2

Event code 5/1/0 with tag 99
at 1-21-2009 17:46:23
with message: Fatal drive error, Port=1I Box=1 Bay=2

tech. adatok:

root@ubuntu:~# cat /proc/driver/cciss/cciss0
cciss0: HP Smart Array P400 Controller
Board ID: 0x3234103c
Firmware Version: 5.20
IRQ: 212
Logical drives: 1
Max sectors: 2048
Current Q depth: 0
Current # commands on controller: 0
Max Q depth since init: 16
Max # commands on controller since init: 21
Max SG entries since init: 31
Sequential access devices: 0

cciss/c0d0: 750.12GB RAID 1(1+0)

root@ubuntu:~# fdisk -l /dev/cciss/c0d0

Disk /dev/cciss/c0d0: 750.1 GB, 750122819584 bytes
255 heads, 32 sectors/track, 179544 cylinders
Units = cylinders of 8160 * 512 = 4177920 bytes
Disk identifier: 0x328a4cac

Device Boot Start End Blocks Id System
/dev/cciss/c0d0p1 1 124 505904 83 Linux
/dev/cciss/c0d0p2 125 1105 4002480 82 Linux swap / Solaris
/dev/cciss/c0d0p3 1106 179544 728031120 83 Linux

oot@ubuntu:~# lvdisplay
--- Logical volume ---
LV Name /dev/vg/root
VG Name vg
LV UUID rldE8M-gavU-uez4-T14x-lKk1-B7cl-M4icBM
LV Write Access read/write
LV Status available
# open 0
LV Size 50,00 GB
Current LE 12800
Segments 1
Allocation inherit
Read ahead sectors 0
Block device 254:0

--- Logical volume ---
LV Name /dev/vg/backup
VG Name vg
LV UUID wEp83h-BZnw-Fekq-e61M-jcFL-BYUw-4fWVu7
LV Write Access read/write
LV Status available
# open 0
LV Size 20,00 GB
Current LE 5120
Segments 1
Allocation inherit
Read ahead sectors 0
Block device 254:1

--- Logical volume ---
LV Name /dev/vg/home
VG Name vg
LV UUID ueOdGS-gdjx-tpTU-KWuH-ZB5p-6qUd-6aoFkI
LV Write Access read/write
LV Status available
# open 0
LV Size 100,00 GB
Current LE 25600
Segments 1
Allocation inherit
Read ahead sectors 0
Block device 254:2

--- Logical volume ---
LV Name /dev/vg/mail
VG Name vg
LV UUID 20P4AE-BMeP-iKzL-ABGF-dLZm-qk0w-QDaWCC
LV Write Access read/write
LV Status available
# open 0
LV Size 524,00 GB
Current LE 134144
Segments 1
Allocation inherit
Read ahead sectors 0
Block device 254:3

Hozzászólások

történt valami fejlemény?
( jó lenne ha megírnád, remélem siker?)

HP ügyfélszolgálat kritikán aluli. A Belépő szintű szervereik pedig ipari hulladéknak is ócskák.

Ha teheted dobd ki a szemétre, és vegyél Dell-t, vagy IBM-et, esetleg Sun-t. (Bár ez utóbbit meg aranyárban mérik.)

ööö miért? Első mondata megerősítve. A második mondata, hogy is mondjam kissé túlzás ugyan dehát lehet saját véleménye. A harmadik mondat meg úgy kezdődik "ha teheted"...

én is Lexussal járnék ha tehetném ;-)

(szerk.: ja negyedik mondta az meg izé, mindhárom márka kínálatában van "vasárú" is azaz nem aranyár...)

Nem mondtam, hogy nincs igaza. Csak, hogy sokan vitatkoznának vele. :)

1. Ugyan nekem nincs velük túl sok rossz tapasztalatom, de egye kutya, kiegyezem veletek, a HP "ügyfélszolgálat" lehetne jobb is.
2. A belépő szintű vasaik az én tapasztalataim alapján azért nem annyira sz*rok. Az ajánlott Dell-ek sem sokkal bizalomgerjesztőbbek. Az ár meg valahol minden gyártónál tükrözi a kapott értéket. Ha nem így lenne, nem tudnák eladni a drágább vasakat.
3. A SUN-t túlzás "aranyárban" mért eszköznek titulálni, annyira nem rossz az ár-érték arányuk, sőt.

Na de ez is csak egy vélemény, méghozzá az enyém.

Ezt frissítettem tegnap este :)
De emellett még nézegetem, okozhatta-e más a hibát.
Egyébként a 100-as sorozatú HP-khoz nincs Firmwire Maintenance CD sajna, az csak a 300-asoktól felfelé...

-------------------------
E-learning szolgáltatások nyílt alapokon
Weblap és Bemutató rendszer

+1

Az ML350 G5-be az alaplapi BBWC-s E200 mellé betettem egy P400-at szintén BBWC-vel, a hotplug cage-t átkötöttem.
Teszteléskor (bonnie++, dd, etc) jól működött, viszont ahogy ráengedtem a drbd sync-t (Ő lenne a secondary) kb 1-2 percen
belül elhasal, a rootfs ro lesz, és megáll a sync.

http://pastebin.com/f724a66ee itt a dmesg

ctrl slot=4 show config detail

Smart Array P400 in Slot 4
Bus Interface: PCI
Slot: 4
Serial Number: P61630D9SU????
Cache Serial Number: PA82C0H9SU????
RAID 6 (ADG) Status: Enabled
Controller Status: OK
Chassis Slot:
Hardware Revision: Rev D
Firmware Version: 6.86
Rebuild Priority: Medium
Expand Priority: Medium
Surface Scan Delay: 15 secs
Post Prompt Timeout: 0 secs
Cache Board Present: True
Cache Status: Not Configured
Accelerator Ratio: 50% Read / 50% Write
Drive Write Cache: Enabled
Total Cache Size: 256 MB
No-Battery Write Cache: Disabled
Cache Backup Power Source: Batteries
Battery/Capacitor Count: 1
Battery/Capacitor Status: OK
SATA NCQ Supported: True

Array: A
Interface Type: SAS
Unused Space: 0 MB
Status: Failed
MultiDomain Status: OK

Logical Drive: 1
Size: 1.8 TB
Fault Tolerance: RAID 1+0
Heads: 255
Sectors Per Track: 32
Cylinders: 65535
Stripe Size: 128 KB
Status: Failed
MultiDomain Status: OK
Array Accelerator: Disabled
Unique Identifier: 600508B1001031383620202020200000
Disk Name: /dev/cciss/c0d0
Mount Points: / 8.0 GB
Logical Drive Label: A0020D9BQL77MV5186 7E86
Mirror Group 0:
physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 1TB, Failed)
physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 1TB, Failed)
Mirror Group 1:
physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SAS, 1TB, Failed)
physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SAS, 1TB, OK)

physicaldrive 1I:1:1
Port: 1I
Box: 1
Bay: 1
Status: Failed
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W77T00009005LDXX
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: 3.0GBPS, Unknown
physicaldrive 1I:1:2
Port: 1I
Box: 1
Bay: 2
Status: Failed
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W4KC00009005JL6A
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: Unknown, 3.0GBPS
physicaldrive 1I:1:3
Port: 1I
Box: 1
Bay: 3
Status: Failed
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W7L900009005MUNY
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: Unknown, Unknown
physicaldrive 1I:1:4
Port: 1I
Box: 1
Bay: 4
Status: OK
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W4T600009005NUZ5
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: Unknown, Unknown

A disk-ek jók voltak az E200-on. újraindítás után vagy hibát jelez, vagy nem. Ha elindul megint jónak jelzi a disk-eket.
Minden ötletet szívesen fogadok!

Hat ja. Jo lenne latni masik disk keszlettel. Valoszuinuleg ez nem tetszik neki.

Esetleg megnezned RAID5-el? Arra alapozom, hogy nagyon sok bajuk volt a HP-seknek a RAID1 illetve RAID 1+0 kornyezetben a SATA diskkekkel. Igaz ez SAS de Valamiert kiejti oket. Jo lenne latni kontroll gyanant, hogy RAID5-eseten is kiejti oket vagy sem. ( En azt varom, hogy ott is ejtse ki, azaz a disk-kel lesz a baj, firmware-re meg varhatunk...)

Masreszt HP belevitt ebbe a P400-as 6.86 (ugye B-s a tied is? azt is kene latni nem?) firmware-be ilyet:
"Includes advanced error logging features for controller lockup codes that can be collected via the HP Array Diagnostics Utility."

Ebbol mi latszik? hpadu mit mutat?

szerk.: elbaxtam, ez to:wpeople lenne, bocs'at

A hp leírása szerint azonnal frissíteni kéne a 6.86B -re (érdekes módon az előző fw mindössze 5.26C)
Igen, B revision van fent (bár ezt nem jelzi külön).

Ha nem muszáj nem migrálnám a raid 1+0-t raid5-be :-)

Ennek nincsen vmi CLI utilityje? Openfiler-t használok, nem biztos, h egyszerű mutatvány felbirkózni a HPSMH-t, gondolom az ADU abba épülne bele.
írtam a HP CCISS fejlesztőknek és a seagate-nek is (nem látok a seagate oldalán ehhez fw frissitési lehetősét :-(

Controller fw downgrade után sikeresen lefutott a drbd sync (azért nem akarom elkiabálni...).
Itt érdekes módon mind a 4 disk sebességét jól irja ki...

Sajnos az fw downgrade-t nem sikerült online csinálni, csak fw-upgrade cd-ről (mázli, h van régebbi verzió is fent :-)
itt is be kell jelölni h allow older version.

Smart Array P400 in Slot 4
Bus Interface: PCI
Slot: 4
Serial Number: P61630D9SU????
Cache Serial Number: PA82C0H9SU????
RAID 6 (ADG) Status: Enabled
Controller Status: OK
Chassis Slot:
Hardware Revision: Rev D
Firmware Version: 5.26
Rebuild Priority: Medium
Expand Priority: Medium
Surface Scan Delay: 15 secs
Post Prompt Timeout: 0 secs
Cache Board Present: True
Cache Status: OK
Accelerator Ratio: 50% Read / 50% Write
Drive Write Cache: Enabled
Total Cache Size: 256 MB
No-Battery Write Cache: Disabled
Cache Backup Power Source: Batteries
Battery/Capacitor Count: 1
Battery/Capacitor Status: OK
SATA NCQ Supported: True

Array: A
Interface Type: SAS
Unused Space: 0 MB
Status: OK
MultiDomain Status: OK

Logical Drive: 1
Size: 1.8 TB
Fault Tolerance: RAID 1+0
Heads: 255
Sectors Per Track: 32
Cylinders: 65535
Stripe Size: 128 KB
Status: OK
MultiDomain Status: OK
Array Accelerator: Enabled
Unique Identifier: 600508B1001031383620202020200000
Disk Name: /dev/cciss/c0d0
Mount Points: / 8.0 GB, /mnt/temp 180.9 GB
Logical Drive Label: A0020D9BQL77MV5186 7E86
Mirror Group 0:
physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 1TB, OK)
physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 1TB, OK)
Mirror Group 1:
physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SAS, 1TB, OK)
physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SAS, 1TB, OK)

physicaldrive 1I:1:1
Port: 1I
Box: 1
Bay: 1
Status: OK
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W77T00009005LDXX
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: 3.0GBPS, Unknown
physicaldrive 1I:1:2
Port: 1I
Box: 1
Bay: 2
Status: OK
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W4KC00009005JL6A
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: 3.0GBPS, Unknown
physicaldrive 1I:1:3
Port: 1I
Box: 1
Bay: 3
Status: OK
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W7L900009005MUNY
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: 3.0GBPS, Unknown
physicaldrive 1I:1:4
Port: 1I
Box: 1
Bay: 4
Status: OK
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W4T600009005NUZ5
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: 3.0GBPS, Unknown

a downgrade állította vissza normálisra.

CLI 8.28-13.0 (amelyik gépben P400 is van)
CLI 8.20-18.0 (amelyikben csak E200 van)

Az E200-ból:

physicaldrive 1I:1:1
Port: 1I
Box: 1
Bay: 1
Status: OK
Drive Type: Data Drive
Interface Type: SATA
Size: 1500.3 GB
Firmware Revision: CC1H
Serial Number: 9VS0YT2V
Model: ATA ST31500341AS
SATA NCQ Capable: False
PHY Count: 1
PHY Transfer Rate: 1.5GBPS

// Note: If your drive has CC firmware, your drive is not affected and no further action is required. Attempting to flash the firmware of a drive // with CC firmware will result in rendering your drive inoperable.

Jól tippelek, h a dual portos SATA lenne a 3GBPS ? (ha igen, se az E200 se a P400 nem támogatja)

SATA-bol IMHO nincs dual portos. A kártyak csak SATA I-et tudnak ezért van a SATA esetén az 1.5GBPS

SAS esetén van dual port. Na akkor tudna 2x3GBPS-t! (persze ha abban az idopillanatban azon a két csatornán csak ez a disk forgalmaz...) És ezt elvileg mindegyik SAS-os HP SA tudja.

Mintha Te írtad volna pár sorra fentebb:
>Ez az uj firmware eseten van igy a downgrade meg "visszaallitotta" normalisra azaz jol mutatja? Mikori, milyen verzioju a hpacucli-d?
>Van dual portos satad is? Olyannal vajon mit irna ki az uj firmware?

A PHY count szerintem a portok számot mutatja.

E200-ból SAS 2.5" 36G disk
physicaldrive 1I:1:1
Port: 1I
Box: 1
Bay: 1
Status: OK
Drive Type: Data Drive
Interface Type: SAS
Size: 36 GB
Rotational Speed: 15000
Firmware Revision: HPD9
Serial Number: 3PE04R0L00009744N8XV
Model: HP DH036ABAA5
PHY Count: 1
PHY Transfer Rate: 3.0GBPS

E200-ból SAS 3.5" 146G
physicaldrive 1I:1:3
Port: 1I
Box: 1
Bay: 3
Status: OK
Drive Type: Data Drive
Interface Type: SAS
Size: 146 GB
Rotational Speed: 15000
Firmware Revision: HPD0
Serial Number: BJA4P8901BML0840
Model: HP DF146BAFDU
PHY Count: 2
PHY Transfer Rate: 3.0GBPS, Unknown

P400-ból SAS 3.5" 1T
physicaldrive 1I:1:4
Port: 1I
Box: 1
Bay: 4
Status: OK
Drive Type: Data Drive
Interface Type: SAS
Size: 1TB
Rotational Speed: 7200
Firmware Revision: 0003
Serial Number: 9QJ4W4T600009005NUZ5
Model: SEAGATE ST31000640SS
PHY Count: 2
PHY Transfer Rate: 3.0GBPS, Unknown

Ha jól értelmezem a leírást (pl a Seagate SAS 1T leírását) abban az van, h a single port esetén 1 read v 1 write mehet a csatornán, amíg
dual port esetén:
- 2 read vagy
- 2 write vagy
- 1-1 read-write
a doksi itt

Ok, ok nem kell raid5-be migralni! :-) Csak gondoltam ha van lehetoseg tesztelni akkor miert ne. Nade olvasom downgrade utan megy? Basszus ez azert aggaszto.
En meg frissiteni akarok de akkor igy nem merek, pedig nekem van ilyen is:
Smart Array P800 in Slot ATTR_VALUE_SLOT_UNKNOWN (sn: PAFGF0Mxxxxxxx)

array A (SATA, Unused Space: 0 MB)

logicaldrive 1 (5.5 TB, RAID 5, OK)

physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK, active spare)

Igy meg ugye nem tudom menet kozben kivenni betenni a diszkeket mert nem lehet megcimezni. Raadasul ez egy 5.20-as firmware de ugyanilyen diszkekkel egy 5.26-os firmwareu kartya mar ezt mutatja:

Smart Array P800 in Unknown Slot (sn: PAFGF0Mxxxxxxx)

array A (SATA, Unused Space: 0 MB)

logicaldrive 1 (5.5 TB, RAID 5, OK)

physicaldrive 0:0 (box 0:bay 0, SATA, 1TB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1TB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1TB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1TB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1TB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1TB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1TB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 1TB, OK, spare)

Bar azthiszem ezt nem a firmware teszi hanem mas a hpacucli verzioja is, a regebbin : HP Array Configuration Utility CLI 8.20-18.0
az ujon: HP Array Configuration Utility CLI 8.28-13.0

Na modositok van egy P400-is ami ilyen:
HP Array Configuration Utility CLI 8.35-7.0 / Firmware:4.06
Smart Array P400 in Slot 0 (Embedded) (sn: P61620Fxxxxxxx)

array A (SATA, Unused Space: 0 MB)

logicaldrive 1 (931.5 GB, RAID 1+0, OK)

physicaldrive 0:0 (box 0:bay 0, SATA, 500 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 500 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 500 GB, OK)
physicaldrive 0:0 (box 0:bay 0, SATA, 500 GB, OK)

Ezeket a disk seteket atteve egy E200-as vezerlore jol latszanak a physicaldrive poziciok, minden jol mukodik csak lassu!

Szoval jo dolog, hogy tudja kezelni a SATA-t de gyakorlatban sok vele a problema. (Jo, jo, tudom eleve az a baj, hogy ezek nem HP gepben vannak es nem eredeti HP diskek vannak "beleszurva".)

Szerk: ja a legelso tombnel a spare active:
physicaldrive 0:0 (box 0:bay 0, SATA, 1000.2 GB, OK, active spare)
erdekes az egyik disket kiejtette, de mivel mindegyik 0:0-an van igy nem lehet tudni melyik a hunyo. Csak a fizikai ranezes alapjan latszik melyiket nem hasznalja, bar erdekes modon OK-nak veszi. Lehet ha kihuznam betolnam akkor visszaszinkronizalna es a spare is visszaalna? Nem tudom, az a baj, hogy igy nem latom melyik drive-ot kellen maceralni hpacucli-val meg nem tudom megcimezni. Ez igy nem jo. Egyebkent azt a tombot failednek mutatja, de nem degraded hiszen maga a tomb ep, csak most nincs elvileg spare. Egyik ejszaka majd megnyagtatom...
Ja meg 1: hpaducli -vel gyartattam reportot, jo sokat pofazott, ott latszik talan annyi, hogy timeout-tal ejtette ki azt a disket. Meg fejtegetem miket ir az a hpaducli, jo sok mindent.

:-( sajna nem:
# hpacucli ctrl slot=0 pd 0:0 show

Smart Array P400 in Slot 0 (Embedded)

array A

physicaldrive 0:0
Box: 0
Bay: 0
Status: OK
Drive Type: Data Drive
Interface Type: SATA
Size: 500 GB
Firmware Revision: 1AA01110
Serial Number: S13TJDWQ422257
Model: ATA SAMSUNG HD502IJ
SATA NCQ Capable: True
SATA NCQ Enabled: True
PHY Count: 1
PHY Transfer Rate: 1.5GBPS

# hpacucli ctrl slot=0 pd 1I:1:1 show

Error: The specified controller does not have any physical drives identified by
'1i:1:1'

# hpacucli ctrl slot=0 pd :1:1 show

Error: The specified controller does not have any physical drives identified by
':1:1'

# hpacucli ctrl slot=0 pd :0:0 show

Error: The specified controller does not have any physical drives identified by
':0:0'

# hpacucli ctrl slot=0 pd 0:1 show

Error: The specified controller does not have any physical drives identified by
'0:1'

Miután senki nem válaszolt, Kayapo adott tegnap egy tippet, amikor mutattam a témát. Lehet, hogy a P400-as P400i-re való lecserélése megoldaná a problémát. Persze ezt ne vedd készpénznek, de járt körül.

Te tudod, h a 2 között mi a különbség?
Ezen oldal szerint
The SA-P400 Controller supports up to 18 drives depending on the server implementation.
The SA-P400i Controller supports up to 6 drives depending on the server implementation

nem biztos, h a 400i az okosabb. csak tipp, de az "i" nem az integráltat jelöli?
Ezen pdf konkrétan azt mondja, h a P400 az PCIe, a P400i az embedded.

@Kayapo: 5let esetleg?

+1 i témában. Az integrated változatot tényleg nem lehet betenni, csak olyanba ahol ennek fogadásara fel van készítve az alaplap.

Én ezzel akkor találkoztam mikor láttam, hogy az i-s változaton a chip-en már van hűtőborda. na mondom akkor nekem ilyen kell, mert egyébként is "forrófejű"-nek találom ezeket a vezérlőket. De nem, nem lehet akárhová betenni az i-s vezérlőt.

Ennek a linknek hála sikerült nagyobb teljesítményt előcsalni. Kb 4x gyorsabb lett az olvasás.

A tapasztalat azt mutatja, hogy a hiba ehhez a dmesg üzenethez köthető: IRQF_DISABLED
Az up-to-date (2.6.29.6-0.6.smp.gcc3.4.x86.i686) Openfiler-t futtató gépeimen megjelenik az üzenet, viszont a 2.6.26-2-xxx -t futtató
Debian-okon nem. (ott rendben is van a sebesség).
Kipróbáltam, hogy az Openfiler-t a gyári kernellel futtatom: 2.6.24.7-0.2.6.smp.gcc3.4.x86.i686
érdekes módon 4x gyorsabb lett!!!

tudom, nézzem végig a kernel change_log-ot h mi változott ehhez köthetően...

szerk: kernel-bug thread itt

Szia.

Van 4 SAS 72GB/10000rpm diskem.
Debian Lenny, gyári kernel:
proba:~# uname -a
Linux proba 2.6.26-2-xen-686 #1 SMP Sat Oct 24 02:31:56 UTC 2009 i686 GNU/Linux

Rendszerdiszk egy pata, memória 1GB/800MHz SingleChannel chipset Intel 945:
proba:~# hdparm -tT /dev/hda

/dev/hda:
Timing cached reads: 1512 MB in 2.00 seconds = 756.46 MB/sec
Timing buffered disk reads: 166 MB in 3.01 seconds = 55.22 MB/sec
proba:~# lspci
00:00.0 Host bridge: Intel Corporation 82945G/GZ/P/PL Memory Controller Hub (rev 02)

proba:~# cat /var/log/dmesg | grep cciss
[ 2.237989] cciss: MSI init failed
[ 2.275379] cciss0: <0x3238> at PCI 0000:05:08.0 IRQ 16 using DAC
[ 2.294219] cciss/c0d0: unknown partition table

proba:~# hpacucli ctrl slot=18 show

Smart Array E200 in Slot 18
Bus Interface: PCI
Slot: 18
Serial Number: Pxxxxxxxxxxx
Cache Serial Number: Pxxxxxxxxxx
RAID 6 (ADG) Status: Disabled
Controller Status: OK
Chassis Slot:
Hardware Revision: Rev A
Firmware Version: 1.78
Rebuild Priority: Medium
Expand Priority: Medium
Surface Scan Delay: 3 secs
Post Prompt Timeout: 15 secs
Cache Board Present: True
Cache Status: OK
Accelerator Ratio: 50% Read / 50% Write
Drive Write Cache: Disabled
Total Cache Size: 128 MB
No-Battery Write Cache: Disabled
Cache Backup Power Source: Batteries
Battery/Capacitor Count: 1
Battery/Capacitor Status: OK
SATA NCQ Supported: False

proba:~# hpacucli ctrl slot=18 show config

Smart Array E200 in Slot 18 (sn: Pxxxxxxxxxxxxx)

unassigned

physicaldrive 1I:0:1 (port 1I:box 0:bay 1, SAS, 72 GB, OK)
physicaldrive 1I:0:2 (port 1I:box 0:bay 2, SAS, 72 GB, OK)
physicaldrive 1I:0:3 (port 1I:box 0:bay 3, SAS, 72 GB, OK)
physicaldrive 1I:0:4 (port 1I:box 0:bay 4, SAS, 72 GB, OK)

proba:~#

Írtam egy scriptet:
proba:~# cat ./hpsateszt

--------------------------------------------------cuthere--------------------------------------
#!/bin/sh
HPSADEVICE="/dev/cciss/c0d0"
HPSACTRLSLOT="18"
RAIDTYPE="5"
echo "------------------------------------------------------------"
echo "Make RAID$RAIDTYPE"
echo "----------"
hpacucli ctrl slot=$HPSACTRLSLOT create type=ld drives=all raid=$RAIDTYPE
hpacucli ctrl slot=$HPSACTRLSLOT show config
echo "Make partition"
echo "--------------"
sleep 2
parted -s $HPSADEVICE mktable msdos
parted -s $HPSADEVICE mkpart primary ext3 0 100%
parted -s $HPSADEVICE print
echo "Make filesystem"
echo "---------------"
sleep 2
mkfs.ext3 /dev/cciss/c0d0p1
echo "Mount filesystem"
echo "---------------"
sleep 2
mount /dev/cciss/c0d0p1 /mnt/sas1/
echo "Make test"
echo "---------"
sleep 2
dd if=/dev/zero of=/mnt/sas1/bigfile.raw bs=1M count=7000
dd if=/mnt/sas1/bigfile.raw of=/dev/null
echo "Make clean"
echo "----------"
sleep 2
umount /mnt/sas1/
hpacucli ctrl slot=$HPSACTRLSLOT ld 1 delete forced
hpacucli ctrl slot=$HPSACTRLSLOT show config
echo "------------------------------------------------------------"
echo "."
echo "."
echo "."
echo "."
sleep 2
echo "."
--------------------------------------------------cuthere--------------------------------------

RAID 5 estén:
Make test
---------
7000+0 beolvasott rekord
7000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 214,933 mp, 34,2 MB/mp
14336000+0 beolvasott rekord
14336000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 78,9312 mp, 93,0 MB/mp
Make clean
----------

RAID 1+0 estén:
---------------
Make test
---------
7000+0 beolvasott rekord
7000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 109,038 mp, 67,3 MB/mp
14336000+0 beolvasott rekord
14336000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 60,7837 mp, 121 MB/mp
Make clean
----------

RAID 0 esetén:
---------------
Make test
---------
7000+0 beolvasott rekord
7000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 78,3213 mp, 93,7 MB/mp
14336000+0 beolvasott rekord
14336000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 59,9365 mp, 122 MB/mp
Make clean
----------

Mindjárt beszúrom a P400-at és azon is megnézem ugyanezt.

Meg tudnád nézni neked mennyi az annyi?
(Tudom bonnie de nekem az macerás, dd is ad viszonyításhoz értéket.)

Vélemény?

P400 előzetes:
_Még tölt az akksi_, de már így is sokkal jobb:
RAID0:
---------------
Make test
---------
7000+0 beolvasott rekord
7000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 43,9378 mp, 167 MB/mp
14336000+0 beolvasott rekord
14336000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 48,3568 mp, 152 MB/mp
Make clean
----------

Na erre varjon gombot a HP!

Szerk.: (feltöltött az akkumulátor)

Sajnos ezek az értékek érzésem szerint már a chipset memória miatt ilyen, szerintem ennek többnek kellene lennie, majd meg kell nézni egy gyorsabb gépben is:

RAID5:
---------------
Make test
---------
7000+0 beolvasott rekord
7000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 45,5856 mp, 161 MB/mp
14336000+0 beolvasott rekord
14336000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 76,3498 mp, 96,1 MB/mp
Make clean
----------

RAID 1+0
---------------
Make test
---------
7000+0 beolvasott rekord
7000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 47,2562 mp, 155 MB/mp
14336000+0 beolvasott rekord
14336000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 56,6411 mp, 130 MB/mp
Make clean
----------

RAID 0
---------------
Make test
---------
7000+0 beolvasott rekord
7000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 42,9863 mp, 171 MB/mp
14336000+0 beolvasott rekord
14336000+0 kiírt rekord
7340032000 bájt (7,3 GB) másolva, 49,0132 mp, 150 MB/mp
Make clean
----------

Na ennyi.

P400 256m bbwc 50/50% (4x1T SAS 7200, Raid1+0)
(a mérés -mivel Openfiler-en nem mutatja a sebességet- "time dd if=/dev/zero if=/tmp/file bs=1M count=4096" paranccsal történt)

írás (tömb első particiójára):
------------------------------
real 0m23.348s
user 0m0.008s
sys 0m12.469s

azaz 174MB/s

olvasás uinnen (readahead 256k):
--------------------------------
real 0m27.714s
user 0m0.004s
sys 0m4.076s

azaz 146MB/s

olvasás uinnen (readahead 4096):
--------------------------------
real 0m19.615s
user 0m0.016s
sys 0m3.948s

azaz 209MB/s

Mivel az alábbi gép üzemben van (azaz írnak/olvasnak róla/rá - viszont szombat du. elég keveset - így inkább tájékoztató jellegű)

E200i 128m bbwc 50/50% (2x1.5T SATA, no NCQ):
írás:
-----
real 1m22.605s
user 0m0.008s
sys 0m12.481s
azaz 50MB/s

olvasás (readahead 256k):
-------------------------
real 0m55.734s
user 0m0.008s
sys 0m3.620s

azaz 73MB/s

olvasás (readahead 4096k):
--------------------------
real 0m41.049s
user 0m0.004s
sys 0m3.296s

azaz 100MB/s

E200i 128m bbwc 50/50% (4x146G 15K HP SAS):
írás:
-----
real 1m17.304s
user 0m0.000s
sys 0m11.633s

azaz 53MB/s

olvasás (readahead 256k):
-------------------------
real 0m33.095s
user 0m0.008s
sys 0m5.832s

azaz 124MB/s

olvasás (readahead 4096k):
-------------------------
real 0m30.032s
user 0m0.004s
sys 0m6.040s

azaz 136MB/s

a kernel uaz, tudtommal egyéb beállítások is.
sajnos most a P400-ban nincsen benne a teszt sata disk, így csak azt tudom mondani, h bonnie-val 140MB/s olvasást és 120MB/s írást produkált.

Én azt a tanulságot vonom le, hogy a P400(+256M bbwc) kb 2x gyorsabb mint az E200(+128M bbwc). Ennek egy része lehet a memóriatöbblet, valamint sokat számíthat az NCQ támogatás is.