Merevlemezek, vezérlők

rossz szektortól csontrafagy? merevlez szívások, kérdések

Aktuális és visszatérő nagy problémám, hogy a bad-sector gyanús vinyókkal, amikkel a véletlen folytán összekerültem, csontrafagynak a gépek, amikben vannak - jobb esetben csak a programok, amiket a rossz szektor érint.

Mindkettő Samsung, az egyik egy HD321KJ, 3.5"-es "asztali" hdd - erről elég sok rosszat olvastam már egyébként -, a másik pedig egy 2.5-es laptop merevlemez, egy HM160HC.

Utóbbi egy aktív hűtés nélküli, "beágyazott" számítógépben van, és kb. 41 Celsius-fokon üzemel a smartctl szerint. Mielőtt egy igen alacsony terhelésű, de kritikus rendszer került volna rá, állítólag évekig rendben ment letöltőgépként. A rendszer rajta Centos 5.3, bár gondolom, hogy ez nem számít igazán. Na ez a gép csontrafagy, ha rossz szektorra fut úgy, hogy az vélhetően a /root partíción belül van. Korábban már szintén rossz szektoros volt, de áttettem a lemez egy másik részére a partíciót, ahol elvileg nem volt gond, és utána ment is rendesen kb. 2 hónapig, de mostmár nem. Itt nem lenne elvárhatóbb egy sima hiba, és egy megszakadt akármilyen művelet? Néha állítólag - amikor teljesen lefagy - kernel panic van. (A géphez csak távolról férek hozzá.)

Itt a smart log egy része, mindenki okulására:

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail Always - 133
...
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 1910
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 768
VISZONT:
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0

...

Error 108 occurred at disk power-on lifetime: 5957 hours (248 days + 5 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 6a 4e 09 e0 Error: UNC 1 sectors at LBA = 0x00094e6a = 609898

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 01 6a 4e 09 e0 00 02:16:15.312 READ DMA
ec 00 00 00 00 00 a0 00 02:16:14.187 IDENTIFY DEVICE
ef 03 45 00 00 00 a0 00 02:16:14.187 SET FEATURES [Set transfer mode]
ec 00 00 00 00 00 a0 00 02:16:14.125 IDENTIFY DEVICE

[Ilyenből elég sok van.]

Mivel a géppel korábban nem volt probléma, csak kb. 2-3 hónappal, miután feltettem rá a CentOS-t, egy kicsit úgy néz ki a megrendelő felé, mintha én lennék a hülye, hiába magyarázok bármit.

Mielőtt új vinyót vetetek velük, ami esetleg ugyanúgy nem fog működni, megkérdezem a tapasztaltabbaktól, hogy ugye még véletlenül sem fordulhat elő, hogy a linux esetleg valamit máshogy kezel, rosszul kezel, és azért jönnek elő mindenféle hibák? (>7 éve használok itthoni gépen kizárólag linuxot, és szerintem nem, de biztos, ami biztos. Amitől egyébként félek, hogy ezzel a samuval is hasonló történik, mint a két bekezdéssel későbbi példában: a megrendelő esetleg kipróbálja más gépben, windows alatt, és semmi baja nem lesz.)

Törvényszerű az, hogy csontrafagyjon egy program egy olyan fájl elérésekor, aminek egy része bad sectoros területen van? (LVM-en, ext3 fájlrendszeren) Ez a HD321KJ lemezzel fordult elő. A józan eszem és a korábbi tapasztalataim azt diktálják, hogy valamilyen hibát kellene, hogy kapjak előbb-utóbb, de nem... Mitől lehet ez?

Olyan már látott valaki, hogy egy rossz szektoros lemez meggyógyult? :S A HD321KJ merevlemezt épp akartam visszavinni gariba, hogy vegyek helyette valami jobb egeret, újrateszteltem 1 hónap pihentetés után, és sem a tesztelőprogramok, sem a "cat /dev/sda > /dev/null" nem jelzett hibát; látszólag meggyógyult a rohadék. Más gépben vizsgáltam, mint amiben eredetileg volt, de korábban ebben a másik gépben is hibákat jelzett. Eléggé fájt úgy új vinyót venni, hogy nem lehettett leszámítani a réginek az árát. Nem tudom, hogy nyomnám le a garis dolgot boltos torkán, ha aktuálisan nincs látható hibajelenség. Állítólag, ha valamit be-/megvizsgálnak, és jó(nak tűnik), a vevővel fizettetik meg a vizsgálat díját. Tud valaki erről konkrétat? Létezik ilyen jogszabály, rendelet, egyéb?

És végül: a HD321KJ helyett vettem egy 640GB-os Western Digital Caviar Blacket (WD6401AALS). Nagyon jó, villámgyors, ég és föld a különbség a HD321KJ-hoz képest - pl. szekvenciális olvasásban >2x, ami jobbára hibernálásból ébresztésnél jön csak jól, de ami a lényeg, hogy általános felhasználói élményben is óriási az előrelépés.

Kb. 2 hónap felhőtlenül boldog WD-használat után elkezdtem leveleket kapni a smart démontól, kb. minden gépindításkor: aszongya, CurrentPendingSector, és sokszor hallom a jól ismert, baljós hangot, hogy "tididididing, tididididing, tididididing", sokszor, egymás után, menet közben. Fagyás még nem volt, a hang viszont nagyon idegesítő. Ezzel kapcsolatban mit javasoltok? Vigyem vissza rögtön, vagy próbálkozzak meg a WD saját diagnosztikai programjával? Samu, Maxtor vinyókkal kapcsolatban olvastam, hogy a gyári programjaik tudnak olyat varázsolni, hogy a rossz vagy gyenge szektorokat a későbbiekben hagyja figyelmen kívül a merevlemez (vezérlőelektronikája?). WD-vel csinált már ilyet valaki? Akár korábbi példányokkal? Működött?

Röviden ennyi. K...a nincs szerencsém - annyi, de annyi idő elmegy ezekkel, és nincs előrébb az ember... Ilyenkor a szólásmondás jut eszembe: "Apám mindig mondta, menjek inkább péknek". Várom az építő jellegű hozzászólásokat, előre is köszi a segítséget mindenkinek. :)

A "floppy" utility-t hol keressem?

Az fdbormat man oldala leírja, hogy ha LS-120-as meghajtóban akarunk floppyt formázni, akkor használjuk a floppy alkalmazást.

"For ATAPI IDE floppy driver (also known as LS-120 drives or "Superdisk" drives) you have to use the floppy(8)."

Próbáltam megkeresni, hogy hol elérhető ez az alkalmazásm de nem találtam egyetlen Debian csomagban sem.
A man oldalából ennyit releváns infó volt csak:

"floppy 0.16 Copyright 2001-2003, Double Precision, Inc."

A Double Precision készíti a Courier IMAP servert, és a google a nevükre keresve odavisz a courier oldalára, ott viszont nem találok semmit erre a programra vonatkozólag.

Tudja esetleg valaki, hogy honnan tudnám letölteni slackware csomagban vagy forrásként?

USB disk csatolása

Arra lenne szükségem, hogy egy debian szerveren az usb diskek a bedugás sorrendjétől függően a /dev/sda, /dev/sdb, /dev/sdc és így tovább mountoljanak fel. Elméletileg ez így is történt eddig, aztán egy alkalommal az egyik disk lecsatlakozott a /dev/sdb-ről és /dev/sdd-ként lehetett csak felmountolni. Az nem megoldás, hogy disk id alapján csatolom fel, mert a diskek változhatnak.

hdd smart error mit jelent?

Van egy 750G-s Samsung vinyom. Egyik alkalommal egyszercsak elvesztettem vele a kapcsolatot munka kozben (nem azon volt a rendszer, igy minden mukodott tovabb), olyan volt mintha be sem lenne dugva. Fel volt mountolva, kaptam meg par IO error-t aztan semmi.
A gepet ujrainditottam azutan mukodott megint jol, mintha mi se tortent volna.

Persze nem biztam mar benne, ugyhogy lementettem mindent es inditottam ra egy badblocks -ot (ha nincs is bad block a sok iras/olvasastol hatha elojon rajta megint), de semmi. 3-szor vegigirta/olvasta a vinyot, de semmi baja.

Ma meg bootolaskor a BIOS azzal fogadott, hogy a SMART status BAD/ERROR (ket kulonbozo kepernyon az egyiken BAD a amsikon ERROR :) ), mikozben a tobbi vinyo jo es korabban (de mar az elso "elvesztes" utan is!) ez az egy is jo volt.

Mit jelent a SMART status pontosan? Hogy lehet ilyesmit Linux alol matatni?

A kinos az, hogy a Samsung ugyan 3 evet ad a vinyoira, de ahol en vettem ott csak 1-et (ami persze pont lejart). Van eselyem kozvetlenul a Samsunghoz fordulni? Egyaltalan SMART hiba az garancialis ertelemben is hiba? (Mert a vinyo amugy most latszolag tok jol megy.)

[megoldva]SCSI 80 pin

Sziasztok. Új vagyok még SCSI téren, ezért kérem a ti segitségeteket. Találtam egy hirdetést két 73GB-s 10k rpm-s IBM lemezre, nagyon jó áron voltak, ezért egyből meg is rendeltem őket a vezérlővel mit sem törődve. Meg is érkeztek, csak egy a bökkenő, nem tudom hova dugni őket, teljesen tanácstalan vagyok, hogy milyen adaptert vegyek hozzájuk. 80 pines vezérlőt hiába kerestem az Interneten, semmi olyasmit nem találtam, max átalakitót 68 pinre. A lemezek egyébként kb igy néznek ki: http://app.infopia.com/img/image/fp/VPID/7351181/img4/img.jpg benne vannak ebben az IBM-es keretben is, ami egyben átalakitó is (nem tudom mire alakitja át, valami SSA lehet?). Szóval a kérdések: Tudok valamit kezdeni ezzel az IBM-es átalakitóval (nem IBM szerverről van szó) ? Lehetséges Ultra320 80pin-es adaptert venni, hogy átalakitó nélkül hasznáhassam? Mit ajánlotok? Mellesleg egy kisebb szerverben szeretném elhelyezni őket. a segitséget előre is köszönöm.

USB pen drive probléma.

Sziasztok!

Az alábbi probléma megoldásában kérek segítséget:

Van egy Kingston DataTraveler 8GB pen drive-om.
A mai napig megbizhatóan müködött de sajnos most ha felteszem az XP az alábbi üzentet küldi:

A lemez nincsen formázva.
Megformázza most?

És még valami a drive formátuma: RAW nem tudom hogy ez fontos-e.

Probáltam Ubuntu alatt is sajnos szinten ezt irja ki.
Kérlek aki tud tanácsot adni hogyan tudnám az adatokat belőle kinyerni segitsen.
Előre is köszönök minden hozzászolást.

SMART error

Sziasztok!

Lefuttattam a smartctl-t az egyik régebbi 40es samsung vinyomon és volt egy érdekes adat "65535 errors detected". nem nagyon vagyok képbe, ez mit jelent pontosan milyen errorból van ilyen sok?

libata gond, döglődö vinyó vagy egyéb?

Kezdőként lehet, hogy nem legjobb helyre írom, de lehet, hogy nem linux kezdő a gond?

Az alábbi üzenetek jönnek elő véletlenszerűen. A részletet asszem a syslogból szedtem ki.
(a 3. sort tördeltem, hogy ne legyen km hosszú)


.
.
Oct 14 15:02:57 mojpece kernel: [    8.332726] ------------[ cut here ]------------
Oct 14 15:02:57 mojpece kernel: [    8.332726] WARNING: at drivers/ata/libata-sff.c:1321 ata_sff_hsm_move+0x5ff/0x674 [libata]()
Oct 14 15:02:57 mojpece kernel: [    8.332726] Modules linked in: sbp2 loop parport_pc parport floppy serio_raw via82cxxx snd_pcm snd_timer snd soundcore ohci1394 pcspkr 
snd_page_alloc psmouse ieee1394 i2c_i801 i2c_core rng_core ehci_hcd uhci_hcd usbcore e1000e button intel_agp agpgart sg sr_mod cdrom evdev ext3 jbd mbcache sd_mod
 thermal processor fan thermal_sys ide_pci_generic ide_core ata_piix ata_generic libata scsi_mod dock
Oct 14 15:02:57 mojpece kernel: [    8.332726] Pid: 0, comm: swapper Not tainted 2.6.26-2-686 #1
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c01225f3>] warn_on_slowpath+0x40/0x66
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c01319a9>] autoremove_wake_function+0xd/0x2d
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c01184d1>] __wake_up_common+0x2e/0x58
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c011a6bb>] __wake_up+0x29/0x39
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c0129b2c>] lock_timer_base+0x19/0x35
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c0129c3f>] __mod_timer+0x99/0xa3
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c01dc208>] cfq_completed_request+0x1c9/0x1ec
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c0137732>] clocksource_get_next+0x39/0x3f
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c013672a>] update_wall_time+0x519/0x68f
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<f887a21a>] ata_sff_hsm_move+0x5ff/0x674 [libata]
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c010fcbd>] lapic_next_event+0xc/0x10
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c0138838>] clockevents_program_event+0xc4/0xd2
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<f887aeca>] ata_sff_interrupt+0x124/0x19e [libata]
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c01520ea>] handle_IRQ_event+0x23/0x51
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c01532db>] handle_edge_irq+0xbf/0xfa
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c0105f3a>] do_IRQ+0x4d/0x63
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c0108bbf>] mwait_idle+0x0/0x3d
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c01042a7>] common_interrupt+0x23/0x28
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c0108bbf>] mwait_idle+0x0/0x3d
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c0108bee>] mwait_idle+0x2f/0x3d
Oct 14 15:02:57 mojpece kernel: [    8.332726]  [<c01025ce>] cpu_idle+0xab/0xcb
Oct 14 15:02:57 mojpece kernel: [    8.332726]  =======================
Oct 14 15:02:57 mojpece kernel: [    8.332726] ---[ end trace ec0a18d1a894cea4 ]---
Oct 14 15:02:57 mojpece kernel: [    8.332726] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Oct 14 15:02:57 mojpece kernel: [    8.332726] ata1.00: BMDMA stat 0x66
Oct 14 15:02:57 mojpece kernel: [    8.332726] ata1.00: cmd c8/00:08:56:97:68/00:00:00:00:00/e1 tag 0 dma 4096 in
Oct 14 15:02:57 mojpece kernel: [    8.332726]          res 51/84:00:5d:97:68/00:00:00:00:00/e1 Emask 0x30 (host bus error)
Oct 14 15:02:57 mojpece kernel: [    8.332726] ata1.00: status: { DRDY ERR }
Oct 14 15:02:57 mojpece kernel: [    8.332726] ata1.00: error: { ICRC ABRT }
Oct 14 15:02:57 mojpece kernel: [    8.332726] ata1: soft resetting link
Oct 14 15:02:57 mojpece kernel: [    8.540351] ata1.00: configured for UDMA/133
Oct 14 15:02:57 mojpece kernel: [    8.572337] ata1.01: configured for UDMA/133
Oct 14 15:02:57 mojpece kernel: [    8.572397] ata1: EH complete
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:0:0: [sda] 312581808 512-byte hardware sectors (160042 MB)
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:0:0: [sda] Write Protect is off
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:1:0: [sdb] 312581808 512-byte hardware sectors (160042 MB)
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:1:0: [sdb] Write Protect is off
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:1:0: [sdb] Mode Sense: 00 3a 00 00
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:1:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:0:0: [sda] 312581808 512-byte hardware sectors (160042 MB)
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:0:0: [sda] Write Protect is off
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:1:0: [sdb] 312581808 512-byte hardware sectors (160042 MB)
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:1:0: [sdb] Write Protect is off
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:1:0: [sdb] Mode Sense: 00 3a 00 00
Oct 14 15:02:57 mojpece kernel: [    8.585227] sd 0:0:1:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
.
.

Rákeresve ilyet is meg ilyet találtam. De magyarul is szeretnék olvasni róla valamit :) meg egyelőre nem lettem okosabb.

Debian Lenny, minimal install nincs grafikus környezet sem. A gépben két 160GB HDD van, korábban alaplapi fake RAID1-ben voltak. Raid szét lett bontva, majd az egyikre vinyóra rá lett rakva a Debian, a másik még ott figyel eredeti állapotában, felmountolva remekül tudom olvasni (sőt, még a régi Windows is elindul, ha a grubból azt választom ki.

Tehát a rendszer szuperül fut, csak a fenti cucc rondít be időnként a konzolra (pld man olvasgatás közben). Először HDD hibára gondoltam, de erre nem találtam egyértelmű utalást a logokban, plussz a talált linkek sem pont ilyesmire utalnak.

Ami még érdekes lehet,hogy a BIOS-ban a SATA mód IDE-re van állítva (valami régi MSI fullosabb alaplap). Sajnos most nem vagyok már a gép közelében, holnap tudok konkrétumokat, ha kellenek.

Szóval meg akar halni a vinyó (elvileg van bontatlan új), telepítés közben rontottam el valamit, a BIOS beállítás nem teszik neki, vagy a kernel "specialitása"? Találkozott már ezzel valaki?

linux, mdadm, raid kerdesek

Sziasztok!
Pa'r, egymashoz lazan kapcsolodo diszk/linux/mdadm/raid kerdes felmerult itten a napokban. Ha valakinek van otlete/tapasztata, ne tartsa vissza :)

  • Ha vesz az ember ke't kulonbozo gyartotol diszket, ami papirforma szerint ugyanakkora me'retu" (mondjuk 1.5 tera's), akkor mi az eselye, a ket gyarto ugyanolyan geometriaju (cyl/head/src) diszket ad? Pl most jott 4 db, XYZ gyarto altali diszk, az 182401/63/255-o"s. Ekkora mereteknel a 63/255 az mar nem nagyon lehet ma's, kerdes, hogy egy altalgos 1.5 teras diszknel mire lehet szamitani?
  • Linux/mdadm tud-e olyat hogy RAID5 + egy uj diszk => RAID6, me'retnovekedes nelkul? Naivan kiprobaltam tesztkornyezetben, erre azt mondja, hogy ``reshape'' csak akkor megy ha me'retet is novelunk. Oke, kiprobaltam azt is, RAID5 + ke't uj diszk => RAID6 + netto egy diszk, ugyanugy
    --grow

    . Erre az

    mdadm: Cannot set device size/shape for /dev/mdX: Invalid argument

    uzenettel elszall. Vagy ez felejtos?

  • Egy ujonnan letrehozott RAID5 v. RAID6 tombot miert nem szinkronizal neha a kernel? Neha "pending" allapotba kerul, neha ki kell venni egyet (--remove) majd hozzaadni (--add), es csak akkor indul meg a szinkron.

koszi, A.

500G diszkek alaplapi SATA RAID-hez

Windows-os gépbe kellene mentésre kb. 500G-s diszktömb, lehetőleg nem túl vészes áron. Néztem néhány olcsóbb diszket,pro és kontra véleményeket szeretnék róluk. Mindegyik 500G, 7200rpm, SATA2, 16M cache:

* Western Digital Green Caviar 500GB 16MB cache SATA-II
* Samsung Spinpoint F1 500 GB 16MB cache SATA2
* Seagate 500GB 16MB cache SATA2
* Hitachi 500GB 16MB cache SATA2
* Western Digital Blue Caviar 500GB 16MB cache SATA-II