Smartmontools
Telepítés: `sudo apt install smartmontools`
Info lekérdezése:
Először is fel kéne fedezni, mi van a gépben:
$ sudo smartctl -A /dev/sda
# nincs lenyegi info, tok ures
$ sudo smartctl --scan
/dev/sda -d scsi # /dev/sda, SCSI device
Hát ez nem mondott sokat, vajon hardware raid-e?:
$ cat /sys/block/sda/device/model
LOGICAL VOLUME
$ lspci |grep -i 'raid'
03:00.0 RAID bus controller: Hewlett-Packard Company Smart Array Gen9 Controllers (rev 01)
$ cat /sys/block/sda/device/raid_level
RAID 5
$ cat /proc/scsi/scsi
Attached devices:
Host: scsi0 Channel: 00 Id: 00 Lun: 00
Vendor: HP Model: P440ar Rev: 1.34
Type: RAID ANSI SCSI revision: 05
Host: scsi0 Channel: 01 Id: 00 Lun: 00
Vendor: HP Model: LOGICAL VOLUME Rev: 1.34
Type: Direct-Access ANSI SCSI revision: 05
Host: scsi6 Channel: 00 Id: 00 Lun: 00
Vendor: hp Model: DVD RAM UJ8C2 Rev: SC02
Type: CD-ROM ANSI SCSI revision: 05
Ez annak néz ki:), de a tuti:
$ sudo apt install hwinfo
$ hwinfo --storage
40: PCI 1f.2: 0106 SATA controller (AHCI 1.0)
[Created at pci.366]
Unique ID: w7Y8.AWGP+VY_LGA
SysFS ID: /devices/pci0000:00/0000:00:1f.2
SysFS BusID: 0000:00:1f.2
Hardware Class: storage
Device Name: "Embedded SATA Controller #1"
Model: "Intel C610/X99 series chipset 6-Port SATA Controller [AHCI mode]"
Vendor: pci 0x8086 "Intel Corporation"
Device: pci 0x8d02 "C610/X99 series chipset 6-Port SATA Controller [AHCI mode]"
SubVendor: pci 0x103c "Hewlett-Packard Company"
SubDevice: pci 0x8030
Revision: 0x05
Driver: "ahci"
Driver Modules: "ahci"
I/O Ports: 0x3058-0x305f (rw)
I/O Ports: 0x307c-0x307f (rw)
I/O Ports: 0x3050-0x3057 (rw)
I/O Ports: 0x3078-0x307b (rw)
I/O Ports: 0x3020-0x303f (rw)
Memory Range: 0x92e00000-0x92e007ff (rw,non-prefetchable)
IRQ: 55 (1753418 events)
Module Alias: "pci:v00008086d00008D02sv0000103Csd00008030bc01sc06i01"
Driver Info #0:
Driver Status: ahci is active
Driver Activation Cmd: "modprobe ahci"
Config Status: cfg=new, avail=yes, need=no, active=unknown
50: PCI 300.0: 0104 RAID bus controller
[Created at pci.366]
Unique ID: svHJ.ccZlDNM+DaD
Parent ID: vSkL.UGYbXt7l340
SysFS ID: /devices/pci0000:00/0000:00:01.0/0000:03:00.0
SysFS BusID: 0000:03:00.0
Hardware Class: storage
Device Name: "Embedded RAID"
Model: "Hewlett-Packard Company P440ar"
Vendor: pci 0x103c "Hewlett-Packard Company"
Device: pci 0x3239 "Smart Array Gen9 Controllers"
SubVendor: pci 0x103c "Hewlett-Packard Company"
SubDevice: pci 0x21c0 "P440ar"
Revision: 0x01
Driver: "hpsa"
Driver Modules: "hpsa"
Memory Range: 0x92c00000-0x92cfffff (rw,non-prefetchable)
Memory Range: 0x92d00000-0x92d003ff (rw,non-prefetchable)
I/O Ports: 0x2000-0x20ff (rw)
Memory Range: 0x92d80000-0x92dfffff (ro,non-prefetchable,disabled)
IRQ: 16 (no events)
Module Alias: "pci:v0000103Cd00003239sv0000103Csd000021C0bc01sc04i00"
Driver Info #0:
Driver Status: hpsa is active
Driver Activation Cmd: "modprobe hpsa"
Config Status: cfg=new, avail=yes, need=no, active=unknown
Attached to: #8 (PCI bridge)
Short (2 perc), Long (4 óra, 32 perc) test indítása:
$ sudo smartctl -t short -d cciss,0 /dev/sg0
$ sudo smartctl -t short -d cciss,1 /dev/sg0
$ sudo smartctl -t short -d cciss,2 /dev/sg0
$ sudo smartctl -t long -d cciss,0 /dev/sg0
$ sudo smartctl -t long -d cciss,1 /dev/sg0
$ sudo smartctl -t long -d cciss,2 /dev/sg0
Állapot lekérdezése:
$ sudo smartctl -a -d cciss,0 /dev/sg0
$ sudo smartctl -a -d cciss,1 /dev/sg0
$ sudo smartctl -a -d cciss,2 /dev/sg0
martctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-127-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
/dev/sg0 [cciss_disk_02] [SAT]: Device open changed type from 'sat,auto+cciss' to 'sat'
=== START OF INFORMATION SECTION ===
Model Family: Samsung based SSDs
Device Model: Samsung SSD 850 PRO 512GB
Serial Number: S2BENWAG300095Y
LU WWN Device Id: 5 002538 8700b56dd
Firmware Version: EXM02B6Q
User Capacity: 512,110,190,592 bytes [512 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Mon Jul 2 21:28:18 2018 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART Status not supported: Incomplete response, ATA output registers missing
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 0) seconds.
Offline data collection
capabilities: (0x53) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 272) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 35496
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 26
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always - 30
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 063 057 000 Old_age Always - 37
195 ECC_Error_Rate 0x001a 200 200 000 Old_age Always - 0
199 CRC_Error_Count 0x003e 100 100 000 Old_age Always - 0
235 POR_Recovery_Count 0x0012 099 099 000 Old_age Always - 23
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 5818675394
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 35496 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Van egy régebbi hp hardware-es raid-em is, ott
$ for i in `seq 0 128`; do echo -e "\n\n----"; sudo smartctl -a -d cciss,$i /dev/cciss/c0d0; done > smartctl.info.txt
Paranccsal kérdeztem le, hogy mi újság.
- khiraly blogja
- A hozzászóláshoz be kell jelentkezni
- 1226 megtekintés
Hozzászólások
Mindenki múzeumi verziókat telepít? Egy cimbora SLES-9/SLES-10 ISO-kat vadászik épp...
- A hozzászóláshoz be kell jelentkezni
En most arra lennék kíváncsi, hogy egy 15k SAS vinyónak mennyi az átlagos hőmérséklete...
Mert most egy 71C, egy 82C, egy 89C, egy pedig WARNING - SPECIFIED TEMPERATURE EXCEEDED [asc=b, asq=1], es most 65C-os, van meg 76C, meg 61C.
(de ki kellett vennem, hogy lehuljon mert a ledje tok sotet volt. Sajnos nem vilagitott pirossal, ahogy illene. Visszarakas utan, ujra zold).
Amikor kivettem, akkor megegettem az ujjam, most van egy vizholyagom is. Szuper:)
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
Nekem ugy remlik, hogy 65C folott ugrik a garancia. Tehat a gyarto 65C-ig gondolja ugy, hogy mukodik a termeke.
- A hozzászóláshoz be kell jelentkezni
most a smart teszt vagy befulladt, vagy meg mindig fut. Mind1 csinaltam egy reverse ssh tunnelt es otthagytam. Majd reggeli kozben ranezek, meg inditok meg egy tesztet. Fizikailag szerintem egy hetig nem jarok arra.
Csak nehez elhinni, hogy az osszes lemez egyszerre adja be a kulcsot.
Kosz az infot.
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
Ebből én inkább arra gyanakodnék, hogy nem e döglött be a szerver teremben a klíma.
____________________________________
Az embert 2 éven át arra tanítják hogyan álljon meg a 2 lábán, és hogyan beszéljen... Aztán azt mondják neki: -"Ülj le és kuss legyen!"..
- A hozzászóláshoz be kell jelentkezni
18C, es mukodik a klima a helyisegben.
Egyebkent 25C-ra van allitva telen-nyaron a szint/epulet, ahol van. Es a valosagban 24-25C kozott van mindig.
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
Erdekes.
A tesztekre meg mindig "Self test in progress ... " van, pedig mostmar tobb mint 12 oraja inditottam el.
A homerseklet normalizalodott: 52C
Pedig egy linux live cd-rol fut a rendszer (ubuntu 10.04). Szoval a merevlemezt nem hasznaltam, csak a teszt miatt.
Ilyenek a tesztek egyebkent:
ubuntu@ubuntu:~$ sudo smartctl -a -d cciss,0 /dev/cciss/c0d0
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
Device: HP DF300BB6C3 Version: HPDA
Serial number: 3LM4S08900009846UHS6
Device type: disk
Transport protocol: SAS
Local Time is: Tue Jul 3 06:56:49 2018 UTC
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Current Drive Temperature: 52 C
Drive Trip Temperature: 68 C
Elements in grown defect list: 27
Vendor (Seagate) cache information
Blocks sent to initiator = 1807985396
Blocks received from initiator = 4002875545
Blocks read from cache and sent to initiator = 2964592420
Number of read and write commands whose size <= segment size = 478559098
Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
number of hours powered up = 3776.73
number of minutes until next internal SMART test = 14
Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 0 0 0 0 0.000 0
write: 0 0 0 0 0 0.000 0
Non-medium error count: 0
SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background long Self test in progress ... - NOW - [- - -]
Long (extended) Self Test duration: 2800 seconds [46.7 minutes]
Itt egy masik:
ubuntu@ubuntu:~$ sudo smartctl -a -d cciss,0 /dev/cciss/c0d0
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
Device: HP DF300BB6C3 Version: HPDA
Serial number: 3LM4S08900009846UHS6
Device type: disk
Transport protocol: SAS
Local Time is: Tue Jul 3 06:56:22 2018 UTC
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Current Drive Temperature: 52 C
Drive Trip Temperature: 68 C
Elements in grown defect list: 27
Vendor (Seagate) cache information
Blocks sent to initiator = 1807973203
Blocks received from initiator = 4002875545
Blocks read from cache and sent to initiator = 2964590020
Number of read and write commands whose size <= segment size = 478559076
Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
number of hours powered up = 3776.72
number of minutes until next internal SMART test = 14
Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 0 0 0 0 0.000 0
write: 0 0 0 0 0 0.000 0
Non-medium error count: 0
SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background long Self test in progress ... - NOW - [- - -]
Long (extended) Self Test duration: 2800 seconds [46.7 minutes]
ubuntu@ubuntu:~$ sudo smartctl -a -d cciss,1 /dev/cciss/c0d0
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
Device: HP DF300BABUF Version: HPD6
Serial number: J8X5B4MC
Device type: disk
Transport protocol: SAS
Local Time is: Tue Jul 3 06:56:41 2018 UTC
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Current Drive Temperature: 52 C
Drive Trip Temperature: 70 C
Manufactured in week 19 of year 2008
Recommended maximum start stop count: 50000 times
Current start stop count: 75 times
Elements in grown defect list: 31
Vendor (Seagate) cache information
Blocks sent to initiator = 41333996574998528
Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 0 0 0 0 0.000 0
write: 0 0 0 0 0 0.000 0
Non-medium error count: 969
SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background long Failed in segment --> 7 2233118446744069417750332 [0x3 0x11 0x0]
Long (extended) Self Test duration: 3593 seconds [59.9 minutes]
Ami jelenseg volt:
a) regi szerver megfekudt (windows)
b) hardware raid, a front panelen zold ledek villognak:)
c) tegnap az egyiknek a ledje elsotetult, es sotet is maradt. Ekkor egettem meg vele az ujjam.
d) tegnap 80C korul volt az osszes. Ma reggelre normalizalodott
e) windows telepitesnel nem tudta megformazni a meghajtot, csak gyorsba
e) windows telepitesnel a telepito allandoan panaszkodott, hogy egy-egy fajlt nem sikerult atmasolni (manualisan kellett entert utni), majd 4 ora molyolas utan kiirta, hogy a telepites nem sikerult meg egyik fajl 0. sorat nem tudja olvasni. Ujrainditashoz nyomjon meg egy billentyut.
Persze a telepitett windows nem tudott elindulni.
Igazabol jo lenne megallapitani, hogy mely hdd-k biztosan rosszak. Kidobni, es azok nelkul ujrakonfiguralni a raidet, vagy ha csak 2 jo, akkor RAID 1-be tenni.
Ha csak egy jo, akkor arrol menne a szerver.
A szervert mar nyugdijaztam, helyette megy masik. De egy program miatt kellene az eredeti szerver.
Inditottam egy ujabb tesztet:
Extended Background Self Test has begun
Please wait 46 minutes for test to complete.
Estimated completion time: Tue Jul 3 07:55:34 2018
46,59,31,39,65 perceket ir. Tegnap mintha tobbet irt volna.
Kicsit tanacstalan vagyok mi a definitive valasz, melyikeket dobaljam ki belole... :))
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
Mivel HP, ezért esetleg egy SPP bootcd-vel nekiesni és megnézni hátha az többet mond ? Akár magáról a raid vezérlőről is.
De csak egy tipp. Lehet itt maga a raid controller vacakol, főleg az utolsó "windows telepítéses" történetet figyelvén.
Bár rendben a raid controller az HP 440ar, a szerverről nem tudjuk a típusát. (vagy én szaladtam el a sok smart adat között :) )
- A hozzászóláshoz be kell jelentkezni
itt 2 szerver van. A blogbejegyzesben levo egy dell szerver, ssd vinyokkal (ott irtam a smartmontoolsrol).
Amivel gond van, es amire a 10.04-et vadasztam az egy hp szerver, es abban 15k HP SAS vinyok vannak.
Letoltottem a hpa-cuclit innen:
wget http://downloads.linux.hpe.com/SDR/repo/mcp/ubuntu/pool/non-free/hpacuc…
=> rescan
=> ctrl all show config
(itt mindegyik OK)
=> ctrl all show status
Smart Array E200i in Slot 0 (Embedded)
Controller Status: OK
=> ctrl slot=0 pd 1I:1:1 show details
Status: OK
Most *minden* OK-nak tunik. Teljes rejtely mi a baja. A 90C-os vizholyagos kaland az nem tunik normalisnak nekem...
Mindegy, jovo heten ujra jarok arra. Addig barmit meg tudok nezni ami fut ubuntu 10.04 alatt:)
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
Gondolom azóta megoldódott. De néhány gondolat kikívánkozik belőlem.
Ha nem mennek az újabb Ubuntuk, ki kell deríteni az okát. Nem downgrade-elni millió éves verzióra, hanem működésre kell bírni az újakat.
Ha tényleg nem jár sikerrel, akkor Linuxból nem csak Ubuntu van, meg nem csak Ubuntu/Deb alapú, meg lehet próbálkozni Fedora, Arch, stb-vel is.
A long SMART teszt hülyeség. Alapvetően ha egy meghajtó rossz, az már a legutóbbi állapotteszten is látszik, ha nagyon paranoiás valaki, akkor egy rövid tesztet is lenyomathat, de a long testnek nincs értelme, órákat várni feleslegesen. Olyanról még nem olvastam, hogy az adott meghajtó hibáját csak a long test tudta kimutatni.
No keyboard detected... Press F1 to run the SETUP
- A hozzászóláshoz be kell jelentkezni
>Gondolom azóta megoldódott.
Nem oldodott meg meg. Fizikailag jovo heten fogok ujra arra jarni.
Most be tudok jelentkezni a gepre reverse ssh tunnelen keresztul.
> De néhány gondolat kikívánkozik belőlem.
Nosza! Vegulis forum, vagy mifene:)
> Ha nem mennek az újabb Ubuntuk, ki kell deríteni az okát. Nem downgrade-elni millió éves verzióra, hanem működésre kell bírni az újakat.
Ezzel elvi sikon se ertek egyet. Es nem azert, mert nem mernek masik linuxot telepiteni.
De a feladat ez:
- van egy regi windowsos szerver, egy adott programmal ami igenyli ezt a kornyezetet.
Ezt kell helyreallitani.
1) Ugyan van mentes (meg szalagos mentes is), de elesben en sose probaltam helyreallitani belole 0-rol (nem volt plusz licenszem, meg szabad 6-7 napom:),
meg egyebkent is *minden* esetben ha gepet szerelek, elotte csinalok rola egy full mentest. Es azt a mentest fel evig megorzom. (learned the hard way...)
2) tehat le kell menteni a gepet, amit live linuxszal a legegyszerubb, mivel hardware-es RAID vezerlo van benne. rsync-et neki:) A linux verzioja ebben az esetben tokeletesen mindegy.
3) ezen a gepen a budos eletben nem lesz linux. Ez vagy ujra windows-t kap (ugyanazt a regit), vagy ki lesz dobva. Mi a toknek szarakodnam ki, hogy miert nem indul rajta ujabb linux? Sohase kell.
4) Ra kellene jonni, hogy hardware-ban mi baja. Amitol "belassult" a program rajta, ami miatt (windowsbol) ujra lett inditva, es soha tobbet nem indult el.
A windows telepites (miutan le lett mentve, tehat formazhatnam), nem sikerult:
4a) telepitesnel csak a gyors formazas sikerult, a rendes formazasnal hibat dobott
4b) fajlok masolasanal (ami vagy 5 orat tartott) allandoan hibat dobott a telepito, amit enterezgetni kellett. Es a vegen kiirta, hogy xy fajl 0. sorat nem sikerult olvasni, es nem tud indulni. Ujrainditasnal nem is indul.
5) Egyertelmuen nem tudom megmondani, hogy a benne levo 5 lemezbol melyik a hibas. Most mindegyik "jonak" nez ki. hpacucli szerint raid vezerlo OK, lemezek OK. a smartctl szerint (itt van beposztolva a kimenete) egyreszt nagyon rovid, masreszt a long teszt sose futott le. De a homersekletuk normalizalodott.
Jobb 5let hijan rendeltettem bele uj akkumulatort (raid vezerlobe) es uj elemet az alaplapba. Az sose art:) De meg tanacstalan vagyok:)
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
"le kell menteni a gepet, amit live linuxszal a legegyszerubb" - nem a legegyszerűbb, hanem _neked_ úgy egyszerű. Van más megoldás is. Tudom, akinek kalapácsa van, annak minden szög, de jelen esetben nem ez tűnik a jó iránynak.
Erre nincs mit mondani...: "van mentes (meg szalagos mentes is), de elesben en sose probaltam helyreallitani belole"
Ha jól értem, ez egy Windows-os gép, ami nagy val.séggel hardveres probléma miatt elhasalt, és nem indul el. Itt hardverteszt/javítás, illetve szoftveres helyreállítás kellene - ha a hardverhiba adatvesztést okozott, akkor a hardver helyrekalapálása _után_ elő kell venni a mentést, és visszarakni, és kész.
- A hozzászóláshoz be kell jelentkezni
Hardverhibat nem tudom egyertelmuen megmondani, potalkatreszeim meg nincsenek, hogy szabadon cserelgessem.
Szivesen meghallgatnam, hogy *te* hogyan csinalnad. Mondjuk windows alapon.
> helyrekalapálása _után_ elő kell venni a mentést, és visszarakni, és kész.
Erre nincs szukseg, mivel mar minden at lett migralva elotte uj szerverre (egy program kivetelevel).
> Erre nincs mit mondani...:
Ezt igy visszaolvasva tenyleg szarul hangzik. De annyira nem rossz a helyzet. En lementettem minden programot/komponenst kulon periodikusan, automatan. Plusz volt beepitett szalagos mentes is. Ezeket mind vegigneztem, hogy vissza lehet allitani (virtualis gepben).
Azt nem probaltam ki sose, hogy az adott szervert 0-rol ujrahuzom es az eredeti backupokbol ujraepitem 0-rol. Magyaran kikapcsolom a gepet kihuzogatom beloluk a vinyokat, felteszem a polcra, beteszek vadi uj vinyokat, es megnezem, hogy ujra tudom epiteni pont ugyanugy mint eddig. Majd a vegen ujra kikapcsolom, kihuzom a vinyokat, es a polcrol visszateszem az eredeti vinyokat, es megy az elet tovabb, mintha mi se tortent volna. <-- noh ezt nem csinaltam meg.
Es a vegen is inkabb azt az utat valasztottam, hogy uj szervert telepitettem, es minden szolgaltatast kivaltottam. Egy program maradt hatra. Ennyi.
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
A hiba oka: "sz.r az egész" <- :)
btw ezt a Windows / rajta futó program csodát nem lehet valahogy virtualizálni és berakni egy VM alá ?
- A hozzászóláshoz be kell jelentkezni
De. Csak windows 2003 licensznel megakadtam. Topik itt:
https://hup.hu/node/159749
Most az lett a cegnel a konkluzio, hogyha a regi szervert meg lehet javitani, akkor azon fusson tovabb.
Szerintem egyebkent a RAID vezerlo szarakodik. De ez csak megerzes:)
Akksit cserelek benne, hatha. Ha akkor is kiakad, akkor kiszedem belole a lemezeket, es 1 lemezt beteszek, amelyikre fel tudom tenni, ott fog megrohadni:)
(majd utana atteszem raid 1-be).
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
Win2k3 license :) * De ezen a fizikai vason van ilyen nem? Az simán be lehet virtualizálni MS szerint is nem ? Lehet tévedek. De ha kidöglik megvásárolt SW alól a HW (és ha nem OEM, márpedig nem) akkor csak legyen már lehetőség valami olyasmire hogy másik gépre akár VM-be átrakjuk ? :)
Passz :/
Kitartást, éljen Szál... izéé V.. izéé Hofi! :)
- A hozzászóláshoz be kell jelentkezni
azon a fizikai vason (4GB ram) nem akarnam virtualizalva futtatni a windows2003-at. Meg ha nincs hardware baja mar, akkor a windows is elketyeg rajta.
Van masik szerver, amin szivesen futtatnam, de azt egyelore elvetettuk licensz/ar miatt.
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
Azt a "majd utana atteszem raid 1-be"-t szerintem felejtsd el. Indulj egyből tükrözött diszkekkel, oszt' jónapot.
- A hozzászóláshoz be kell jelentkezni
Csak nem tudom egyertelmuen megmondani, hogy melyik diszk szar az 5-bol.
Vagy a raid vezerlo
update: glitch a matrixban, most - kopp-kopp - semmi baja, es szepen megy ...
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni
"Olyanról még nem olvastam, hogy az adott meghajtó hibáját csak a long test tudta kimutatni."
Pl. sok ritkán használt nagy file, a tartalmában valahol bithiba van. Ha nem mész végig a teljes felületen, nem olvasod végig az összes szektor tartalmát elejétől végéig és hasonlítod össze a checksum-mal, hanem csak random fél-1%-át a teljes tárterületnek, akkor kb. soha nem fog kiderülni a hiba. Csak mikor kellene ténylegesen az a ritkán előszedett file ill. a tartalma. Erre jó sztem a long teszt. Futtatja a háttérben alacsony prioritással, 0/24-es szervereken legalább pár hét alatt biztosan végigér az egészen. Otthoni desktop gépen ha nincs rendszeresen hosszabb időre diszk-idle állapotban, nem biztos h. végigér mindenen, mielőtt a baj megtörténne. Illetve alapesetben a long v. hozzá hasonló background scan nem is szokott engedélyezve lenni egy lemezen sem, smartctl-el szoktam bekapcsolni én is.
- A hozzászóláshoz be kell jelentkezni
Tegnap ujra arra jartam, es csont nelkul felment a windows, es "semmi baja".
Mar el is felejtettem, hogy mennyire utalok windows-zal bajlodni:
- 9x kellett ujrainditani telepites alatt (egy szerver hardvert nem nagy elmeny ujrainditani, vagy 5 percig tart)
- 16 ora hosszaig tartott, ejszaka 2-re vegeztem:(
- ebbol 2 ora volt *halozati kartya driveret* vadaszni. Beepitett Broadcom GbE
Vegul a lenovo.com-on talaltam egy varazslot (340MB), ami feltette es utana jo lett.
- internetes aktivalas nem megy, igy telefonon kellett.
Meg az sql-lel kellett szarakodni egy kicsit, de az mar feludules volt.
Szoval megy. sshtunnelen keresztul rdp-zek ra, az active directory szervert leszedtem rola. Jovo heten meg minden szart lecsupaszitok. Meg rakok ra rsync-et.
Az igazi szepseg az egeszben, hogyha telepiteskor kivalasztom, hogy nem kell SharePoint, akkor service pack telepitesnel hibauzenettel kilep (nem sikerult a sharepoint frissitese).
Most konzervaltam olyan 130kWh/ho fogyasztast a kovetkezo 10 evre...
Save the planet oo|o>
---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....
- A hozzászóláshoz be kell jelentkezni