Üdv,
nos, egy elég érdekes dolog van itt... Van egy gép, amiben van két 160-as ide samsung hdd soft raid1-ben, rajta egy rendszer (opensuse 11.3 x86), meg pár szolgáltatás, bár ez nem tudom mennyire fontos.
A gép fogja magát, és egyszercsak elkezdi tekerni a hdd-t. De folyamatosan, megállás nélkül. Mint amikor elkezd swapelni őrülten, vagy mintha egy dd-t tolnál rá. De közbe a gép "üresbe" van, szóval futnak rajta a servicek persze, de nincs belépve rá senki, nem egy find /-t nyomtak, nem gigabiten másolnak ftpre, nem resyncel a raid, semmi... Se top-ban, se iotop-ban nem látszik semmi, azon kívül, hogy van load. A jelenlegi folyamatos tekerés mellett iotop 85K-s írást jelez mindössze. Ram van még bőven, swapből 0 used.
Viszont, egyébként nem lassú a gép, szóval bármit csinálok vele, viszonyleg reszponzív. Ha más diszk műveletet indítok (pl. elkezdek másolni), akkor ez a tekerés abbamarad, a másolást megcsinálja normális sebességgel, ahogy amúgy is kifutná ezekből a diszkekből, majd folytatja a tekerést. A múltkor kipróbáltam, toltam egy rebootot. Nos, abbahagyta, servicek stop, ahogy kell, reboot, elindult, servicek is elindultak ahogy kell, login prompt.... és tekert tovább.
ext3 van minden partíción, először azt hittem, annak valami online defrag, vagy hasonló... :)
Dehát eddig nem csinálta, az utóbbi mondjuk 1 hónapba meg már sokadszor. A múltkor majd 5 órán keresztül tekert. A hdd smart infójában sincs változás, nincs bad sector, stb...
Mi az úristen lehet ez?
- 2544 megtekintés
Hozzászólások
Esetleg egy iotop kimenete segíthetne...
- A hozzászóláshoz be kell jelentkezni
iotop-ba egy 85K-s írás van mindössze, ami a syslog-ng-hez tartozik. Semmi más. De fogalmam sincs mit csinál.
Ha lelövöm, abbahagyja. Ha elindítom, folytatja.
--
Discover It - Have a lot of fun!
- A hozzászóláshoz be kell jelentkezni
Légyszi:
syslog-ng -V
syslog-ng.conf
--
\\-- blog --//
- A hozzászóláshoz be kell jelentkezni
# syslog-ng -V
syslog-ng 3.1.1
Installer-Version: 3.1.1
Revision: ssh+git://bazsi@git.balabit//var/scm/git/syslog-ng/syslog-ng-ose--mainline--3.1#master#8747d74491eac3fdf5052194f47a68e659633ca9
Compile-Date: Jul 5 2010 13:27:59
Enable-Threads: off
Enable-Debug: off
Enable-GProf: off
Enable-Memtrace: off
Enable-Sun-STREAMS: off
Enable-Sun-Door: off
Enable-IPv6: on
Enable-Spoof-Source: on
Enable-TCP-Wrapper: on
Enable-SSL: off
Enable-SQL: off
Enable-Linux-Caps: off
Enable-Pcre: on
# cat syslog-ng.conf
@version:3.0
#
# /etc/syslog-ng/syslog-ng.conf
#
# File format description can be found in syslog-ng.conf(5)
# and in /usr/share/doc/packages/syslog-ng/syslog-ng.txt.
#
# NOTE: The SuSEconfig script and its syslog-ng.conf.in
# configuration template aren't used any more.
#
# Feel free to edit this file directly.
#
#
# Global options.
#
options { long_hostnames(off); flush_lines(0); perm(0640); stats_freq(3600); };
#
# 'src' is our main source definition. you can add
# more sources driver definitions to it, or define
# your own sources, i.e.:
#
#source my_src { .... };
#
source src {
#
# include internal syslog-ng messages
# note: the internal() soure is required!
#
internal();
#
# the default log socket for local logging:
#
unix-dgram("/dev/log");
#
# uncomment to process log messages from network:
#
#udp(ip("0.0.0.0") port(514));
};
include "/var/run/syslog-ng/additional-log-sockets.conf";
#
# Filter definitions
#
filter f_iptables { facility(kern) and message("IN=") and message("OUT="); };
filter f_console { level(warn) and facility(kern) and not filter(f_iptables)
or level(err) and not facility(authpriv); };
filter f_newsnotice { level(notice) and facility(news); };
filter f_newscrit { level(crit) and facility(news); };
filter f_newserr { level(err) and facility(news); };
filter f_news { facility(news); };
filter f_mailinfo { level(info) and facility(mail); };
filter f_mailwarn { level(warn) and facility(mail); };
filter f_mailerr { level(err, crit) and facility(mail); };
filter f_mail { facility(mail); };
filter f_cron { facility(cron); };
filter f_local { facility(local0, local1, local2, local3,
local4, local5, local6, local7); };
#
# acpid messages
#
filter f_acpid_full { message('^acpid:'); };
filter f_acpid { level(emerg..notice) and message('^acpid:'); };
# this is for the old acpid < 1.0.6
filter f_acpid_old { message('^\[acpid\]:'); };
filter f_netmgm { message('^NetworkManager:'); };
filter f_messages { not facility(news, mail) and not filter(f_iptables); };
filter f_warn { level(warn, err, crit) and not filter(f_iptables); };
filter f_alert { level(alert); };
#
# Enable this and adopt IP to send log messages to a log server.
#
#destination logserver { udp("10.10.10.10" port(514)); };
#log { source(src); destination(logserver); };
#
# Enable this, if you want to keep all messages in one file:
# (don't forget to provide logrotation config)
#
#destination allmessages { file("/var/log/allmessages"); };
#log { source(src); destination(allmessages); };
#
# Most warning and errors on tty10 and on the xconsole pipe:
#
destination console { file("/dev/tty10" owner(-1) group(-1) perm(-1)); };
log { source(src); source(chroots); filter(f_console); destination(console); };
destination xconsole { pipe("/dev/xconsole" owner(-1) group(-1) perm(-1)); };
log { source(src); source(chroots); filter(f_console); destination(xconsole); };
# Enable this, if you want that root is informed immediately,
# e.g. of logins:
#
#destination root { usertty("root"); };
#log { source(src); source(chroots); filter(f_alert); destination(root); };
#
# News-messages in separate files:
#
destination newscrit { file("/var/log/news/news.crit"
owner(news) group(news)); };
log { source(src); source(chroots); filter(f_newscrit); destination(newscrit); };
destination newserr { file("/var/log/news/news.err"
owner(news) group(news)); };
log { source(src); source(chroots); filter(f_newserr); destination(newserr); };
destination newsnotice { file("/var/log/news/news.notice"
owner(news) group(news)); };
log { source(src); source(chroots); filter(f_newsnotice); destination(newsnotice); };
#
# and optionally also all in one file:
# (don't forget to provide logrotation config)
#
#destination news { file("/var/log/news.all"); };
#log { source(src); source(chroots); filter(f_news); destination(news); };
#
# Mail-messages in separate files:
#
destination mailinfo { file("/var/log/mail.info"); };
log { source(src); source(chroots); filter(f_mailinfo); destination(mailinfo); };
destination mailwarn { file("/var/log/mail.warn"); };
log { source(src); source(chroots); filter(f_mailwarn); destination(mailwarn); };
destination mailerr { file("/var/log/mail.err" fsync(yes)); };
log { source(src); source(chroots); filter(f_mailerr); destination(mailerr); };
#
# and also all in one file:
#
destination mail { file("/var/log/mail"); };
log { source(src); source(chroots); filter(f_mail); destination(mail); };
#
# acpid messages in one file:
#
destination acpid { file("/var/log/acpid"); };
destination devnull { };
log { source(src); source(chroots); filter(f_acpid); destination(acpid); flags(final); };
#
# if you want more verbose acpid logging, comment the destination(null)
# line and uncomment the destination(acpid) line
#
log { source(src); source(chroots); filter(f_acpid_full); destination(devnull); flags(final); };
# log { source(src); source(chroots); filter(f_acpid_full); destination(acpid); flags(final); };
#
# old acpid < 1.0.6
log { source(src); source(chroots); filter(f_acpid_old); destination(acpid); flags(final); };
#
# NetworkManager messages in one file:
#
destination netmgm { file("/var/log/NetworkManager"); };
log { source(src); source(chroots); filter(f_netmgm); destination(netmgm); flags(final); };
#
# Cron-messages in one file:
# (don't forget to provide logrotation config)
#
#destination cron { file("/var/log/cron"); };
#log { source(src); source(chroots); filter(f_cron); destination(cron); };
#
# Some boot scripts use/require local[1-7]:
#
destination localmessages { file("/var/log/localmessages"); };
log { source(src); source(chroots); filter(f_local); destination(localmessages); };
#
# All messages except iptables and the facilities news and mail:
#
destination messages { file("/var/log/messages" owner(-1) group(-1) perm(-1)); };
log { source(src); source(chroots); filter(f_messages); destination(messages); };
#
# Firewall (iptables) messages in one file:
#
destination firewall { file("/var/log/firewall"); };
log { source(src); source(chroots); filter(f_iptables); destination(firewall); };
#
# Warnings (except iptables) in one file:
#
destination warn { file("/var/log/warn" fsync(yes)); };
log { source(src); source(chroots); filter(f_warn); destination(warn); };
- A hozzászóláshoz be kell jelentkezni
A chroots source driver nem látszik a konfigodban, pedig több helyen is meghivatkozod.
Illetve a 'unix-dgram' helyett írhatnál 'unix-stream'-et, egy ideje az a default.
Ha nem hoz változást, akkor állítsd le a syslog-ng-t és indítsd kézzel debug módban, foreground-ban.
syslog-ng -Fedv 2> /path/to/save/the/debug/file
Esetleg strace-lheted is.
Szerk:
most látom, hogy a destination-nál beállítottad az fsync(yes)-t. Nah az könnyen megeheti a diszket. Kapcsold ki egy teszt erejéig.
https://www.balabit.com/sites/default/files/documents/syslog-ng-ose-v3…
--
\\-- blog --//
- A hozzászóláshoz be kell jelentkezni
OK, megpróbálom, egyelőre kivettem az fsync-et, meglátom majd hogy alakul.
Köszönöm.
--
Discover It - Have a lot of fun!
- A hozzászóláshoz be kell jelentkezni
Nem a SMART-od csinal tesztet a hatterben? Az szokott ilyen lenni. Erdemes lenne megnezned, hogy mikor volt a legutolso 5 teszted a SMART szerint.
Ha kikapcsolod a SMART auto teszteket, akkor abbamarad a tekergeles?
- A hozzászóláshoz be kell jelentkezni
Hasonlóan én is jártam már. Egy (talán Hitachi) 2,5" HDD USB-s külső rackben csinálta, hogy folyamatosan "kattogott". Kb. mintha a fejet a két végállás között mozgatná. Csak arra tudtam tippelni, hogy az elektronika önteszteket hajt végre, mert egyébként teljesítményben nem látszódott semmi visszaesés. Figyelni kell a SMART értékeket, hátha ott látszik valami. (A biztonság kedvéért inkább lecseréltem egy másik HDD-re)
--
http://www.open-st.eu
- A hozzászóláshoz be kell jelentkezni
Nem, akkor volt test, amikor én csináltam...
--
Discover It - Have a lot of fun!
- A hozzászóláshoz be kell jelentkezni
updatedb, slocate és hasonló indexelő szolgáltatások nem futnak rajta?
- A hozzászóláshoz be kell jelentkezni
Nem, semmi ilyen.
--
Discover It - Have a lot of fun!
- A hozzászóláshoz be kell jelentkezni
cat /proc/mdstat
A debian csinálja, hogy néha ellenőrzi a mirrorok állapotát, ott meg tudod nézni, hogy. Bár ez nem megy sűrűn, talán havonta 1x.
- A hozzászóláshoz be kell jelentkezni
Nem csinál semmit.
--
Discover It - Have a lot of fun!
- A hozzászóláshoz be kell jelentkezni
Mi a fenti parancs kimenete?
- A hozzászóláshoz be kell jelentkezni
Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md127 : active raid1 sdb6[0] sda6[1]
76212224 blocks [2/2] [UU]
md126 : active raid1 sdb5[0] sda5[1]
48829440 blocks [2/2] [UU]
md125 : active raid1 sdb3[0] sda3[1]
971840 blocks [2/2] [UU]
md123 : active raid1 sdb1[0] sda1[1]
144448 blocks [2/2] [UU]
md124 : active raid1 sdb2[0] sda2[1]
30126848 blocks [2/2] [UU]
unused devices: <none>
- A hozzászóláshoz be kell jelentkezni
És ugye közben teker meg minden? Mert ha igen, akkor nem ez volt az oka :(
- A hozzászóláshoz be kell jelentkezni
Persze, azóta is megy.
[szerk] Mármint, akkor még mikor megnéztem ment, már abbahagyta
--
Discover It - Have a lot of fun!
- A hozzászóláshoz be kell jelentkezni
Nem a debian csinálja, hanem az mdadm, minden disztrón. :) Csak hogy pontosak legyünk. ;)
- A hozzászóláshoz be kell jelentkezni
Azt irtad, hogy van load.
A top/ps nem arulja el, hogy mi okozza?
--
Always remember - correlation does not imply causation.
Since realising this, my life has been so much better.
- A hozzászóláshoz be kell jelentkezni
Nem feltétlen, mert a magas load bármitől lehet. Esetleg az atop meg tudja mutatni, de meg kellene néznem, h az figyeli-e pl. a kernel threadjeit.
Nha, megnéztem. IO-ban nem mutat semmit, de CPU-ban látszik a md2_raid1, ha a checkarray-t rábököm a.
- A hozzászóláshoz be kell jelentkezni
Az iostat mutatja a forgalmat? Hány KB/s illetve IOPS? Közben mennyire Busy a diszk?
- A hozzászóláshoz be kell jelentkezni