Syslog bejegyzés értelmezése...

Fórumok

Sziasztok! Szükségem lenne segítségre az alábbi néhány sor értelmezésében, mert nem tudom, hogy vajon mit jelentenek.

Úgy 5-10 percenként jelennek meg a syslogban üresjáratban is, de pl. nagyobb méretű mappák NAS-ra történő rsync-elése esetén már másodpercenként többször (az utóbbi esetben néha 5-10 mp-re meg is áll az rsync, majd folytatja tovább):

Dec 26 10:36:28 bela kernel: [85481.786114] pcieport 0000:00:1c.5: AER: Multiple Corrected error received: 0000:00:1c.5
Dec 26 10:36:28 bela kernel: [85481.786129] pcieport 0000:00:1c.5: AER: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Dec 26 10:36:28 bela kernel: [85481.786138] pcieport 0000:00:1c.5: AER: device [8086:9d15] error status/mask=00000001/00002000
Dec 26 10:36:28 bela kernel: [85481.786143] pcieport 0000:00:1c.5: AER: [ 0] RxErr

és/vagy

Dec 26 10:40:15 bela kernel: [85708.355202] pcieport 0000:00:1c.5: AER: Multiple Corrected error received: 0000:00:1c.5
Dec 26 10:40:15 bela kernel: [85708.355208] pcieport 0000:00:1c.5: AER: can't find device of ID00e5

A gép egy Gigabyte Brix GB-BKI7A-7500, a NAS pedig egy Synology D220+. Google kereséskor látom, hogy másoknak is előjött ez már, de általában csak azt javasolják, hogy "try to add  pcie_aspm=off to syslinux", de magára a hibára nemigen kapok választ.

Tudna segíteni valaki?

Hozzászólások

I219-LM silent data corruption, Linux ?

Köszönöm az infókat!

Időközben tovább olvasgattam, és megnéztem, hogy melyik eszköz adja a hibát (1c.5):

sudo lspci -tv

+-00.0  Intel Corporation Xeon E3-1200 v6/7th Gen Core Processor Host Bridge/DRAM Registers
+-02.0  Intel Corporation HD Graphics 620
+-14.0  Intel Corporation Sunrise Point-LP USB 3.0 xHCI Controller
+-14.2  Intel Corporation Sunrise Point-LP Thermal subsystem
+-16.0  Intel Corporation Sunrise Point-LP CSME HECI #1
+-17.0  Intel Corporation Sunrise Point-LP SATA Controller [AHCI mode]
+-1c.0-[01]----00.0  ASMedia Technology Inc. ASM2142 USB 3.1 Host Controller
+-1c.5-[02]----00.0  Intel Corporation Dual Band Wireless-AC 3168NGW [Stone Peak]
+-1f.0  Intel Corporation Sunrise Point LPC Controller/eSPI Controller
+-1f.2  Intel Corporation Sunrise Point-LP PMC
+-1f.3  Intel Corporation Sunrise Point-LP HD Audio
+-1f.4  Intel Corporation Sunrise Point-LP SMBus
\-1f.6  Intel Corporation Ethernet Connection I219-LM

Úgy néz ki, hogy ez az eszköz a Brix wifi kártyája. De nem nagyon értem, mert mind a Brix, mind pedig a NAS kábelen lóg. (Hacsak az nem történt, ami minden újraindításkor előjön, hogy mind a kábel, mind a wifi kapcsolat aktiválódik, és bár a wifit inaktiválni szoktam, lehet, hogy most aktív maradt?)

Félig off: létezik out - of - the - box megoldás arra, hogy adott tartalmú journalctl üzenetre triggereljek egy http request-et?

Parser-t írtam hozzá. 

Én a konténerek logjait küldöm a host rendszer syslognak így:

# cat /etc/systemd/system/jnlcat.service 
[Unit]
Description=Journalctl remote
After=systemd-journald.service
Requires=systemd-journald.service

[Service]
ExecStart=/bin/sh -c "journalctl -f | nc 192.168.0.1 514"
TimeoutStartSec=0
Restart=on-failure
RestartSec=5s

[Install]
WantedBy=multi-user.target

Talán az induláshoz jó lesz. (Biztos ismeri mindenki, de ha valakinek nem tűnik fel: az 'nc' a netcat...)

Csak kíváncsiságból kérdem. Miért nem állítod a dockerd log-driver-ét journald-re és akkor a containerek logjai látszanak a hoston is? Én a hoston futtatok egy syslog-ng-t, az szedi ki, alakítja át egy kicsit és küldi tovább egy távoli syslog szervernek a naplókat. Ha ez nem kell akkor használhatod közvetlenül is a syslog log-drivert is a dockerben.