Verwendet man ocf:heartbeat:Filesystem gibt es ein Problem mit der Monitor operation, die in einer unmanaged Resource endet.

Das Problem ist, dass die monitor operation in einen timeout läuft, weil man eingebundene cifs-laufwerke nicht so ohne Weiteres sauber umounten kann.

Geholfen hat bei mir ein timeout von 120s auf die monitor operation in der pacemaker resource, sowie eine Anpassung des RA Filesystem.

Nötig hierzu war in dem Skript etwa bei Zeile 510 umount_force=“-f“ durch „-l“ für lazy umount zu ersetzen.

Ich prüfe zusätzlich die Resource mit folgendem Snippet:

 

primitive p_cifs_bla ocf:heartbeat:Filesystem2

params device=“//server/share“ directory=“/srv/share“ fstype=“cifs“ options=“username=max,password=mustermann“

op monitor interval=“30″ OCF_CHECK_LEVEL=“20″

op stop interval=“0″ timeout=“120s“

 

OCF_CHECK_LEVEL mit 30 sorgt dafür, dass nicht nur geprüft wird, ob das Laufwerk gemountet ist, was auch der Fall ist, wenn die Netzverbindung zum CIFS-Server verloren geht, sondern dass auch eine schreib/lese-Operation durchgeführt wird.

 

Hierzu wird in /srv/share ein Ordner .Filesystem_status … angelegt…

Also – Schreibrechte sind nötig!

 

Quelle:

http://www.linux-ha.org/doc/man-pages/re-ra-Filesystem.html

http://man7.org/linux/man-pages/man8/umount.8.html

http://lists.linux-ha.org/pipermail/linux-ha/2014-June/048112.html

Categories: BlogLinux