Hi all,<br><br>Here is some work related to Health monitoring. glfs-health.sh is a shell script to check the health of glusterfs.<br><a href="http://git.gluster.com/?p=users/avati/glfs-health.git;a=blob_plain;f=glfs-health.sh;hb=5bf3cb50452525f545018fa5f8eed06cb2fbbe7d">http://git.gluster.com/?p=users/avati/glfs-health.git;a=blob_plain;f=glfs-health.sh;hb=5bf3cb50452525f545018fa5f8eed06cb2fbbe7d</a><br>
<br>Documentation can be found from<br><a href="http://git.gluster.com/?p=users/avati/glfs-health.git;a=blob_plain;f=README;hb=5bf3cb50452525f545018fa5f8eed06cb2fbbe7d">http://git.gluster.com/?p=users/avati/glfs-health.git;a=blob_plain;f=README;hb=5bf3cb50452525f545018fa5f8eed06cb2fbbe7d</a><br>
<br>We welcome improvements and discussions on this.<br><br>regards,<br><div class="gmail_quote">2010/2/23 Harald Stürzebecher <span dir="ltr">&lt;<a href="mailto:haralds@cs.tu-berlin.de">haralds@cs.tu-berlin.de</a>&gt;</span><br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">2010/2/22 Samuel Hassine &lt;<a href="mailto:samuel.hassine@gmail.com">samuel.hassine@gmail.com</a>&gt;:<br>

<div class="im">&gt; I&#39;m also looking for a way to monitor gluster nodes.<br>
&gt;<br>
&gt; Any solutions ?<br>
&gt;<br>
&gt; Le lundi 22 février 2010 à 10:12 +0500, Anton a écrit :<br>
&gt;&gt; Hello!<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I&#39;m looking for the way to determine the health of the GLUSTER<br>
&gt;&gt; cluster. Is there any way to determine if any of the nodes failed? In<br>
&gt;&gt; the log files it is possible to grep that there is &quot;remotexx:<br>
&gt;&gt; disconnected&quot; - but it is not sutable for monitoring. There should be<br>
&gt;&gt; the simple way to just query the cluster against the .vol file and<br>
&gt;&gt; see, if any node/brick failed to attach and so trigger the alarm. Is<br>
&gt;&gt; there anything like &quot;gluster --reporthealth&quot;?<br>
<br>
</div>Checking if a connection to the GlusterFS TCP server port (6996 IIRC)<br>
is possible might be an indicator for working/failing - at least for<br>
setups that use TCP. I don&#39;t know if anything like that is possible<br>
for Infiniband-only setups.<br>
<br>
IIRC, Nagios can check if a port is open on a remote machine. That<br>
won&#39;t find something like disk/filesystem problems on the server, but<br>
it could report crashed GlusterFS server processes and machines that<br>
are not working at all.<br>
<br>
I know that this simple method won&#39;t provide a positive status (=it<br>
works) which would be preferable, but at least it can provide a<br>
negative status (=_something_ failed on _that_ machine) in some cases.<br>
<br>
@<a href="http://gluster.org" target="_blank">gluster.org</a>:<br>
IIRC, some time ago someone requested a syslog feature to debug<br>
problems with GlusterFS as root filesystem for a diskless cluster -<br>
are there any news on that?<br>
Having the clients report problems to a central logging server might<br>
be useful for monitoring.<br>
<br>
<br>
Regards,<br>
<font color="#888888"><br>
Harald<br>
</font><div><div></div><div class="h5"><br>
<br>
_______________________________________________<br>
Gluster-devel mailing list<br>
<a href="mailto:Gluster-devel@nongnu.org">Gluster-devel@nongnu.org</a><br>
<a href="http://lists.nongnu.org/mailman/listinfo/gluster-devel" target="_blank">http://lists.nongnu.org/mailman/listinfo/gluster-devel</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Raghavendra G<br><br>