<div dir="ltr">Thank you!<div><br></div><div>I think we may need some sort of dampening method and more specific input into Nagios.  i.e. Details on which files are out-of-sync, versus just the number of files out-of-sync.<div><br></div><div>I&#39;m using these:  <a href="http://download.gluster.org/pub/gluster/glusterfs-nagios/">http://download.gluster.org/pub/gluster/glusterfs-nagios/</a></div><div><br></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Nov 19, 2014 at 10:14 AM, Nishanth Thomas <span dir="ltr">&lt;<a href="mailto:nthomas@redhat.com" target="_blank">nthomas@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Vince,<br>
<br>
Are you referring the monitoring scripts mentioned in the blog( <a href="http://gopukrish.wordpress.com/2014/11/16/monitor-glusterfs-using-nagios-plugin/" target="_blank">http://gopukrish.wordpress.com/2014/11/16/monitor-glusterfs-using-nagios-plugin/</a>) or the scripts part of the gluster(<a href="http://gluster.org/pipermail/gluster-users.old/2014-June/017819.html" target="_blank">http://gluster.org/pipermail/gluster-users.old/2014-June/017819.html</a>)?<br>
Please confirm?<br>
<br>
Thanks,<br>
Nishanth<br>
<div><div class="h5"><br>
----- Original Message -----<br>
From: &quot;Humble Devassy Chirammal&quot; &lt;<a href="mailto:humble.devassy@gmail.com">humble.devassy@gmail.com</a>&gt;<br>
To: &quot;Vince Loschiavo&quot; &lt;<a href="mailto:vloschiavo@gmail.com">vloschiavo@gmail.com</a>&gt;<br>
Cc: &quot;<a href="mailto:gluster-users@gluster.org">gluster-users@gluster.org</a>&quot; &lt;<a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a>&gt;, &quot;Sahina Bose&quot; &lt;<a href="mailto:sabose@redhat.com">sabose@redhat.com</a>&gt;, <a href="mailto:nthomas@redhat.com">nthomas@redhat.com</a><br>
Sent: Wednesday, November 19, 2014 11:22:18 PM<br>
Subject: Re: [Gluster-users] v3.6.1 vs v3.5.2 self heal - help (Nagios related)<br>
<br>
Hi Vince,<br>
It could be a behavioural change in heal process output capture with latest<br>
GlusterFS. If that is the case, we may tune the interval which  nagios<br>
collect heal info output  or some other settings to avoid continuous<br>
alerts. I am Ccing  gluster nagios devs.<br>
<br>
--Humble<br>
<br>
--Humble<br>
<br>
<br>
On Wed, Nov 19, 2014 at 9:50 PM, Vince Loschiavo &lt;<a href="mailto:vloschiavo@gmail.com">vloschiavo@gmail.com</a>&gt;<br>
wrote:<br>
<br>
&gt;<br>
&gt; Hello Gluster Community,<br>
&gt;<br>
&gt; I have been using the Nagios monitoring scripts, mentioned in the below<br>
&gt; thread, on 3.5.2 with great success. The most useful of these is the self<br>
&gt; heal.<br>
&gt;<br>
&gt; However, I&#39;ve just upgraded to 3.6.1 on the lab and the self heal daemon<br>
&gt; has become quite aggressive.  I continually get alerts/warnings on 3.6.1<br>
&gt; that virt disk images need self heal, then they clear.  This is not the<br>
&gt; case on 3.5.2.  This<br>
&gt;<br>
&gt; Configuration:<br>
&gt; 2 node, 2 brick replicated volume with 2x1GB LAG network between the peers<br>
&gt; using this volume as a QEMU/KVM virt image store through the fuse mount on<br>
&gt; Centos 6.5.<br>
&gt;<br>
&gt; Example:<br>
&gt; on 3.5.2:<br>
</div></div>&gt; *gluster volume heal volumename info:  *shows the bricks and number of<br>
<span class="">&gt; entries to be healed: 0<br>
&gt;<br>
&gt; On v3.5.2 - During normal gluster operations, I can run this command over<br>
&gt; and over again, 2-4 times per second, and it will always show 0 entries to<br>
&gt; be healed.  I&#39;ve used this as an indicator that the bricks are<br>
&gt; synchronized.<br>
&gt;<br>
&gt; Last night, I upgraded to 3.6.1 in lab and I&#39;m seeing different behavior.<br>
</span>&gt; Running *gluster volume heal volumename info*, during normal operations,<br>
<div class="HOEnZb"><div class="h5">&gt; will show a file out-of-sync, seemingly between every block written to disk<br>
&gt; then synced to the peer.  I can run the command over and over again, 2-4<br>
&gt; times per second, and it will almost always show something out of sync.<br>
&gt; The individual files change, meaning:<br>
&gt;<br>
&gt; Example:<br>
&gt; 1st Run: shows file1 out of sync<br>
&gt; 2nd run: shows file 2 and file 3 out of sync but file 1 is now in sync<br>
&gt; (not in the list)<br>
&gt; 3rd run: shows file 3 and file 4 out of sync but file 1 and 2 are in sync<br>
&gt; (not in the list).<br>
&gt; ...<br>
&gt; nth run: shows 0 files out of sync<br>
&gt; nth+1 run: shows file 3 and 12 out of sync.<br>
&gt;<br>
&gt; From looking at the virtual machines running off this gluster volume, it&#39;s<br>
&gt; obvious that gluster is working well.  However, this obviously plays havoc<br>
&gt; with Nagios and alerts.  Nagios will run the heal info and get different<br>
&gt; and non-useful results each time, and will send alerts.<br>
&gt;<br>
&gt; Is this behavior change (3.5.2 vs 3.6.1) expected?  Is there a way to tune<br>
&gt; the settings or change the monitoring method to get better results into<br>
&gt; Nagios.<br>
&gt;<br>
&gt; Thank you,<br>
&gt;<br>
&gt; --<br>
&gt; -Vince Loschiavo<br>
&gt;<br>
&gt;<br>
&gt; On Wed, Nov 19, 2014 at 4:35 AM, Humble Devassy Chirammal &lt;<br>
&gt; <a href="mailto:humble.devassy@gmail.com">humble.devassy@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt;&gt; Hi Gopu,<br>
&gt;&gt;<br>
&gt;&gt; Awesome !!<br>
&gt;&gt;<br>
&gt;&gt; We can  have a Gluster blog about this implementation.<br>
&gt;&gt;<br>
&gt;&gt; --Humble<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --Humble<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Wed, Nov 19, 2014 at 5:38 PM, Gopu Krishnan &lt;<a href="mailto:gopukrishnantec@gmail.com">gopukrishnantec@gmail.com</a><br>
&gt;&gt; &gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt;&gt; Thanks for all your help... I was able to configure nagios using the<br>
&gt;&gt;&gt; glusterfs plugin. Following link shows how I configured it. Hope it helps<br>
&gt;&gt;&gt; someone else.:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; <a href="http://gopukrish.wordpress.com/2014/11/16/monitor-glusterfs-using-nagios-plugin/" target="_blank">http://gopukrish.wordpress.com/2014/11/16/monitor-glusterfs-using-nagios-plugin/</a><br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; On Sun, Nov 16, 2014 at 11:44 AM, Humble Devassy Chirammal &lt;<br>
&gt;&gt;&gt; <a href="mailto:humble.devassy@gmail.com">humble.devassy@gmail.com</a>&gt; wrote:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Hi,<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Please look at this thread<br>
&gt;&gt;&gt;&gt; <a href="http://gluster.org/pipermail/gluster-users.old/2014-June/017819.html" target="_blank">http://gluster.org/pipermail/gluster-users.old/2014-June/017819.html</a><br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Btw,  if you are around, we have a talk on same topic in upcoming<br>
&gt;&gt;&gt;&gt; GlusterFS India meetup.<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Details can be fetched from:<br>
&gt;&gt;&gt;&gt;  <a href="http://www.meetup.com/glusterfs-India/" target="_blank">http://www.meetup.com/glusterfs-India/</a><br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; --Humble<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; --Humble<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; On Sun, Nov 16, 2014 at 11:23 AM, Gopu Krishnan &lt;<br>
&gt;&gt;&gt;&gt; <a href="mailto:gopukrishnantec@gmail.com">gopukrishnantec@gmail.com</a>&gt; wrote:<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; How can we monitor the glusters and alert us if something happened<br>
&gt;&gt;&gt;&gt;&gt; wrong. I found some nagios plugins and didn&#39;t work until this time. I am<br>
&gt;&gt;&gt;&gt;&gt; still experimenting with those. Any suggestions would be much helpful<br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt;&gt;&gt; Gluster-users mailing list<br>
&gt;&gt;&gt;&gt;&gt; <a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
&gt;&gt;&gt;&gt;&gt; <a href="http://supercolony.gluster.org/mailman/listinfo/gluster-users" target="_blank">http://supercolony.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt;&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; Gluster-users mailing list<br>
&gt;&gt; <a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
&gt;&gt; <a href="http://supercolony.gluster.org/mailman/listinfo/gluster-users" target="_blank">http://supercolony.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt;&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Gluster-users mailing list<br>
&gt; <a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
&gt; <a href="http://supercolony.gluster.org/mailman/listinfo/gluster-users" target="_blank">http://supercolony.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt;<br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature">-Vince Loschiavo<br></div>
</div>