<div dir="ltr">The content of file zp2-brick2.log is at <a href="http://ur1.ca/iku0l" style="color:rgb(0,102,204);text-decoration:none;font-family:&#39;Liberation Sans&#39;,&#39;Lucida Grande&#39;,&#39;Luxi Sans&#39;,&#39;Bitstream Vera Sans&#39;,helvetica,verdana,arial,sans-serif">http://ur1.ca/iku0l</a> (<a href="http://fpaste.org/145714/44849041/">http://fpaste.org/145714/44849041/</a> )<div><br></div><div>I can&#39;t open the file <span style="font-size:13px;font-family:arial,sans-serif">/zp2/brick2/.glusterfs/health_</span><span style="font-size:13px;font-family:arial,sans-serif">check since it hangs due to no disk present.</span></div><div><span style="font-size:13px;font-family:arial,sans-serif"><br></span></div><div><span style="font-size:13px;font-family:arial,sans-serif">Let me know the filename pattern, so that I can find it.</span></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Oct 28, 2014 at 1:42 PM, Niels de Vos <span dir="ltr">&lt;<a href="mailto:ndevos@redhat.com" target="_blank">ndevos@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Tue, Oct 28, 2014 at 01:10:56PM +0530, Kiran Patil wrote:<br>
&gt; I applied the patches, compiled and installed the gluster.<br>
&gt;<br>
&gt; # glusterfs --version<br>
&gt; glusterfs 3.7dev built on Oct 28 2014 12:03:10<br>
&gt; Repository revision: git://<a href="http://git.gluster.com/glusterfs.git" target="_blank">git.gluster.com/glusterfs.git</a><br>
&gt; Copyright (c) 2006-2013 Red Hat, Inc. &lt;<a href="http://www.redhat.com/" target="_blank">http://www.redhat.com/</a>&gt;<br>
&gt; GlusterFS comes with ABSOLUTELY NO WARRANTY.<br>
&gt; It is licensed to you under your choice of the GNU Lesser<br>
&gt; General Public License, version 3 or any later version (LGPLv3<br>
&gt; or later), or the GNU General Public License, version 2 (GPLv2),<br>
&gt; in all cases as published by the Free Software Foundation.<br>
&gt;<br>
&gt; # git log<br>
&gt; commit 990ce16151c3af17e4cdaa94608b737940b60e4d<br>
&gt; Author: Lalatendu Mohanty &lt;<a href="mailto:lmohanty@redhat.com">lmohanty@redhat.com</a>&gt;<br>
&gt; Date:   Tue Jul 1 07:52:27 2014 -0400<br>
&gt;<br>
&gt;     Posix: Brick failure detection fix for ext4 filesystem<br>
&gt; ...<br>
&gt; ...<br>
&gt;<br>
&gt; I see below messages<br>
<br>
</span>Many thanks Kiran!<br>
<br>
Do you have the messages from the brick that uses the zp2 mountpoint?<br>
<br>
There also should be a file with a timestamp when the last check was<br>
done successfully. If the brick is still running, this timestamp should<br>
get updated every storage.health-check-interval seconds:<br>
    /zp2/brick2/.glusterfs/health_check<br>
<span class="HOEnZb"><font color="#888888"><br>
Niels<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
&gt;<br>
&gt; File /var/log/glusterfs/etc-glusterfs-glusterd.vol.log :<br>
&gt;<br>
&gt; The message &quot;I [MSGID: 106005]<br>
&gt; [glusterd-handler.c:4142:__glusterd_brick_rpc_notify] 0-management: Brick<br>
&gt; 192.168.1.246:/zp2/brick2 has disconnected from glusterd.&quot; repeated 39<br>
&gt; times between [2014-10-28 05:58:09.209419] and [2014-10-28 06:00:06.226330]<br>
&gt; [2014-10-28 06:00:09.226507] W [socket.c:545:__socket_rwv] 0-management:<br>
&gt; readv on /var/run/6154ed2845b7f728a3acdce9d69e08ee.socket failed (Invalid<br>
&gt; argument)<br>
&gt; [2014-10-28 06:00:09.226712] I [MSGID: 106005]<br>
&gt; [glusterd-handler.c:4142:__glusterd_brick_rpc_notify] 0-management: Brick<br>
&gt; 192.168.1.246:/zp2/brick2 has disconnected from glusterd.<br>
&gt; [2014-10-28 06:00:12.226881] W [socket.c:545:__socket_rwv] 0-management:<br>
&gt; readv on /var/run/6154ed2845b7f728a3acdce9d69e08ee.socket failed (Invalid<br>
&gt; argument)<br>
&gt; [2014-10-28 06:00:15.227249] W [socket.c:545:__socket_rwv] 0-management:<br>
&gt; readv on /var/run/6154ed2845b7f728a3acdce9d69e08ee.socket failed (Invalid<br>
&gt; argument)<br>
&gt; [2014-10-28 06:00:18.227616] W [socket.c:545:__socket_rwv] 0-management:<br>
&gt; readv on /var/run/6154ed2845b7f728a3acdce9d69e08ee.socket failed (Invalid<br>
&gt; argument)<br>
&gt; [2014-10-28 06:00:21.227976] W [socket.c:545:__socket_rwv] 0-management:<br>
&gt; readv on<br>
&gt;<br>
&gt; .....<br>
&gt; .....<br>
&gt;<br>
&gt; [2014-10-28 06:19:15.142867] I<br>
&gt; [glusterd-handler.c:1280:__glusterd_handle_cli_get_volume] 0-glusterd:<br>
&gt; Received get vol req<br>
&gt; The message &quot;I [MSGID: 106005]<br>
&gt; [glusterd-handler.c:4142:__glusterd_brick_rpc_notify] 0-management: Brick<br>
&gt; 192.168.1.246:/zp2/brick2 has disconnected from glusterd.&quot; repeated 12<br>
&gt; times between [2014-10-28 06:18:09.368752] and [2014-10-28 06:18:45.373063]<br>
&gt; [2014-10-28 06:23:38.207649] W [glusterfsd.c:1194:cleanup_and_exit] (--&gt;<br>
&gt; 0-: received signum (15), shutting down<br>
&gt;<br>
&gt;<br>
&gt; dmesg output:<br>
&gt;<br>
&gt; SPLError: 7869:0:(spl-err.c:67:vcmn_err()) WARNING: Pool &#39;zp2&#39; has<br>
&gt; encountered an uncorrectable I/O failure and has been suspended.<br>
&gt;<br>
&gt; SPLError: 7868:0:(spl-err.c:67:vcmn_err()) WARNING: Pool &#39;zp2&#39; has<br>
&gt; encountered an uncorrectable I/O failure and has been suspended.<br>
&gt;<br>
&gt; SPLError: 7869:0:(spl-err.c:67:vcmn_err()) WARNING: Pool &#39;zp2&#39; has<br>
&gt; encountered an uncorrectable I/O failure and has been suspended.<br>
&gt;<br>
&gt; The brick is still online.<br>
&gt;<br>
&gt; # gluster volume status<br>
&gt; Status of volume: repvol<br>
&gt; Gluster process Port Online Pid<br>
&gt; ------------------------------------------------------------------------------<br>
&gt; Brick 192.168.1.246:/zp1/brick1 49152 Y 4067<br>
&gt; Brick 192.168.1.246:/zp2/brick2 49153 Y 4078<br>
&gt; NFS Server on localhost 2049 Y 4092<br>
&gt; Self-heal Daemon on localhost N/A Y 4097<br>
&gt;<br>
&gt; Task Status of Volume repvol<br>
&gt; ------------------------------------------------------------------------------<br>
&gt; There are no active volume tasks<br>
&gt;<br>
&gt; # gluster volume info<br>
&gt;<br>
&gt; Volume Name: repvol<br>
&gt; Type: Replicate<br>
&gt; Volume ID: ba1e7c6d-1e1c-45cd-8132-5f4fa4d2d22b<br>
&gt; Status: Started<br>
&gt; Number of Bricks: 1 x 2 = 2<br>
&gt; Transport-type: tcp<br>
&gt; Bricks:<br>
&gt; Brick1: 192.168.1.246:/zp1/brick1<br>
&gt; Brick2: 192.168.1.246:/zp2/brick2<br>
&gt; Options Reconfigured:<br>
&gt; storage.health-check-interval: 30<br>
&gt;<br>
&gt; Let me know if you need further information.<br>
&gt;<br>
&gt; Thanks,<br>
&gt; Kiran.<br>
&gt;<br>
&gt; On Tue, Oct 28, 2014 at 11:44 AM, Kiran Patil &lt;<a href="mailto:kiran@fractalio.com">kiran@fractalio.com</a>&gt; wrote:<br>
&gt;<br>
&gt; &gt; I changed  git fetch git://<a href="http://review.gluster.org/glusterfs" target="_blank">review.gluster.org/glusterfs</a>  to git fetch<br>
&gt; &gt; <a href="http://review.gluster.org/glusterfs" target="_blank">http://review.gluster.org/glusterfs</a>  and now it works.<br>
&gt; &gt;<br>
&gt; &gt; Thanks,<br>
&gt; &gt; Kiran.<br>
&gt; &gt;<br>
&gt; &gt; On Tue, Oct 28, 2014 at 11:13 AM, Kiran Patil &lt;<a href="mailto:kiran@fractalio.com">kiran@fractalio.com</a>&gt; wrote:<br>
&gt; &gt;<br>
&gt; &gt;&gt; Hi Niels,<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; I am getting &quot;fatal: Couldn&#39;t find remote ref refs/changes/13/8213/9&quot;<br>
&gt; &gt;&gt; error.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Steps to reproduce the issue.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; 1) # git clone git://<a href="http://review.gluster.org/glusterfs" target="_blank">review.gluster.org/glusterfs</a><br>
&gt; &gt;&gt; Initialized empty Git repository in /root/gluster-3.6/glusterfs/.git/<br>
&gt; &gt;&gt; remote: Counting objects: 84921, done.<br>
&gt; &gt;&gt; remote: Compressing objects: 100% (48307/48307), done.<br>
&gt; &gt;&gt; remote: Total 84921 (delta 57264), reused 63233 (delta 36254)<br>
&gt; &gt;&gt; Receiving objects: 100% (84921/84921), 23.23 MiB | 192 KiB/s, done.<br>
&gt; &gt;&gt; Resolving deltas: 100% (57264/57264), done.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; 2) # cd glusterfs<br>
&gt; &gt;&gt;     # git branch<br>
&gt; &gt;&gt;     * master<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; 3) # git fetch git://<a href="http://review.gluster.org/glusterfs" target="_blank">review.gluster.org/glusterfs</a> refs/changes/13/8213/9<br>
&gt; &gt;&gt; &amp;&amp; git checkout FETCH_HEAD<br>
&gt; &gt;&gt; fatal: Couldn&#39;t find remote ref refs/changes/13/8213/9<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Note: I also tried the above steps on git repo<br>
&gt; &gt;&gt; <a href="https://github.com/gluster/glusterfs" target="_blank">https://github.com/gluster/glusterfs</a> and the result is same as above.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Please let me know if I miss any steps.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Thanks,<br>
&gt; &gt;&gt; Kiran.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; On Mon, Oct 27, 2014 at 5:53 PM, Niels de Vos &lt;<a href="mailto:ndevos@redhat.com">ndevos@redhat.com</a>&gt; wrote:<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;&gt; On Mon, Oct 27, 2014 at 05:19:13PM +0530, Kiran Patil wrote:<br>
&gt; &gt;&gt;&gt; &gt; Hi,<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; I created replicated vol with two bricks on the same node and copied<br>
&gt; &gt;&gt;&gt; some<br>
&gt; &gt;&gt;&gt; &gt; data to it.<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; Now removed the disk which has hosted one of the brick of the volume.<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; Storage.health-check-interval is set to 30 seconds.<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; I could see the disk is unavailable using zpool command of zfs on<br>
&gt; &gt;&gt;&gt; linux but<br>
&gt; &gt;&gt;&gt; &gt; the gluster volume status still displays the brick process running<br>
&gt; &gt;&gt;&gt; which<br>
&gt; &gt;&gt;&gt; &gt; should have been shutdown by this time.<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; Is this a bug in 3.6 since it is mentioned as feature &quot;<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; <a href="https://github.com/gluster/glusterfs/blob/release-3.6/doc/features/brick-failure-detection.md" target="_blank">https://github.com/gluster/glusterfs/blob/release-3.6/doc/features/brick-failure-detection.md</a><br>
&gt; &gt;&gt;&gt; &quot;<br>
&gt; &gt;&gt;&gt; &gt;  or am I doing any mistakes here?<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; The initial detection of brick failures did not work for all<br>
&gt; &gt;&gt;&gt; filesystems. It may not work for ZFS too. A fix has been posted, but it<br>
&gt; &gt;&gt;&gt; has not been merged into the master branch yet. When the change has been<br>
&gt; &gt;&gt;&gt; merged, it can get backported to 3.6 and 3.5.<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; You may want to test with the patch applied, and add your &quot;+1 Verified&quot;<br>
&gt; &gt;&gt;&gt; to the change in case it makes it functional for you:<br>
&gt; &gt;&gt;&gt; - <a href="http://review.gluster.org/8213" target="_blank">http://review.gluster.org/8213</a><br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; Cheers,<br>
&gt; &gt;&gt;&gt; Niels<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; [root@fractal-c92e gluster-3.6]# gluster volume status<br>
&gt; &gt;&gt;&gt; &gt; Status of volume: repvol<br>
&gt; &gt;&gt;&gt; &gt; Gluster process Port Online Pid<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; ------------------------------------------------------------------------------<br>
&gt; &gt;&gt;&gt; &gt; Brick 192.168.1.246:/zp1/brick1 49154 Y 17671<br>
&gt; &gt;&gt;&gt; &gt; Brick 192.168.1.246:/zp2/brick2 49155 Y 17682<br>
&gt; &gt;&gt;&gt; &gt; NFS Server on localhost 2049 Y 17696<br>
&gt; &gt;&gt;&gt; &gt; Self-heal Daemon on localhost N/A Y 17701<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; Task Status of Volume repvol<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; ------------------------------------------------------------------------------<br>
&gt; &gt;&gt;&gt; &gt; There are no active volume tasks<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; [root@fractal-c92e gluster-3.6]# gluster volume info<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; Volume Name: repvol<br>
&gt; &gt;&gt;&gt; &gt; Type: Replicate<br>
&gt; &gt;&gt;&gt; &gt; Volume ID: d4f992b1-1393-43b8-9fda-2e2b6e3b5039<br>
&gt; &gt;&gt;&gt; &gt; Status: Started<br>
&gt; &gt;&gt;&gt; &gt; Number of Bricks: 1 x 2 = 2<br>
&gt; &gt;&gt;&gt; &gt; Transport-type: tcp<br>
&gt; &gt;&gt;&gt; &gt; Bricks:<br>
&gt; &gt;&gt;&gt; &gt; Brick1: 192.168.1.246:/zp1/brick1<br>
&gt; &gt;&gt;&gt; &gt; Brick2: 192.168.1.246:/zp2/brick2<br>
&gt; &gt;&gt;&gt; &gt; Options Reconfigured:<br>
&gt; &gt;&gt;&gt; &gt; storage.health-check-interval: 30<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; [root@fractal-c92e gluster-3.6]# zpool status zp2<br>
&gt; &gt;&gt;&gt; &gt;   pool: zp2<br>
&gt; &gt;&gt;&gt; &gt;  state: UNAVAIL<br>
&gt; &gt;&gt;&gt; &gt; status: One or more devices are faulted in response to IO failures.<br>
&gt; &gt;&gt;&gt; &gt; action: Make sure the affected devices are connected, then run &#39;zpool<br>
&gt; &gt;&gt;&gt; &gt; clear&#39;.<br>
&gt; &gt;&gt;&gt; &gt;    see: <a href="http://zfsonlinux.org/msg/ZFS-8000-HC" target="_blank">http://zfsonlinux.org/msg/ZFS-8000-HC</a><br>
&gt; &gt;&gt;&gt; &gt;   scan: none requested<br>
&gt; &gt;&gt;&gt; &gt; config:<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; NAME        STATE     READ WRITE CKSUM<br>
&gt; &gt;&gt;&gt; &gt; zp2         UNAVAIL      0     0     0  insufficient replicas<br>
&gt; &gt;&gt;&gt; &gt;   sdb       UNAVAIL      0     0     0<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; errors: 2 data errors, use &#39;-v&#39; for a list<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt;<br>
&gt; &gt;&gt;&gt; &gt; Thanks,<br>
&gt; &gt;&gt;&gt; &gt; Kiran.<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; &gt; _______________________________________________<br>
&gt; &gt;&gt;&gt; &gt; Gluster-devel mailing list<br>
&gt; &gt;&gt;&gt; &gt; <a href="mailto:Gluster-devel@gluster.org">Gluster-devel@gluster.org</a><br>
&gt; &gt;&gt;&gt; &gt; <a href="http://supercolony.gluster.org/mailman/listinfo/gluster-devel" target="_blank">http://supercolony.gluster.org/mailman/listinfo/gluster-devel</a><br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;<br>
</div></div></blockquote></div><br></div>