hi, <br>Do you more information about this bug ?<br>I do not understand how afr works, <br>with my initial configuration, if i change ip of network card ( from 10.98.98.2 =&gt; 10.98.98.4 ) on server B during test, <br>on client and server (A ,C ) &#39;ls&#39; works after some timeout, but&nbsp; some program seems to be block all system (<br>

if i run my own program or qemu for example) &#39;ls&#39; does not respond anymore, and if i rechange from 10.98.98.4 =&gt; 10.98.98.2 ) then all become ok again. <br><br>Regards,<br>Nicolas Prochazka<br><br><br><div class="gmail_quote">

2009/1/14 Krishna Srinivas <span dir="ltr">&lt;<a href="mailto:krishna@zresearch.com">krishna@zresearch.com</a>&gt;</span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

Nicolas,<br>

<br>

It might be a bug. Let me try to reproduce the problem here and get back to you.<br>

<br>

Krishna<br>

<br>

On Wed, Jan 14, 2009 at 6:59 PM, nicolas prochazka<br>

<div><div></div><div class="Wj3C7c">&lt;<a href="mailto:prochazka.nicolas@gmail.com">prochazka.nicolas@gmail.com</a>&gt; wrote:<br>

&gt; hello again,<br>

&gt; To finish with this issue and information I can send you :<br>

&gt; If i stop glusterfsd &nbsp;( on server B) before to stop this server ( hard<br>

&gt; poweroff by pressed on/off ) , the problem does not occur. &nbsp;If i hard<br>

&gt; poweroff without stop gluster ( a real crash ) problem occur .<br>

&gt; Regards<br>

&gt; Nicolas Prochazka.<br>

&gt;<br>

&gt; 2009/1/14 nicolas prochazka &lt;<a href="mailto:prochazka.nicolas@gmail.com">prochazka.nicolas@gmail.com</a>&gt;<br>

&gt;&gt;<br>

&gt;&gt; hi again,<br>

&gt;&gt; I continue my tests and :<br>

&gt;&gt; In my case, if one file is open on gluster mount during stop of one afr<br>

&gt;&gt; server,<br>

&gt;&gt; gluster mount can not be acces ( gap ? ) in this server. All other client<br>

&gt;&gt; ( C for example) which not opening file during stop, isn&#39;t affect, i can do<br>

&gt;&gt; a ls or open after transport timeout time.<br>

&gt;&gt; If i kill the process that&#39;s use this file, then i can using gluster mount<br>

&gt;&gt; point without problem.<br>

&gt;&gt;<br>

&gt;&gt; Regards,<br>

&gt;&gt; Nicolas Prochazka.<br>

&gt;&gt;<br>

&gt;&gt; 2009/1/12 nicolas prochazka &lt;<a href="mailto:prochazka.nicolas@gmail.com">prochazka.nicolas@gmail.com</a>&gt;<br>

&gt;&gt;&gt;<br>

&gt;&gt;&gt; for your attention,<br>

&gt;&gt;&gt; it seems that&#39;s this problem occur only when files is open and use and<br>

&gt;&gt;&gt; gluster mount point .<br>

&gt;&gt;&gt; I use big files of computation ( ~ 10G) &nbsp;with in the most important part,<br>

&gt;&gt;&gt; read. In this case problem occurs.<br>

&gt;&gt;&gt; If i using only small files which create only some time, no problem<br>

&gt;&gt;&gt; occur, gluster mount can use other afr server.<br>

&gt;&gt;&gt;<br>

&gt;&gt;&gt; Regards,<br>

&gt;&gt;&gt; Nicolas Prochazka<br>

&gt;&gt;&gt;<br>

&gt;&gt;&gt;<br>

&gt;&gt;&gt;<br>

&gt;&gt;&gt; 2009/1/12 nicolas prochazka &lt;<a href="mailto:prochazka.nicolas@gmail.com">prochazka.nicolas@gmail.com</a>&gt;<br>

&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt; Hi,<br>

&gt;&gt;&gt;&gt; I&#39;m tryning to set<br>

&gt;&gt;&gt;&gt; option transport-timeout 5<br>

&gt;&gt;&gt;&gt; in protocol/client<br>

&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt; so a max of 10 seconds before restoring gluster in normal situation ?<br>

&gt;&gt;&gt;&gt; no success, i always in the same situation, a &#39;ls /mnt/gluster&#39; &nbsp; not<br>

&gt;&gt;&gt;&gt; respond after &gt; 10 mins<br>

&gt;&gt;&gt;&gt; I can not reuse glustermount exept kill glusterfs process.<br>

&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt; Regards<br>

&gt;&gt;&gt;&gt; Nicolas Prochazka<br>

&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt; 2009/1/12 Raghavendra G &lt;<a href="mailto:raghavendra@zresearch.com">raghavendra@zresearch.com</a>&gt;<br>

&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt; Hi Nicolas,<br>

&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt; how much time did you wait before concluding the mount point to be not<br>

&gt;&gt;&gt;&gt;&gt; working? afr waits for a maximum of (2 * transport-timeout) seconds before<br>

&gt;&gt;&gt;&gt;&gt; returning sending reply to the application. Can you wait for some time and<br>

&gt;&gt;&gt;&gt;&gt; check out is this the issue you are facing?<br>

&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt; regards,<br>

&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt; On Mon, Jan 12, 2009 at 7:49 PM, nicolas prochazka<br>

&gt;&gt;&gt;&gt;&gt; &lt;<a href="mailto:prochazka.nicolas@gmail.com">prochazka.nicolas@gmail.com</a>&gt; wrote:<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; Hi.<br>

&gt;&gt;&gt;&gt;&gt;&gt; I&#39;ve installed this model to test Gluster :<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; + 2 servers ( A B )<br>

&gt;&gt;&gt;&gt;&gt;&gt; &nbsp; &nbsp;- with glusterfsd &nbsp;server &nbsp;( glusterfs--mainline--3.0--patch-842 )<br>

&gt;&gt;&gt;&gt;&gt;&gt; &nbsp; &nbsp;- with glusterfs &nbsp;client<br>

&gt;&gt;&gt;&gt;&gt;&gt; server conf file .<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; + 1 server C only client mode.<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; My issue :<br>

&gt;&gt;&gt;&gt;&gt;&gt; If C open big file in this client configuration and then i stop server<br>

&gt;&gt;&gt;&gt;&gt;&gt; A (or B )<br>

&gt;&gt;&gt;&gt;&gt;&gt; gluster mount point on server C seems to be block, i can not do &#39;ls<br>

&gt;&gt;&gt;&gt;&gt;&gt; -l&#39; &nbsp;for example.<br>

&gt;&gt;&gt;&gt;&gt;&gt; Is a this thing is normal ? as C open his file on A or B , then it is<br>

&gt;&gt;&gt;&gt;&gt;&gt; blocking when server down ?<br>

&gt;&gt;&gt;&gt;&gt;&gt; I was thinking in client AFR, client can reopen file/block an other<br>

&gt;&gt;&gt;&gt;&gt;&gt; server , i&#39;m wrong ?<br>

&gt;&gt;&gt;&gt;&gt;&gt; Should use HA translator ?<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; Regards,<br>

&gt;&gt;&gt;&gt;&gt;&gt; Nicolas Prochazka.<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume brickless<br>

&gt;&gt;&gt;&gt;&gt;&gt; type storage/posix<br>

&gt;&gt;&gt;&gt;&gt;&gt; option directory /mnt/disks/export<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume brick<br>

&gt;&gt;&gt;&gt;&gt;&gt; type features/posix-locks<br>

&gt;&gt;&gt;&gt;&gt;&gt; option mandatory on &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;# enables mandatory locking on all files<br>

&gt;&gt;&gt;&gt;&gt;&gt; subvolumes brickless<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume server<br>

&gt;&gt;&gt;&gt;&gt;&gt; type protocol/server<br>

&gt;&gt;&gt;&gt;&gt;&gt; subvolumes brick<br>

&gt;&gt;&gt;&gt;&gt;&gt; option transport-type tcp<br>

&gt;&gt;&gt;&gt;&gt;&gt; option auth.addr.brick.allow 10.98.98.*<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt; ---------------------------<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; client config<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume brick_10.98.98.1<br>

&gt;&gt;&gt;&gt;&gt;&gt; type protocol/client<br>

&gt;&gt;&gt;&gt;&gt;&gt; option transport-type tcp/client<br>

&gt;&gt;&gt;&gt;&gt;&gt; option remote-host 10.98.98.1<br>

&gt;&gt;&gt;&gt;&gt;&gt; option remote-subvolume brick<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume brick_10.98.98.2<br>

&gt;&gt;&gt;&gt;&gt;&gt; type protocol/client<br>

&gt;&gt;&gt;&gt;&gt;&gt; option transport-type tcp/client<br>

&gt;&gt;&gt;&gt;&gt;&gt; option remote-host 10.98.98.2<br>

&gt;&gt;&gt;&gt;&gt;&gt; option remote-subvolume brick<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume last<br>

&gt;&gt;&gt;&gt;&gt;&gt; type cluster/replicate<br>

&gt;&gt;&gt;&gt;&gt;&gt; subvolumes brick_10.98.98.1 brick_10.98.98.2<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume iothreads<br>

&gt;&gt;&gt;&gt;&gt;&gt; type performance/io-threads<br>

&gt;&gt;&gt;&gt;&gt;&gt; option thread-count 2<br>

&gt;&gt;&gt;&gt;&gt;&gt; option cache-size 32MB<br>

&gt;&gt;&gt;&gt;&gt;&gt; subvolumes last<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume io-cache<br>

&gt;&gt;&gt;&gt;&gt;&gt; type performance/io-cache<br>

&gt;&gt;&gt;&gt;&gt;&gt; option cache-size 1024MB &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; # default is 32MB<br>

&gt;&gt;&gt;&gt;&gt;&gt; option page-size &nbsp;1MB &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;#128KB is default option<br>

&gt;&gt;&gt;&gt;&gt;&gt; option force-revalidate-timeout 2 &nbsp;# default is 1<br>

&gt;&gt;&gt;&gt;&gt;&gt; subvolumes iothreads<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; volume writebehind<br>

&gt;&gt;&gt;&gt;&gt;&gt; type performance/write-behind<br>

&gt;&gt;&gt;&gt;&gt;&gt; option aggregate-size 256KB # default is 0bytes<br>

&gt;&gt;&gt;&gt;&gt;&gt; option window-size 3MB<br>

&gt;&gt;&gt;&gt;&gt;&gt; option flush-behind on &nbsp; &nbsp; &nbsp;# default is &#39;off&#39;<br>

&gt;&gt;&gt;&gt;&gt;&gt; subvolumes io-cache<br>

&gt;&gt;&gt;&gt;&gt;&gt; end-volume<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;&gt; _______________________________________________<br>

&gt;&gt;&gt;&gt;&gt;&gt; Gluster-devel mailing list<br>

&gt;&gt;&gt;&gt;&gt;&gt; <a href="mailto:Gluster-devel@nongnu.org">Gluster-devel@nongnu.org</a><br>

&gt;&gt;&gt;&gt;&gt;&gt; <a href="http://lists.nongnu.org/mailman/listinfo/gluster-devel" target="_blank">http://lists.nongnu.org/mailman/listinfo/gluster-devel</a><br>

&gt;&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;&gt; --<br>

&gt;&gt;&gt;&gt;&gt; Raghavendra G<br>

&gt;&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;&gt;<br>

&gt;&gt;&gt;<br>

&gt;&gt;<br>

&gt;<br>

&gt;<br>

&gt; _______________________________________________<br>

&gt; Gluster-devel mailing list<br>

&gt; <a href="mailto:Gluster-devel@nongnu.org">Gluster-devel@nongnu.org</a><br>

&gt; <a href="http://lists.nongnu.org/mailman/listinfo/gluster-devel" target="_blank">http://lists.nongnu.org/mailman/listinfo/gluster-devel</a><br>

&gt;<br>

&gt;<br>

</div></div></blockquote></div><br>