Without performance translator, the result is the same.<br>I&#39;m trying with gdb as soon as possible.<br>you say, EBADFD is fine, AFR will try the operation on the other server , ok <br>so i understand, but it I test to stop this server, gluster can not retrieve the first which is EBADFD.<br>
A lot of my problem comes from here, i think, because with my two server, <br>i stop the first, then restart , wait, stop the second, restart&nbsp; and all is KO.<br>I just try to stop the first and test, then all is ok .<br>Nicolas<br>
<br><div class="gmail_quote">On Tue, Feb 3, 2009 at 3:50 PM, Krishna Srinivas <span dir="ltr">&lt;<a href="mailto:krishna@zresearch.com">krishna@zresearch.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Nicolas,<br>
<br>
When you restart the server logs indicating EBADFD is fine, AFR will<br>
try the operation on the other server. When you have the situation<br>
where the glusterfs client hangs can you attach gdb to the glusterfs<br>
and mail us the backtrace?<br>
<br>
gdb -p &lt;pid of glusterfs&gt;<br>
type &quot;bt&quot; at the gdb command prompt.<br>
<br>
Just want to confirm that glusterfs has not blocked at a system call.<br>
(as we have non blocking io now)<br>
<br>
Can you see if removing the performance translators helps? we can<br>
narrow down to the problem translator in such case.<br>
<br>
Krishna<br>
<br>
On Tue, Feb 3, 2009 at 5:18 PM, nicolas prochazka<br>
<div class="Ih2E3d">&lt;<a href="mailto:prochazka.nicolas@gmail.com">prochazka.nicolas@gmail.com</a>&gt; wrote:<br>
</div><div><div></div><div class="Wj3C7c">&gt; ok,<br>
&gt; So now I know there&#39;s few bugs,<br>
&gt;<br>
&gt; 1 - when stop and i restart a server , I&#39;ve the EBADFD bug<br>
&gt; 2 - When I stop server :<br>
&gt; &nbsp; &nbsp; &nbsp; - with &nbsp;--disable-direct-io-mode &nbsp; : my big image file become corrupt<br>
&gt; ( missing data ...)<br>
&gt; &nbsp; &nbsp; &nbsp; - without --disable-direct-io-mode &nbsp;: &nbsp; my process hangs and cpu load<br>
&gt; grows a lot (by process )<br>
&gt;<br>
&gt; any ideas ?<br>
&gt;<br>
&gt; Regards,<br>
&gt; Nicolas Prochazka<br>
&gt;<br>
&gt; &nbsp;On Tue, Feb 3, 2009 at 5:42 AM, Raghavendra G &lt;<a href="mailto:raghavendra@zresearch.com">raghavendra@zresearch.com</a>&gt;<br>
&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi Nicolas,<br>
&gt;&gt;<br>
&gt;&gt; On Tue, Feb 3, 2009 at 12:01 AM, nicolas prochazka<br>
&gt;&gt; &lt;<a href="mailto:prochazka.nicolas@gmail.com">prochazka.nicolas@gmail.com</a>&gt; wrote:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; I inspect the log and i find something interesting :<br>
&gt;&gt;&gt; All is ok,<br>
&gt;&gt;&gt; i have stop 10.98.98.2 and i restart it :<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; 2009-02-02 15:00:32 D [client-protocol.c:6498:notify] brick_10.98.98.2:<br>
&gt;&gt;&gt; got GF_EVENT_CHILD_UP<br>
&gt;&gt;&gt; 2009-02-02 15:00:32 D [socket.c:924:socket_connect] brick_10.98.98.2:<br>
&gt;&gt;&gt; connect () called on transport already connected<br>
&gt;&gt;&gt; 2009-02-02 15:00:32 N [client-protocol.c:5786:client_setvolume_cbk]<br>
&gt;&gt;&gt; brick_10.98.98.2: connection and handshake succeeded<br>
&gt;&gt;&gt; 2009-02-02 15:00:40 D [fuse-bridge.c:1945:fuse_statfs] glusterfs-fuse:<br>
&gt;&gt;&gt; 17399: STATFS<br>
&gt;&gt;&gt; 2009-02-02 15:00:40 D [fuse-bridge.c:368:fuse_entry_cbk] glusterfs-fuse:<br>
</div></div></blockquote></div><br>