Can you post gluster client logs and check if there are any core dumps?<div><br></div><div>Avati<br><br><div class="gmail_quote">On Fri, Jul 22, 2011 at 9:05 AM, Whit Blauvelt <span dir="ltr">&lt;<a href="mailto:whit.gluster@transpect.com">whit.gluster@transpect.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Okay ...<br>
<br>
Finally got that one replicated partition back in line. A few of the<br>
recommended<br>
<br>
  find /mnt/point -print0 | xargs --null stat<br>
<br>
from each side seems to have done some good. Then while I&#39;m away a second<br>
replicated partition on the same two systems ends up with a<br>
<br>
  Transport endpoint is disconnected<br>
<br>
and even totally shutting down all the Gluster processes on that box and<br>
restarting them does nothing for this - doesn&#39;t even create more entries in<br>
the log for it.<br>
<br>
The other two replicated Gluster shares between these machines are operating<br>
still - including the one I first had the trouble with today. But this third<br>
one that decided it would be disconnected seems intent to stay that way -<br>
despite that it&#39;s the same physical connection betweent the machines - which<br>
is fine - and the same Gluster daemons running on both.<br>
<br>
Again, this was all happy for many weeks with 3.1.3. So I&#39;d give pretty good<br>
odds that 3.1.5 has some deep bugs. Should I go back, or do things finally<br>
look better going forward? And what do I do to wake that disconnected<br>
endpoint in the morning?<br>
<br>
Thanks,<br>
<div><div></div><div class="h5">Whit<br>
<br>
_______________________________________________<br>
Gluster-users mailing list<br>
<a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
<a href="http://gluster.org/cgi-bin/mailman/listinfo/gluster-users" target="_blank">http://gluster.org/cgi-bin/mailman/listinfo/gluster-users</a><br>
</div></div></blockquote></div><br></div>