Yeah, a lot of threads are &quot;missing&quot;! Do the logs have anything unusual?<div><br></div><div>Avati<br><br><div class="gmail_quote">On Sun, Feb 3, 2013 at 7:00 AM, Emmanuel Dreyfus <span dir="ltr">&lt;<a href="mailto:manu@netbsd.org" target="_blank">manu@netbsd.org</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">3.4.0qa8 works fine, but after a while, a NetBSD/amd64 brick stops<br>
responding (while NetBSD/i386 servers seems to work fine, therefore<br>
it looks 64 bits specific). ktrace shows it loops around poll calls. Here<br>
is what I can see if I stop it and inspect with gdb:<br>
<br>
#0  0x00007f7ff62759da in ___lwp_park50 () from /lib/libc.so.12<br>
(gdb) bt<br>
#0  0x00007f7ff62759da in ___lwp_park50 () from /lib/libc.so.12<br>
#1  0x00007f7ff6c086b9 in pthread_cond_timedwait ()<br>
   from /usr/lib/libpthread.so.1<br>
#2  0x00007f7ff200abd1 in iot_worker (data=0x7f7ff6fe3120) at io-threads.c:157<br>
#3  0x00007f7ff6c09d75 in ?? () from /usr/lib/libpthread.so.1<br>
#4  0x00007f7ff62759f0 in ___lwp_park50 () from /lib/libc.so.12<br>
#5  0x00007f7fee000000 in ?? ()<br>
#6  0x00007f7ff7fffcc0 in ?? ()<br>
#7  0x0000000111110001 in ?? ()<br>
#8  0x0000000033330003 in ?? ()<br>
#9  0x0000000000000000 in ?? ()<br>
(gdb) frame 2<br>
#2  0x00007f7ff200abd1 in iot_worker (data=0x7f7ff6fe3120) at io-threads.c:157<br>
157                                     ret = pthread_cond_timedwait (&amp;conf-&gt;cond,<br>
(gdb) list<br>
152                                     pri = -1;<br>
153                             }<br>
154                             while (conf-&gt;queue_size == 0) {<br>
155                                     conf-&gt;sleep_count++;<br>
156<br>
157                                     ret = pthread_cond_timedwait (&amp;conf-&gt;cond,<br>
158                                                                   &amp;conf-&gt;mutex,<br>
159                                                                   &amp;sleep_till);<br>
160                                     conf-&gt;sleep_count--;<br>
161<br>
(gdb) print conf-&gt;cond<br>
$1 = {ptc_magic = 1431633925, ptc_lock = 0 &#39;\000&#39;, ptc_waiters = {<br>
    ptqh_first = 0x7f7feec00000, ptqh_last = 0x7f7fee000230},<br>
  ptc_mutex = 0x7f7ff6fe3120, ptc_private = 0x0}<br>
(gdb) print conf-&gt;mutex<br>
$2 = {ptm_magic = 858980355, ptm_errorcheck = 0 &#39;\000&#39;, ptm_pad1 = &quot;\000\000&quot;,<br>
  ptm_interlock = 0 &#39;\000&#39;, ptm_pad2 = &quot;\000\000&quot;, ptm_owner = 0x0,<br>
  ptm_waiters = 0x0, ptm_recursed = 0, ptm_spare2 = 0x0}<br>
<br>
NB: ptc_magic and ptm_magic are correct.<br>
<br>
<br>
(gdb) print sleep_till<br>
$3 = {tv_sec = 1359902843, tv_nsec = 0}<br>
<br>
This is also fine.<br>
<br>
<br>
(gdb) info threads<br>
  Id   Target Id         Frame<br>
* 1    LWP 1             0x00007f7ff200abd1 in iot_worker (data=0x7f7ff6fe3120)<br>
    at io-threads.c:157<br>
<br>
The current thread &lt;Thread ID 1&gt; has terminated.  See `help thread&#39;.<br>
(gdb)<br>
<br>
Is&#39;nt it supposed to have multiple threads?<br>
<span class="HOEnZb"><font color="#888888"><br>
--<br>
Emmanuel Dreyfus<br>
<a href="http://hcpnet.free.fr/pubz" target="_blank">http://hcpnet.free.fr/pubz</a><br>
<a href="mailto:manu@netbsd.org">manu@netbsd.org</a><br>
<br>
_______________________________________________<br>
Gluster-devel mailing list<br>
<a href="mailto:Gluster-devel@nongnu.org">Gluster-devel@nongnu.org</a><br>
<a href="https://lists.nongnu.org/mailman/listinfo/gluster-devel" target="_blank">https://lists.nongnu.org/mailman/listinfo/gluster-devel</a><br>
</font></span></blockquote></div><br></div>