Thanks, I will put this in and see how things go.<br clear="all"><br>Dan<br>
<br><br><div class="gmail_quote">On Mon, Mar 9, 2009 at 9:49 PM, Krishna Srinivas <span dir="ltr">&lt;<a href="mailto:krishna@zresearch.com">krishna@zresearch.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
Dan,<br>
<br>
I think ping timeout value is not large enough for you, can you put<br>
&quot;option ping-timeout 50&quot; in client volumes and see if you still get<br>
the error? It is presently 10 secs, if it works fine for you we will<br>
increase the default value in the code.<br>
<br>
Thanks<br>
Krishna<br>
<div><div></div><div class="h5"><br>
On Tue, Mar 10, 2009 at 11:04 AM, Dan Parsons &lt;<a href="mailto:dparsons@nyip.net">dparsons@nyip.net</a>&gt; wrote:<br>
&gt; I just received this error message using rc4:<br>
&gt; 2009-03-09 21:58:16 E [client-protocol.c:505:client_ping_timer_expired]<br>
&gt; distfs03-stripe: ping timer expired! bailing transport<br>
&gt; 2009-03-09 21:58:16 N [client-protocol.c:6607:notify] distfs03-stripe:<br>
&gt; disconnected<br>
&gt; It happened a total of 7 times across my 33 client nodes. It doesn&#39;t seem to<br>
&gt; be related to any particular client, but the errors did happen mostly<br>
&gt; (though not always) on the unify-ns server. The gluster servers are under<br>
&gt; pretty heavy network utilization, however it doesn&#39;t seem to be near the<br>
&gt; link capacity and in any case, i/o should just block if it&#39;s slow to<br>
&gt; respond, correct? Fortunately, gluster is automatically reconnecting after<br>
&gt; the error. I don&#39;t remember seeing this in rc2. The only corresponding<br>
&gt; errors in the server logs are simply showing the client disconnecting. I&#39;ve<br>
&gt; also ruled out any interconnect faults.<br>
&gt; Any suggestions? My configs are below.<br>
&gt; Dan<br>
&gt;<br>
&gt; CLIENT CONFIG:<br>
&gt; volume unify-switch-ns<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.51<br>
&gt;    option remote-subvolume posix-unify-switch-ns<br>
&gt; end-volume<br>
&gt; #volume distfs01-ns-readahead<br>
&gt; #   type performance/read-ahead<br>
&gt; #   option page-size 1MB<br>
&gt; #   option page-count 8<br>
&gt; #   subvolumes distfs01-ns-brick<br>
&gt; #end-volume<br>
&gt; #volume unify-switch-ns<br>
&gt; #   type performance/write-behind<br>
&gt; #   option block-size 1MB<br>
&gt; #   option cache-size 3MB<br>
&gt; #   subvolumes distfs01-ns-readahead<br>
&gt; #end-volume<br>
&gt; volume distfs01-unify<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.51<br>
&gt;    option remote-subvolume posix-unify<br>
&gt; end-volume<br>
&gt; volume distfs02-unify<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.52<br>
&gt;    option remote-subvolume posix-unify<br>
&gt; end-volume<br>
&gt; volume distfs03-unify<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.53<br>
&gt;    option remote-subvolume posix-unify<br>
&gt; end-volume<br>
&gt; volume distfs04-unify<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.54<br>
&gt;    option remote-subvolume posix-unify<br>
&gt; end-volume<br>
&gt; volume distfs01-stripe<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.51<br>
&gt;    option remote-subvolume posix-stripe<br>
&gt; end-volume<br>
&gt; volume distfs02-stripe<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.52<br>
&gt;    option remote-subvolume posix-stripe<br>
&gt; end-volume<br>
&gt; volume distfs03-stripe<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.53<br>
&gt;    option remote-subvolume posix-stripe<br>
&gt; end-volume<br>
&gt; volume distfs04-stripe<br>
&gt;    type protocol/client<br>
&gt;    option transport-type tcp<br>
&gt;    option remote-host 10.8.101.54<br>
&gt;    option remote-subvolume posix-stripe<br>
&gt; end-volume<br>
&gt; volume stripe0<br>
&gt; type cluster/stripe<br>
&gt; option block-size *.jar,*.pin:1MB,*:2MB<br>
&gt; subvolumes distfs01-stripe distfs02-stripe distfs03-stripe distfs04-stripe<br>
&gt; end-volume<br>
&gt; volume dht0<br>
&gt; type cluster/dht<br>
&gt; # option lookup-unhashed yes<br>
&gt; subvolumes distfs01-unify distfs02-unify distfs03-unify distfs04-unify<br>
&gt; end-volume<br>
&gt; volume unify<br>
&gt; type cluster/unify<br>
&gt; option namespace unify-switch-ns<br>
&gt; option self-heal off<br>
&gt; option scheduler switch<br>
&gt; # send *.phr/psq/pnd etc to stripe0, send the rest to hash<br>
&gt; # extensions have to be *.foo* and not simply *.foo or rsync&#39;s tmp file<br>
&gt; naming will prevent files from being matched<br>
&gt; option scheduler.switch.case<br>
&gt; *.phr*:stripe0;*.psq*:stripe0;*.pnd*:stripe0;*.psd*:stripe0;*.pin*:stripe0;*.nsi*:stripe0;*.nin*:stripe0;*.nsd*:stripe0;*.nhr*:stripe0;*.nsq*:stripe0;*.tar*:stripe0;*.tar.gz*:stripe0;*.jar*:stripe0;*.img*:stripe0;*.perf*:stripe0;*.tgz*:stripe0;*.fasta*:stripe0;*.huge*:stripe0<br>

&gt; subvolumes stripe0 dht0<br>
&gt; end-volume<br>
&gt; volume ioc<br>
&gt;    type performance/io-cache<br>
&gt;    subvolumes unify<br>
&gt;    option cache-size 3000MB<br>
&gt; option cache-timeout 3600<br>
&gt; end-volume<br>
&gt; volume filter<br>
&gt;   type features/filter<br>
&gt;   option fixed-uid 0<br>
&gt;   option fixed-gid 900<br>
&gt;   subvolumes ioc<br>
&gt; end-volume<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; SERVER CONFIG:<br>
&gt; volume posix-unify-brick<br>
&gt; type storage/posix<br>
&gt; option directory /distfs-storage-space/glusterfs/unify<br>
&gt; # the below line is here to make the output of &#39;df&#39; accurate, as both<br>
&gt; volumes are served from the same local drive<br>
&gt; option export-statfs-size off<br>
&gt; end-volume<br>
&gt; volume posix-stripe-brick<br>
&gt;         type storage/posix<br>
&gt;         option directory /distfs-storage-space/glusterfs/stripe<br>
&gt; end-volume<br>
&gt; volume posix-unify-switch-ns-brick<br>
&gt;         type storage/posix<br>
&gt;         option directory /distfs-storage-space/glusterfs/unify-switch-ns<br>
&gt; end-volume<br>
&gt; volume posix-unify<br>
&gt; type performance/io-threads<br>
&gt; option thread-count 4<br>
&gt; subvolumes posix-unify-brick<br>
&gt; end-volume<br>
&gt; volume posix-stripe<br>
&gt; type performance/io-threads<br>
&gt; option thread-count 4<br>
&gt; subvolumes posix-stripe-brick<br>
&gt; end-volume<br>
&gt; volume posix-unify-switch-ns<br>
&gt; type performance/io-threads<br>
&gt; option thread-count 2<br>
&gt; subvolumes posix-unify-switch-ns-brick<br>
&gt; end-volume<br>
&gt; volume server<br>
&gt; type protocol/server<br>
&gt; option transport-type tcp<br>
&gt; option auth.addr.posix-unify.allow 10.8.101.*,10.8.15.50<br>
&gt; option auth.addr.posix-stripe.allow 10.8.101.*,10.8.15.50<br>
&gt; option auth.addr.posix-unify-switch-ns.allow 10.8.101.*,10.8.15.50<br>
&gt; subvolumes posix-unify posix-stripe posix-unify-switch-ns<br>
&gt; end-volume<br>
&gt;<br>
</div></div>&gt; _______________________________________________<br>
&gt; Gluster-devel mailing list<br>
&gt; <a href="mailto:Gluster-devel@nongnu.org">Gluster-devel@nongnu.org</a><br>
&gt; <a href="http://lists.nongnu.org/mailman/listinfo/gluster-devel" target="_blank">http://lists.nongnu.org/mailman/listinfo/gluster-devel</a><br>
&gt;<br>
&gt;<br>
</blockquote></div><br>