Hi,<br><br><div class="gmail_quote">On Tue, Jan 27, 2009 at 5:01 PM, Sean Davis <span dir="ltr">&lt;<a href="mailto:sdavis2@mail.nih.gov">sdavis2@mail.nih.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br><br><div class="gmail_quote"><div class="Ih2E3d">On Tue, Jan 27, 2009 at 1:23 AM, Raghavendra G <span dir="ltr">&lt;<a href="mailto:raghavendra@zresearch.com" target="_blank">raghavendra@zresearch.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi,<br><br><div class="gmail_quote"><div>On Tue, Jan 27, 2009 at 3:27 AM, Sean Davis <span dir="ltr">&lt;<a href="mailto:sdavis2@mail.nih.gov" target="_blank">sdavis2@mail.nih.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">


If I am putting together several volumes of varying sizes using distribute, what type of load balancing should I expect?&nbsp; I understand hashing and it sounds like if the disk fills, then it is not used, but can I use ALU scheduler to cut things off before the disk becomes full to allow for growth of directories and files?&nbsp; How are people approaching this?</blockquote>


</div><div><br>Distribute,&nbsp; does not have any schedulers. The hashing as of now is sort of static in the sense that if the disk becomes full, further creation of files which happen to be scheduled to that node fail. Future versions of distribute will reschedule the files to different nodes.<br>


&nbsp;</div></div></blockquote></div><div><br>Thanks, Raghavendra.<br><br>So, it sounds like Distribute is problematic for any inhomogeneous file system (where bricks are of different sizes) or for systems that are not meant as &quot;archival&quot; (that is, write once, read many).&nbsp; I understand that for boatloads of small files, performance is improved over unify by using distribute, but it sounds like unify is currently the better option for my situation.&nbsp; <br>

<br>Is it worthwhile pointing out these details on the wiki somewhere?&nbsp; The website appears to suggest that unify/schedulers are &quot;legacy&quot; systems, which implies that they are inferior to rather than an alternative to Distribute.&nbsp; However, in my situation, it appears that Unify is the only viable solution.</div>
</div></blockquote><div><br>Its mentioned under &quot;legacy&quot; section in the sense that, it will be gradually phased out as Distribute evolves.<br>&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="gmail_quote"><div><br>
<br>Thanks for the help.<br><br>Sean<br>&nbsp;<br></div></div><br>
</blockquote></div><br><br clear="all"><br>-- <br>Raghavendra G<br><br>