Hi all,<div><br></div><div>After lots of looking at just about all the distributed file systems out there I have decided that I like the simple setup of GlusterFS the best and not having to have a metadata server seems like a good idea.. The issue I have is working out the best way to setup the cluster we are trying to create.. We have existing hardware that will be used which may throw a few spanners in the works..</div>
<div><br></div><div>The sole purpose of the system is for virtualisation..</div><div><br></div><div>The Hardware</div><div>2 x 1U Dual Xeon Quad core servers with 2x2TB SATA drives which will be setup in a RAID1 configuration..</div>
<div>2 x 2U Dual Xeon Quad core servers with 6x2TB SATA drives which will be setup in a RAID10 configuration..</div><div><br></div><div>Features we are trying to achieve are..</div><div>- Live migration of VM&#39;s between any of the nodes..</div>
<div>- High performance (reading and writing to multiple servers) and high availability (loss of a drive or a whole server won&#39;t stop any VM&#39;s running for any length of time. VM&#39;s running on the failed server can be booted immediately on another server)</div>
<div>- Scalability - We want to be able to add more nodes to the cluster as and when needed to expand computing power and/or storage..</div><div><br></div><div>Firstly can GlusterFS support bricks of different sizes in a volume? I have not been able to find details on this..</div>
<div><br></div><div>Now it seems to me what&#39;s needed is a block/chunk level distribution of data rather than file level because VM&#39;s run in single large files so if files are distributed at file level it will mean an entire VM image will be stored on one brick which won&#39;t help performance.. Am I right in thinking that this is what the &quot;stripe&quot; translator does as opposed to the &quot;distributed&quot; translator?</div>
<div><br></div><div>If so how do you achieve high availability with a &quot;stripe&quot; because it would need to be &quot;replicated&quot; as well.. Is this possible?? On different sized bricks??</div><div><br></div><div>
Then the issue is with scalability.. How do you expand a  &quot;striped&quot; and  &quot;replicated&quot; volume?? If starting with 4 servers would I have to add another 4 in order to expand the cluster or could I add one at a time??</div>
<div><br></div><div>These are the things I can&#39;t figure out with GlusterFS where systems like Ceph allow incremental expansion and the data is then redistributed so there are n copies of each block somewhere in the cluster (its not a strict mirror redundancy but rather distributed redundancy throughout the cluster), at least that&#39;s what their documentation says..</div>
<div><br></div><div>If anyone can give any pointers on these issue or advise on how to put it together I would be most grateful..</div><div><br></div><div>Thanks in advance... </div>