Hi there,<div><br></div><div>I compiled and installed the latest version of Gluster on a couple of SLES 11 SP1 boxes, everything up to this point seemed ok.</div><div><br></div><div>I start the daemon on both boxes, and both are listening on 24007.</div>
<div><br></div><div>I issue a &quot;gluster peer probe&quot;  command on one of the boxes and the daemon instantly dies, I restart it and it shows:</div><div><br></div><div><div># gluster peer status</div><div>Number of Peers: 1</div>
<div><br></div><div>Hostname: mckalcpap02</div><div>Uuid: 00000000-0000-0000-0000-000000000000</div><div>State: Establishing Connection (Connected)</div><div><br></div><div>I attempted to run the probe on the other box, the daemon crashes, now as I start the daemon on each box the daemon just crashes on the other box.</div>
<div><br></div><div>The log output immediately prior to the crash is as follows:</div><div><br></div><div><div>[2011-06-07 08:05:10.700710] I [glusterd-handler.c:623:glusterd_handle_cli_probe] 0-glusterd: Received CLI probe req mckalcpap02 24007</div>
<div>[2011-06-07 08:05:10.701058] I [glusterd-handler.c:391:glusterd_friend_find] 0-glusterd: Unable to find hostname: mckalcpap02</div><div>[2011-06-07 08:05:10.701086] I [glusterd-handler.c:3422:glusterd_probe_begin] 0-glusterd: Unable to find peerinfo for host: mckalcpap02 (24007)</div>
<div>[2011-06-07 08:05:10.702832] I [glusterd-handler.c:3404:glusterd_friend_add] 0-glusterd: connect returned 0</div><div>[2011-06-07 08:05:10.703110] I [glusterd-handshake.c:317:glusterd_set_clnt_mgmt_program] 0-: Using Program glusterd clnt mgmt, Num (1238433), Version (1)</div>
</div><div><br></div><div>If I use the IP address the same thing happens:</div><div><br></div><div><div>[2011-06-07 08:07:12.873075] I [glusterd-handler.c:623:glusterd_handle_cli_probe] 0-glusterd: Received CLI probe req 10.9.54.2 24007</div>
<div>[2011-06-07 08:07:12.873410] I [glusterd-handler.c:391:glusterd_friend_find] 0-glusterd: Unable to find hostname: 10.9.54.2</div><div>[2011-06-07 08:07:12.873438] I [glusterd-handler.c:3422:glusterd_probe_begin] 0-glusterd: Unable to find peerinfo for host: 10.9.54.2 (24007)</div>
<div>[2011-06-07 08:07:12.875046] I [glusterd-handler.c:3404:glusterd_friend_add] 0-glusterd: connect returned 0</div><div>[2011-06-07 08:07:12.875280] I [glusterd-handshake.c:317:glusterd_set_clnt_mgmt_program] 0-: Using Program glusterd clnt mgmt, Num (1238433), Version (1)</div>
</div><div><br></div><div>There is no firewall issue:</div><div><br></div><div><div># telnet mckalcpap02 24007</div><div>Trying 10.9.54.2...</div><div>Connected to mckalcpap02.</div><div>Escape character is &#39;^]&#39;.</div>
</div><div><br></div><div>Following restart (which crashes the other node) the log output is as follows:</div><div><br></div><div><div>[2011-06-07 08:10:09.616486] I [glusterd.c:564:init] 0-management: Using /etc/glusterd as working directory</div>
<div>[2011-06-07 08:10:09.617619] C [rdma.c:3933:rdma_init] 0-rpc-transport/rdma: Failed to get IB devices</div><div>[2011-06-07 08:10:09.617676] E [rdma.c:4812:init] 0-rdma.management: Failed to initialize IB Device</div>
<div>[2011-06-07 08:10:09.617700] E [rpc-transport.c:741:rpc_transport_load] 0-rpc-transport: &#39;rdma&#39; initialization failed</div><div>[2011-06-07 08:10:09.617724] W [rpcsvc.c:1288:rpcsvc_transport_create] 0-rpc-service: cannot create listener, initing the transport failed</div>
<div>[2011-06-07 08:10:09.617830] I [glusterd.c:88:glusterd_uuid_init] 0-glusterd: retrieved UUID: 1e344f5d-6904-4d14-9be2-8f0f44b97dd7</div><div>[2011-06-07 08:10:11.258098] I [glusterd-handler.c:3404:glusterd_friend_add] 0-glusterd: connect returned 0</div>
<div>Given volfile:</div><div>+------------------------------------------------------------------------------+</div><div>  1: volume management</div><div>  2:     type mgmt/glusterd</div><div>  3:     option working-directory /etc/glusterd</div>
<div>  4:     option transport-type socket,rdma</div><div>  5:     option transport.socket.keepalive-time 10</div><div>  6:     option transport.socket.keepalive-interval 2</div><div>  7: end-volume</div><div>  8:</div><div>
<br></div><div>+------------------------------------------------------------------------------+</div><div>[2011-06-07 08:10:11.258431] I [glusterd-handshake.c:317:glusterd_set_clnt_mgmt_program] 0-: Using Program glusterd clnt mgmt, Num (1238433), Version (1)</div>
<div>[2011-06-07 08:10:11.280533] W [socket.c:1494:__socket_proto_state_machine] 0-socket.management: reading from socket failed. Error (Transport endpoint is not connected), peer (<a href="http://10.9.54.2:1023">10.9.54.2:1023</a>)</div>
<div>[2011-06-07 08:10:11.280595] W [socket.c:1494:__socket_proto_state_machine] 0-management: reading from socket failed. Error (Transport endpoint is not connected), peer (<a href="http://10.9.54.2:24007">10.9.54.2:24007</a>)</div>
<div>[2011-06-07 08:10:17.256235] E [socket.c:1685:socket_connect_finish] 0-management: connection to <a href="http://10.9.54.2:24007">10.9.54.2:24007</a> failed (Connection refused)</div></div><div><br></div><div>There are no logs on the node which crashes.</div>
<div><br></div><div>I&#39;ve tried various possibly solutions from searching the net but got getting anywhere, can anyone advise how to proceed?</div><div><br></div><div>Thanks,</div><div>Phil.</div><div><br></div>-- <br>
Phil Bayfield<br>Development Manager<br>Alchemy Social, part of Techlightenment, an Experian company<br><br>Office 202 | 89 Worship Street | London | <span style="font-family:arial, sans-serif;font-size:13px;background-color:rgb(255, 255, 255)">EC2A 2BF</span><br>
<div><br></div><div>t:   +44 (0) <span style="font-family:arial, helvetica, sans-serif;background-color:rgb(255, 255, 255)">207 392 2618</span><br>m: +44 (0) 7825 561 091<br>e:  <a href="mailto:phil@techlightenment.com" target="_blank">phil@techlightenment.com</a><div>
<a href="mailto:phil@techlightenment.com" target="_blank"></a>skype: <a href="http://phil.tl" target="_blank">phil.tl</a></div><div><br><a href="http://www.techlightenment.com" target="_blank">www.techlightenment.com<br></a></div>
</div><br>
</div>