InfiniBand® es un sistema de almacenamiento y comunicaciones de red que hace uso de procesadores y enlaces seriales de alta velocidad para abordar las preocupaciones de rendimiento y confiabilidad para la computación de alto rendimiento. Es capaz de direccionar 64,000 nodos y puede proporcionar velocidades de hasta 2.5 gigabits por segundo (Gbps). Esta velocidad es de aproximadamente 2,500 millones de bits por segundo (Mbps), lo que puede descargar un archivo de 1 gigabit en menos de 4 segundos.
Los enlaces seriales de alta velocidad ahora disponibles, como la fibra óptica, hacen posible en parte InfiniBand®. En la informática temprana, las comunicaciones en serie se consideraban demasiado lentas para velocidades de transferencia de datos rápidas, y los buses de computadora, que eran en su mayoría paralelos, eran la única opción. Los enlaces seriales rápidos y los buses seriales son muy prácticos y los puntos de falla en el hardware son menores. En un bus paralelo de 32 bits, por ejemplo, hay al menos 32 conjuntos de controladores de bits y, con mayor frecuencia, contactos de presión involucrados entre las tarjetas de interfaz. La probabilidad de falla es entonces mayor en los dispositivos en paralelo a este respecto.
InfiniBand® también ofrece redundancia para una mayor confiabilidad. Los dispositivos de almacenamiento y los hosts en InfiniBand® pueden estar distribuidos geográficamente para una protección optimizada. Por ejemplo, una aplicación de base de datos masiva que requiere 24 x 7, o el 100% de tiempo de actividad, puede considerar muchas técnicas, incluida la redundancia del sitio, la redundancia del servidor y la redundancia del almacenamiento.
La redundancia del sitio replica un sitio de aplicación completo que funciona al mismo tiempo que el sitio de aplicación principal, lo que al principio puede parecer que desperdicia recursos informáticos y de redes informáticas. La sabiduría del enfoque se observa cuando una operación en el sitio de aplicación principal se interrumpe parcial o totalmente. Un sitio de respaldo que siempre funciona junto con el sitio principal se promociona como el sitio principal y sigue procesándose hasta que el sitio principal está activo y en línea.
La redundancia del servidor replica el servidor primario para garantizar un funcionamiento continuo en caso de falla. Ya sea que se encuentre en una ubicación conjunta o remota del principal, el servidor secundario puede funcionar en paralelo para que cualquier falla importante en el servidor principal no interrumpa el servicio. En la duplicación de disco, el almacenamiento local del servidor se escribe en dos sistemas de almacenamiento, mientras que en la duplicación del sitio, el sitio de respaldo hace el trabajo del servidor primario y se sincroniza con él.
Un enlace de comunicaciones de estructura conmutada es capaz de entregar los anchos de banda de dispositivo generales requeridos que necesitan las supercomputadoras. Fabric se refiere a una red relativamente enorme de hosts y dispositivos de red que están interconectados entre sí. En una estructura conmutada, el almacenamiento remoto de alta velocidad y los servicios de host remoto rápido se mejoran mediante tecnologías de conmutación que reducen la sobrecarga informática y las colisiones cuando se envían paquetes de datos a la red.