¿Cuándo debería utilizar HBase?
Primero, asegúrese de que haya suficientes datos almacenados en HBase.
Si tiene cientos de millones o miles de millones de registros para almacenar en HBase, entonces HBase es la opción correcta; de lo contrario, si solo tiene millones o menos de datos, entonces HBase definitivamente no es la opción correcta; elegir. En este caso, debe elegir una base de datos relacional tradicional, porque si almacena tan pocos datos en HBase, los datos se acumularán en uno o dos nodos, mientras que los otros nodos en el clúster de HBase estarán inactivos.
En segundo lugar, es necesario confirmar que el sistema puede funcionar sin problemas sin utilizar funciones adicionales proporcionadas por las bases de datos relacionales tradicionales (como fuertes restricciones de tipo en las columnas de la base de datos, índices secundarios, transacciones, SQL y otros lenguajes de consulta avanzados). ) Trabajar.
Las aplicaciones basadas en datos relacionales tradicionales no se pueden "migrar" a HBase simplemente cambiando el controlador JDBC. La migración del sistema de una base de datos relacional normal a HBase dará como resultado el rediseño de todo el sistema.
Finalmente, asegúrese de que haya suficientes servidores de hardware para soportar el funcionamiento de HBase.
Incluso ejecutando HDFS solo, HDFS no funciona bien con menos de 5 nodos porque el factor de replicación de bloques de HDFS por defecto es 3 y se agrega un Namenode.