Table of Contents
Cómo instalar y configurar Hive con alta disponibilidad-Parte 7
Hive. es un modelo de almacén de datos. en el ecosistema Hadoop. Puede funcionar como una herramienta ETL sobre Hadoop. Habilitar la alta disponibilidad (HA) en Hive no es similar a como lo hacemos en los servicios maestros como Namenode y Resource Manager.
La conmutación por error automática no se producirá en Hive. ( Hiveserver2. . Si algún Hiveserver2. ( HS2. falla, la ejecución de trabajos en ese HS2. fallido fallará. Necesitamos volver a enviar el trabajo para que pueda ejecutarse en otro HiveServer2. Por lo tanto, habilitar HA. en HS2. no es más que aumentar la cantidad de componentes de HS2. en Cluster.
En este artículo, veremos los pasos para instalar y habilitar la Alta disponibilidad. de Hive.
Requisitos
- Prácticas recomendadas para implementar Hadoop Server en CentOS/RHEL 7-Parte 1
- Configurar los requisitos previos de Hadoop y el refuerzo de la seguridad-Parte 2
- Cómo instalar y configurar Cloudera Manager en CentOS/RHEL 7-Parte 3
- Cómo instalar CDH y configurar ubicaciones de servicios en CentOS/RHEL 7-Parte 4
- Cómo configurar alta disponibilidad para Namenode-Parte 5
- Cómo configurar la alta disponibilidad para Resource Manager-Parte 6
Empecemos…
Instalación y configuración de Hive
1.. Inicie sesión en Cloudera Manager. en la siguiente URL y navegue hasta Cloudera Manager. ->. Agregar servicio.
http://13.233.129.39:7180/cmf/home
Agregar servicio en Cloudera Manager freestar.config.enabled_slots.push (LocationName:” tecmint_incontent “, slotId:” tecmint_incontent “) ;
2.. Seleccione el servicio ‘ Hive. .
Elija Hive Service
3.. Asigne los servicios en los nodos.
- Gateway.-Es el servicio de cliente donde el usuario puede acceder al Hive. Por lo general, este servicio se ubicará en los nodos Edge. dedicados a los usuarios.
- Hive Metastore. es un repositorio central para almacenar metadatos de Hive.
- WebHCat Server. es una API web para HCatalog y otros servicios de Hadoop.
- Hiveserver2. es una interfaz de clientes para la ejecución de consultas en Hive.
Una vez seleccionados los servidores, haga clic en “ Continuar. para continuar.
Asignar servicio como nodos
4.. Hive Metastore nee ds una base de datos subyacente para almacenar metadatos. Aquí estamos usando la base de datos PostgreSQL. predeterminada que está incorporada con CDH.
Los detalles de la base de datos que se mencionan a continuación se ingresarán automáticamente, ‘ Conexión de prueba. ‘se omitirá ya que la base de datos mencionada se creará sobre la marcha. En tiempo real, necesitamos crear la base de datos en la base de datos externa y probar la conexión para continuar. Una vez hecho esto, haga clic en ‘ Continuar. .
Configuración de la base de datos
5.. Configure el Almacén de la colmena directorio, /user/hive/warehouse. es la ruta de directorio predeterminada para almacenar tablas de Hive. Haga clic en ‘ Continuar. .
Elija Hive Warehouse Directory
6.. Se inicia la instalación de Hive.
Progreso de la instalación de Hive
7.. Una vez instalada completado, puede obtener el estado “ Finalizado. . Haga clic en “ Continuar. para continuar.
Instalación de Hive terminada
Finalizar la instalación de Hive
9.. Puede ver el servicio Hive. agregado en Cluster. a través de Cloudera Manager Panel de control.
Servicio Hive agregado
10.. Puede ver Hiveserver2. en Instancias. de Hive. Hemos agregado Hiveserver2. en master1.
Cloudera Manager.-> Hive.-> Instancias.-> Hiveserver2.
Ver instancias de Hiveserver2
Habilitación de alta disponibilidad en Hive
11.. Luego, agregue el rol de Hive yendo a Cloudera Manager.-> Hive.-> Acciones.-> Agregar rol. instancias.
Agregar instancia de rol de Hive
12.. Seleccione los servidores donde y desea colocar un Hiveserver2. adicional. Puede agregar más de dos, no hay límite. Aquí estamos agregando un Hiveserver2. adicional en master2.
Elija servidor para Hive
Elija Host Server
13.. Una vez seleccionado d el servidor, haga clic en ‘ Continuar. .
Servidor agregado
14.. A Hiverserver2. se agregará al
Elija Hive Server
Iniciar Hive Server
Inicie el servidor Hive
15.. Una vez que Hiveserver2. se haya iniciado en master2. obtendrá el estado ‘ Finalizado. . Haga clic en Cerrar.
Estado finalizado
16.. Puede ver, tanto Hiveserver2s. estan corriendo.