Cómo instalar y configurar Hive con alta disponibilidad-Parte 7

Cómo instalar y configurar Hive con alta disponibilidad-Parte 7

Hive. es un modelo de almacén de datos. en el ecosistema Hadoop. Puede funcionar como una herramienta ETL sobre Hadoop. Habilitar la alta disponibilidad (HA) en Hive no es similar a como lo hacemos en los servicios maestros como Namenode y Resource Manager.

La conmutación por error automática no se producirá en Hive. ( Hiveserver2. . Si algún Hiveserver2. ( HS2. falla, la ejecución de trabajos en ese HS2. fallido fallará. Necesitamos volver a enviar el trabajo para que pueda ejecutarse en otro HiveServer2. Por lo tanto, habilitar HA. en HS2. no es más que aumentar la cantidad de componentes de HS2. en Cluster.

En este artículo, veremos los pasos para instalar y habilitar la Alta disponibilidad. de Hive.

Requisitos

  • Prácticas recomendadas para implementar Hadoop Server en CentOS/RHEL 7-Parte 1
  • Configurar los requisitos previos de Hadoop y el refuerzo de la seguridad-Parte 2
  • Cómo instalar y configurar Cloudera Manager en CentOS/RHEL 7-Parte 3
  • Cómo instalar CDH y configurar ubicaciones de servicios en CentOS/RHEL 7-Parte 4
  • Cómo configurar alta disponibilidad para Namenode-Parte 5
  • Cómo configurar la alta disponibilidad para Resource Manager-Parte 6

Empecemos…

Instalación y configuración de Hive

1.. Inicie sesión en Cloudera Manager. en la siguiente URL y navegue hasta Cloudera Manager. ->. Agregar servicio.

http://13.233.129.39:7180/cmf/home Agregar servicio en Cloudera Manager  Agregar servicio en Cloudera Manager Agregar servicio en Cloudera Manager freestar.config.enabled_slots.push (LocationName:” tecmint_incontent “, slotId:” tecmint_incontent “) ;

2.. Seleccione el servicio ‘ Hive. .

Elegir servicio Hive  Elegir servicio Hive Elija Hive Service

3.. Asigne los servicios en los nodos.

  • Gateway.-Es el servicio de cliente donde el usuario puede acceder al Hive. Por lo general, este servicio se ubicará en los nodos Edge. dedicados a los usuarios.
  • Hive Metastore. es un repositorio central para almacenar metadatos de Hive.
  • WebHCat Server. es una API web para HCatalog y otros servicios de Hadoop.
  • Hiveserver2. es una interfaz de clientes para la ejecución de consultas en Hive.

Una vez seleccionados los servidores, haga clic en “ Continuar. para continuar.

 Asignar servicio como ancho de nodos Asignar servicio como nodos Asignar servicio como nodos

4.. Hive Metastore nee ds una base de datos subyacente para almacenar metadatos. Aquí estamos usando la base de datos PostgreSQL. predeterminada que está incorporada con CDH.

Los detalles de la base de datos que se mencionan a continuación se ingresarán automáticamente, ‘ Conexión de prueba. ‘se omitirá ya que la base de datos mencionada se creará sobre la marcha. En tiempo real, necesitamos crear la base de datos en la base de datos externa y probar la conexión para continuar. Una vez hecho esto, haga clic en ‘ Continuar. .

 Configuración de la base de datos  Configurar base de datos Configuración de la base de datos

5.. Configure el Almacén de la colmena directorio, /user/hive/warehouse. es la ruta de directorio predeterminada para almacenar tablas de Hive. Haga clic en ‘ Continuar. .

 Elegir directorio de almacén de Hive  Elegir directorio de almacén de Hive Elija Hive Warehouse Directory

6.. Se inicia la instalación de Hive.

 Hive Installation Progress  Progreso de la instalación de Hive Progreso de la instalación de Hive

7.. Una vez instalada completado, puede obtener el estado “ Finalizado. . Haga clic en “ Continuar. para continuar.

 Instalación de Hive finalizada  Instalación de Hive finalizada Instalación de Hive terminada

8.. La instalación y configuración de Hive se completaron correctamente. Haga clic en ‘ Finalizar. para completar el procedimiento de instalación.

 Finalizar la instalación de Hive  Finalizar la instalación de Hive Finalizar la instalación de Hive

9.. Puede ver el servicio Hive. agregado en Cluster. a través de Cloudera Manager Panel de control.

 Servicio de Hive Se agregó  Servicio de Hive agregado Servicio Hive agregado

10.. Puede ver Hiveserver2. en Instancias. de Hive. Hemos agregado Hiveserver2. en master1.

Cloudera Manager.-> Hive.-> Instancias.-> Hiveserver2.

 Ver instancias de Hiveserver2  Ver instancias de Hiveserver2 Ver instancias de Hiveserver2

Habilitación de alta disponibilidad en Hive

11.. Luego, agregue el rol de Hive yendo a Cloudera Manager.-> Hive.-> Acciones.-> Agregar rol. instancias.

 Add Hive Role Instance Agregar instancia de rol de Hive Agregar instancia de rol de Hive

12.. Seleccione los servidores donde y desea colocar un Hiveserver2. adicional. Puede agregar más de dos, no hay límite. Aquí estamos agregando un Hiveserver2. adicional en master2.

Elegir servidor para Hive  Choose Server for Hive Elija servidor para Hive  Elija Host Server Elija el ancho del servidor host Elija Host Server

13.. Una vez seleccionado d el servidor, haga clic en ‘ Continuar. .

 Servidor agregado Servidor agregado Servidor agregado

14.. A Hiverserver2. se agregará al Instancias de Hive. debe iniciarlo yendo a Cloudera Manager.-> Hive.-> Instancias.-> ( Seleccione Hiveserver2. agregado recientemente)-> Acción para los seleccionados.-> Iniciar.

 Choose Hive Server  Elija Hive Server Elija Hive Server  Iniciar Hive Server  Iniciar Hive Server Iniciar Hive Server  Iniciar el servidor Hive Iniciar el servidor Hive Inicie el servidor Hive

15.. Una vez que Hiveserver2. se haya iniciado en master2. obtendrá el estado ‘ Finalizado. . Haga clic en Cerrar.

 Estado Finalizado  Estado Finalizado Estado finalizado

16.. Puede ver, tanto Hiveserver2s. estan corriendo.