Implementación automática de QueryGrid en Dataproc de Google Cloud - Teradata QueryGrid

QueryGrid™ Guía de instalación y uso- 3.06

Deployment
VantageCloud
VantageCore
Edition
Enterprise
IntelliFlex
Lake
VMware
Product
Teradata QueryGrid
Release Number
3.06
Published
Diciembre de 2024
ft:locale
es-ES
ft:lastEdition
2024-12-18
dita:mapPath
es-ES/ndp1726122159943.ditamap
dita:ditavalPath
ft:empty
dita:id
lxg1591800469257
Product Category
Analytical Ecosystem

Dataproc proporciona acciones de inicialización que se pueden usar para instalar software personalizado en instancias de clúster. Para crear una acción de inicialización, debe proporcionar un script de arranque. El script debe almacenarse en Google Cloud Storage en un URI al que se pueda acceder desde el clúster de Dataproc. Para obtener información de compatibilidad sobre los componentes de QueryGrid, consulte la Matriz de compatibilidad de QueryGrid.

El script necesario, TDQG_DEPLOYMENT.sh, se empaqueta en el paquete de nodos tdqg-node-version.tar.gz.

Para este procedimiento se asumen los siguientes requisitos previos:
  • Tiene los privilegios necesarios para aprovisionar el clúster de Dataproc y acceder a los scripts almacenados en Google Cloud Storage.
  • La herramienta cURL se instala en todos los nodos en los que se instalará QueryGrid.
Tenga en cuenta las siguientes consideraciones con las acciones de inicialización:
  • Solo se pueden proporcionar durante el aprovisionamiento de clústeres
  • No se pueden modificar después del aprovisionamiento clústeres
  • Siempre se conservan cuando se crean, todos los nodos de Dataproc futuros ejecutan las acciones de inicialización.
  1. Agregue un sistema y descargue el archivo de token tdqg-node.json generado por QueryGrid Manager.
    Para obtener información sobre cómo descargar tdqg-node.json, consulte Agregación manual de nodos.
  2. Siga uno de estos procedimientos:
    Opción Acción
    Instalar QueryGrid™ en Dataproc de Google Cloud
    1. Descargue el paquete de nodos.

      Para obtener más información, consulte Descargar paquetes requeridos.

    2. Descomprima el paquete:

      tar -xvzf tdqg-node-version.tar.gz

      El script TDQG_DEPLOYMENT.sh está disponible en la ruta de acceso qgdeployment/dataproc, denominado TDQG_DEPLOYMENT.sh.

    3. Cargue el script de implementación de QueryGrid en Google Cloud Storage.
    4. En la pantalla Cree un clúster de Dataproc, haga lo siguiente:
      • En Acciones de inicialización, proporcione la ruta de acceso al script de implementación.
      • En Metadatos, utilice tdqg_node_json como clave y use el contenido del archivo para los datos.
    Instalar QueryGrid en un nodo existente La ejecución del script de acciones de inicialización requiere un usuario con permisos sudo.
    1. En cada nodo del clúster, ejecute el siguiente comando:

      ./TDQG_DEPLOYMENT.sh --tdqg_node_json_file 'input'

      Donde input puede ser una de las siguientes opciones:
      • (Recomendado) Ruta a tdqg_node_json_file.
      • Contenido del archivo de tdqg_node_json.
    Instalar QueryGrid en un nuevo nodo La acción de inicialización en un nuevo nodo depende de cómo se ejecutó el script de TDQG_DEPLOYMENT.sh al aprovisionar el clúster de Dataproc.
    • Si ejecutó el script como Initialization Action para Dataproc, el script se ejecuta automáticamente en el nuevo nodo.
    • Si no ejecutó el script como Initialization Action, ejecute el script en el nuevo nodo como si instalara el script en un nodo existente.