Dataproc proporciona acciones de inicialización que se pueden usar para instalar software personalizado en instancias de clúster. Para crear una acción de inicialización, debe proporcionar un script de arranque. El script debe almacenarse en Google Cloud Storage en un URI al que se pueda acceder desde el clúster de Dataproc. Para obtener información de compatibilidad sobre los componentes de QueryGrid, consulte la Matriz de compatibilidad de QueryGrid.
El script necesario, TDQG_DEPLOYMENT.sh, se empaqueta en el paquete de nodos tdqg-node-version.tar.gz.
- Tiene los privilegios necesarios para aprovisionar el clúster de Dataproc y acceder a los scripts almacenados en Google Cloud Storage.
- La herramienta cURL se instala en todos los nodos en los que se instalará QueryGrid.
- Solo se pueden proporcionar durante el aprovisionamiento de clústeres
- No se pueden modificar después del aprovisionamiento clústeres
- Siempre se conservan cuando se crean, todos los nodos de Dataproc futuros ejecutan las acciones de inicialización.
- Agregue un sistema y descargue el archivo de token tdqg-node.json generado por QueryGrid Manager.Para obtener información sobre cómo descargar tdqg-node.json, consulte Agregación manual de nodos.
- Siga uno de estos procedimientos:
Opción Acción Instalar QueryGrid™ en Dataproc de Google Cloud - Descargue el paquete de nodos.
Para obtener más información, consulte Descargar paquetes requeridos.
- Descomprima el paquete:
tar -xvzf tdqg-node-version.tar.gz
El script TDQG_DEPLOYMENT.sh está disponible en la ruta de acceso qgdeployment/dataproc, denominado TDQG_DEPLOYMENT.sh.
- Cargue el script de implementación de QueryGrid en Google Cloud Storage.
- En la pantalla Cree un clúster de Dataproc, haga lo siguiente:
- En Acciones de inicialización, proporcione la ruta de acceso al script de implementación.
- En Metadatos, utilice tdqg_node_json como clave y use el contenido del archivo para los datos.
Instalar QueryGrid en un nodo existente La ejecución del script de acciones de inicialización requiere un usuario con permisos sudo. - En cada nodo del clúster, ejecute el siguiente comando:
./TDQG_DEPLOYMENT.sh --tdqg_node_json_file 'input'
Donde input puede ser una de las siguientes opciones:- (Recomendado) Ruta a tdqg_node_json_file.
- Contenido del archivo de tdqg_node_json.
Instalar QueryGrid en un nuevo nodo La acción de inicialización en un nuevo nodo depende de cómo se ejecutó el script de TDQG_DEPLOYMENT.sh al aprovisionar el clúster de Dataproc. - Si ejecutó el script como Initialization Action para Dataproc, el script se ejecuta automáticamente en el nuevo nodo.
- Si no ejecutó el script como Initialization Action, ejecute el script en el nuevo nodo como si instalara el script en un nodo existente.
- Descargue el paquete de nodos.