CDH
指标 | 说明 |
---|---|
失败的应用程序 | 无法成功执行的 YARN 应用程序数 |
正在运行的应用程序 | 当前正在执行的 YARN 应用程序数 |
损坏的块 | HDFS 中损坏的块数 |
缺少的块 | HDFS 中缺少的块数 |
分配的集群内存 | 在所有 NodeManager 实例中分配的可用内存百分比 |
CPU | 平均节点 CPU 使用 |
最大磁盘空间(按节点) | 节点上已用磁盘空间的最大百分比 |
名称节点 CPU | 运行 NameNode 服务的节点的 CPU 平均使用率 |
名称节点堆 | namenode JVM 中已用堆空间的百分比 |
节点 CPU 偏斜 | 最忙节点与平均忙节点上 CPU 使用率的比较 |
节点 I/O 偏斜 | 最忙节点与平均忙节点上 I/O 使用率的比较 |
ResourceManager 堆 | ResourceManager JVM 中已用堆空间的百分比 |
RPC 延迟 - RM | ResourceManager 服务调用在队列中的平均等待时间 |
RPC 延迟 - NN | Namenode 服务调用在队列中的平均等待时间 |
不良的服务 | 处于关键状态的服务数 |
存在隐患的服务 | 处于已降级状态的服务数 |
总空间 | 已用空间占总存储容量的百分比 |
HDP 2.1 及更高版本
指标 | 说明 |
---|---|
失败的应用程序 | 无法成功执行的 YARN 应用程序数 |
正在运行的应用程序 | 当前正在执行的 YARN 应用程序数 |
损坏的块 | HDFS 中损坏的块数 |
缺少的块 | HDFS 中缺少的块数 |
分配的集群内存 | 在所有 NodeManager 实例中分配的可用内存百分比 |
组件关闭 | 未启动的服务数 |
CPU | 平均节点 CPU 使用 |
最大磁盘空间(按节点) | 节点上已用磁盘空间的最大百分比 |
名称节点 CPU | 运行 NameNode 服务的节点的 CPU 平均使用率 |
名称节点堆 | namenode JVM 中已用堆空间的百分比 |
节点 CPU 偏斜 | 最忙节点与平均忙节点上 CPU 使用率的比较 |
节点 I/O 偏斜 | 最忙节点与平均忙节点上 I/O 使用率的比较 |
ResourceManager 堆 | ResourceManager JVM 中已用堆空间的百分比 |
RPC 延迟 - RM | ResourceManager 服务调用在队列中的平均等待时间 |
RPC 延迟 - NN | Namenode 服务调用在队列中的平均等待时间 |
总空间 | 已用空间占总存储容量的百分比 |
HDP 1.3
指标 | 说明 |
---|---|
损坏的块 | 副本已全部损坏的块数 |
缺少的块 | 在集群内的任何位置均无副本的块数 |
组件关闭 | 未运行的服务组件数 |
CPU | 平均节点 CPU 使用。CPU 计算为用户 CPU 和系统 CPU 使用百分比的总和。 |
失败的作业 | 失败的作业数 |
正在运行的作业 | 当前在系统中执行的作业数 |
作业跟踪查询 CPU | 运行 Jobtracker 服务的节点的 CPU 使用率 |
正在运行的 Map 任务 | 在系统中执行的 Map 任务数 |
正在等待的 Map 任务 | 正在等待执行的 Map 任务数 |
最大磁盘空间(按节点) | 大部分磁盘空间已使用的节点上的已用磁盘空间量 |
名称节点 CPU | 运行 Namenode 服务的节点的节点 CPU 使用率 |
名称节点堆 | namenode JVM 中已用堆空间的百分比 |
节点 CPU 偏斜 | 最忙节点与平均忙节点上 CPU 使用率的比较 |
节点 I/O 偏斜 | 最忙节点与平均忙节点上 I/O 使用率的比较 |
正在运行的 Reduce 任务 | 在系统中执行的 Reduce 任务数 |
正在等待的 Reduce 任务 | 正在等待执行的 Reduce 任务数 |
RPC 延迟 JT | Jobtracker 服务调用在队列中的平均等待时间 |
RPC 延迟 NN | Namenode 服务调用在队列中的平均等待时间 |
总空间 | 已用空间占总存储容量的百分比 |