系统指标(CDH、HDP 2.1 及更高版本和 HDP 1.3)
下表中列出的系统指标可用于分析资源使用情况。
指标 | 说明 | 类型 |
---|---|---|
CPU 空闲 | 未处理任何命令且系统中不存在未完成磁盘 I/O 请求的 CPU 时间 | 百分比 |
CPU 正常 | 优先级正常且以用户级别执行所用的 CPU 时间 | 百分比 |
CPU 偏斜 | 最忙节点与平均忙节点上 CPU 使用率的比较 | 百分比 |
CPU 系统 | 运行内核代码所用的 CPU 时间 | 百分比 |
CPU 使用情况 | 平均节点 CPU 使用。CPU 计算为用户 CPU 和系统 CPU 使用百分比的总和。 | 百分比 |
CPU 用户 | 运行非内核代码所用的 CPU 时间 | 百分比 |
CPU 等待 IO | 用于等待 IO 的 CPU 时间 | 百分比 |
磁盘偏斜 | 占用最多空间的节点与占用平均空间的节点上磁盘空间的比较 | 百分比 |
磁盘使用 | 系统上正在使用的磁盘空间 | 百分比 |
过去 15 分钟的平均负载 | 最后 15 分钟作业队列中的平均作业数 | 数字 |
过去 5 分钟的平均负载 | 最后 5 分钟作业队列中的平均作业数 | 数字 |
过去一分钟的平均负载 | 最后一分钟作业队列中的平均作业数 | 数字 |
内存使用情况 | 抽样期间系统的平均内存使用 | 百分比 |
网络输入 | 节点传入网络流量速率(字节/秒) | 数字 |
网络输出 | 节点传出网络流量速率(字节/秒) | 数字 |
HDFS 指标(CDH、HDP 2.1 及更高版本和 HDP 1.3)
下表中列出的 HDFS 指标可用于分析资源使用情况。
指标 | 说明 | 类型 |
---|---|---|
损坏的块 | 副本已全部损坏的块 | 数字 |
过剩的块 | 超出所属文件的目标复制的块 | 数字 |
缺少的块 | 在集群内的任何位置均无副本的块 | 数字 |
等待删除的块 | 正在等待删除的块 | 数字 |
等待复制的块 | 正在等待复制的块 | 数字 |
计划进行复制的块 | 计划进行复制的块 | 数字 |
副本过少的块 | 未满足其所属文件的目标复制的块 | 数字 |
Datanode I/O | Datanode 上的磁盘使用率 | 数字 |
已用磁盘容量 | HDFS 当前使用的磁盘空间的字节数 | 数字 |
磁盘使用率 | HDFS 使用的可用磁盘空间 | 百分比 |
文件 + 目录 | HDFS 中的文件和目录总数 | 数字 |
附加的文件 | 附加的文件 | 数字 |
创建的文件 | 创建的文件 | 数字 |
删除的文件 | 删除的文件 | 数字 |
总负载 | HDFS 连接 | 数字 |
YARN 指标(CDH 和 HDP 2.1 及更高版本)
下表中列出的 YARN 指标可用于分析资源使用情况。
指标 | 说明 | 类型 |
---|---|---|
完成的应用程序 | 间隔期间完成的 YARN 应用程序 | 数字 |
失败的应用程序 | 间隔期间失败的 YARN 应用程序 | 数字 |
正在运行的应用程序 | 间隔期间运行的 YARN 应用程序平均数量 | 数字 |
已提交的应用程序 | 间隔期间提交的 YARN 应用程序 | 数字 |
分配的集群内存 | 标记为已分配的可用集群内存 | 百分比 |
保留的集群内存 | 标记为已保留的可用内存 | 百分比 |
集群内存偏斜 | 不同 NodeManager 实例间的集群内存偏斜 | 百分比 |
已分配的 YARN 容器 | 间隔期间分配/运行的 YARN 容器平均数量 | 数字 |
MapReduce 指标(HDP 1.3)
下表中列出的 MapReduce 指标可用于分析资源使用情况。
指标 | 说明 | 类型 |
---|---|---|
完成的作业 | 成功完成的作业 | 数字 |
失败的作业 | 完成前失败的作业 | 数字 |
正在运行的作业 | 当前在系统中执行的作业 | 数字 |
提交的作业 | 在系统中排队等待执行的作业 | 数字 |
完成的 Map 任务 | 成功完成的 Map 任务 | 数字 |
失败的 Map 任务 | 完成前失败的 Map 任务 | 数字 |
启动的 Map 任务 | 打开的 Map 任务 | 数字 |
正在运行的 Map 任务 | 当前在系统中执行的 Map 任务 | 数字 |
正在等待的 Map 任务 | 排队等待运行的 Map 任务 | 数字 |
完成的 Reduce 任务 | 成功完成的 Reduce 任务 | 数字 |
失败的 Reduce 任务 | 完成前失败的 Reduce 任务 | 数字 |
启动的 Reduce 任务 | 打开的 Reduce 任务 | 数字 |
正在运行的 Reduce 任务 | 正在运行的 Reduce 任务 | 数字 |
正在等待的 Reduce 任务 | 排队等待运行的 Reduce 任务 | 数字 |