这些指标适用于 Teradata Hadoop 预警。通过关联的属性名称,您可以在
预警设置组件中自定义预警操作,也可以在
受监控系统组件中自定义消息。
除非特别说明,否则 HDP 2.1 及更高版本及 HDP 1.3 均有这些指标。
用于 HDFS 预警类型的指标
指标 |
说明 |
属性名称 |
损坏的块 |
副本已全部损坏的块数 |
corruptBlocks |
过剩的块 |
超出所属文件的目标复制的块数 |
excessBlocks |
缺少的块 |
在集群内的任何位置均无副本的块数 |
missingBlocks |
等待删除的块 |
正在等待删除的块数 |
pendingDeletionBlocks |
等待复制的块 |
正在等待复制的块数 |
pendingReplicationBlocks |
计划进行复制的块 |
计划进行复制的块数 |
scheduledReplicationBlocks |
副本过少的块 |
未满足其所属文件的目标复制的块数 |
underReplicatedBlocks |
已用磁盘容量 |
HDFS 当前使用的磁盘空间的字节数 |
capacityUsed |
磁盘使用率 |
HDFS 使用的可用磁盘空间所占百分比 |
hfdsDiskUsage |
文件 + 目录 |
HDFS 中的文件和目录总数 |
filesTotal |
总负载 |
HDFS 连接数 |
totalLoad |
用于 YARN 预警类型的指标(HDP 2.1 及更高版本)
指标 |
说明 |
属性名称 |
正在运行的应用程序 |
当前正在执行的 YARN 应用程序数 |
appsRunning |
分配的集群内存 |
在所有 NodeManager 实例中分配的可用内存百分比 |
clusterMemUsed |
分配的容器 |
当前分配的 YARN 容器数 |
allocatedContainers |
用于 MapReduce 预警类型的指标(HDP 1.3)
指标 |
说明 |
属性名称 |
正在运行的作业 |
系统上当前执行的作业数 |
jobsRunning |
正在运行的 Map 任务 |
正在运行的 Map 任务数 |
runningMaps |
正在等待的 Map 任务 |
排队等待运行的 Map 任务数 |
waitingMaps |
正在运行的 Reduce 任务 |
正在运行的 Reduce 任务数 |
runningReduces |
正在等待的 Reduce 任务 |
排队等待运行的 Reduce 任务数 |
waitingReduces |
用于系统预警类型的指标
指标 |
说明 |
属性名称 |
CPU 空闲 |
未处理任何命令且系统中不存在未完成磁盘 I/O 请求的 CPU 时间百分比 |
cpuIdle |
CPU 正常 |
优先级正常且以用户级别执行所用的 CPU 时间百分比 |
cpuNice |
CPU 偏斜 |
最忙节点与平均忙节点上 CPU 使用率的比较 |
cpuSkew |
CPU 系统 |
运行内核代码所用的 CPU 时间百分比 |
cpuSystem |
CPU 使用情况 |
用于用户和系统的 CPU 使用率百分比之和。 |
cpuUse |
CPU 用户 |
运行非内核代码所用的 CPU 时间百分比 |
cpuUser |
CPU 等待 I/O |
等待 I/O 所用的 CPU 时间百分比 |
cpuWio |
磁盘偏斜 |
空间使用量最多的节点与空间使用量处于平均水平的节点上磁盘空间的比较 |
diskSkew |
磁盘使用 |
系统上正在使用的磁盘空间百分比 |
diskUse |
过去 15 分钟的平均负载 |
最后 15 分钟作业队列中的平均作业数 |
loadFifteen |
过去 5 分钟的平均负载 |
最后 5 分钟作业队列中的平均作业数 |
loadFive |
过去一分钟的平均负载 |
最后一分钟作业队列中的平均作业数 |
loadOne |
内存使用情况 |
抽样期间系统的平均内存使用 |
memUse |
网络输入 |
传入网络流量速率(字节/秒) |
bytesIn |
网络输出 |
传出网络流量速率(字节/秒) |
bytesOut |
用于系统运行状况预警类型的指标
指标 |
说明 |
属性名称 |
运行状况 |
系统运行状况的名称 |
health |