17.10 - Teradata Hadoop 预警指标和属性 - Teradata Viewpoint - Teradata Workload Management

Teradata® Viewpoint 用户指南

Product
Teradata Viewpoint
Teradata Workload Management
Release Number
17.10
Release Date
2021 年 10 月
Content Type
用户指南
Publication ID
B035-2206-101K-CHS
Language
中文 (简体)
这些指标适用于 Teradata Hadoop 预警。通过关联的属性名称,您可以在预警设置组件中自定义预警操作,也可以在受监控系统组件中自定义消息。
除非特别说明,否则 HDP 2.1 及更高版本HDP 1.3 均有这些指标。

用于 HDFS 预警类型的指标

指标 说明 属性名称
损坏的块 副本已全部损坏的块数 corruptBlocks
过剩的块 超出所属文件的目标复制的块数 excessBlocks
缺少的块 在集群内的任何位置均无副本的块数 missingBlocks
等待删除的块 正在等待删除的块数 pendingDeletionBlocks
等待复制的块 正在等待复制的块数 pendingReplicationBlocks
计划进行复制的块 计划进行复制的块数 scheduledReplicationBlocks
副本过少的块 未满足其所属文件的目标复制的块数 underReplicatedBlocks
已用磁盘容量 HDFS 当前使用的磁盘空间的字节数 capacityUsed
磁盘使用率 HDFS 使用的可用磁盘空间所占百分比 hfdsDiskUsage
文件 + 目录 HDFS 中的文件和目录总数 filesTotal
总负载 HDFS 连接数 totalLoad

用于 YARN 预警类型的指标(HDP 2.1 及更高版本

指标 说明 属性名称
正在运行的应用程序 当前正在执行的 YARN 应用程序数 appsRunning
分配的集群内存 在所有 NodeManager 实例中分配的可用内存百分比 clusterMemUsed
分配的容器 当前分配的 YARN 容器数 allocatedContainers

用于 MapReduce 预警类型的指标(HDP 1.3

指标 说明 属性名称
正在运行的作业 系统上当前执行的作业数 jobsRunning
正在运行的 Map 任务 正在运行的 Map 任务数 runningMaps
正在等待的 Map 任务 排队等待运行的 Map 任务数 waitingMaps
正在运行的 Reduce 任务 正在运行的 Reduce 任务数 runningReduces
正在等待的 Reduce 任务 排队等待运行的 Reduce 任务数 waitingReduces

用于系统预警类型的指标

指标 说明 属性名称
CPU 空闲 未处理任何命令且系统中不存在未完成磁盘 I/O 请求的 CPU 时间百分比 cpuIdle
CPU 正常 优先级正常且以用户级别执行所用的 CPU 时间百分比 cpuNice
CPU 偏斜 最忙节点与平均忙节点上 CPU 使用率的比较 cpuSkew
CPU 系统 运行内核代码所用的 CPU 时间百分比 cpuSystem
CPU 使用情况 用于用户和系统的 CPU 使用率百分比之和。 cpuUse
CPU 用户 运行非内核代码所用的 CPU 时间百分比 cpuUser
CPU 等待 I/O 等待 I/O 所用的 CPU 时间百分比 cpuWio
磁盘偏斜 空间使用量最多的节点与空间使用量处于平均水平的节点上磁盘空间的比较 diskSkew
磁盘使用 系统上正在使用的磁盘空间百分比 diskUse
过去 15 分钟的平均负载 最后 15 分钟作业队列中的平均作业数 loadFifteen
过去 5 分钟的平均负载 最后 5 分钟作业队列中的平均作业数 loadFive
过去一分钟的平均负载 最后一分钟作业队列中的平均作业数 loadOne
内存使用情况 抽样期间系统的平均内存使用 memUse
网络输入 传入网络流量速率(字节/秒) bytesIn
网络输出 传出网络流量速率(字节/秒) bytesOut

用于系统运行状况预警类型的指标

指标 说明 属性名称
运行状况 系统运行状况的名称 health