2.09 - Hive 连接器限制 - Teradata QueryGrid

Teradata® QueryGrid™ 安装和用户指南

prodname
Teradata QueryGrid
vrm_release
2.09
created_date
2019 年 5 月
category
安装
用户指南
管理
配置
featnum
B035-5991-059K-CHS
以下限制会影响 Hive 连接器在 Teradata QueryGrid 中的使用:
  • 外部函数执行
  • 不支持系统之间的事务语义。

    在数据已导出并提交到远程系统后,本地系统上的任何后续错误或中止不会回滚远程请求。

  • 以下 Hive 推测属性不受支持,缺省情况下处于禁用状态,除非支持 Hive 任务重试参数设置为 True。
    • mapreduce.map.speculative=false
    • mapreduce.reduce.speculative=false
    • tez.am.speculation.enabled=false
  • 使用 Hive 发起程序时:
    • 仅在 HDP 3.0.1 或更高版本上支持 Hive-on-Tez(Hive 执行引擎属性 = Tez) 的导出。
    • 不支持 Hive-on-Spark(Hive 执行引擎属性 = Spark)的导出。
    • 目标服务器返回所有列,发起程序服务器处理所有列投影。
    • 使用 Explain 命令时,目标服务器不返回查询和计划数据。
    • 使用 Count 命令时,目标服务器返回所有列。然后,这些列聚合在发起程序服务器上。
    • 无法使用诸如 insert into 1st-non-native-table select from 2nd-non-native-table 等子查询。
  • 缺省情况下,无论在成功的导出查询期间导出了多少行,Hive 目标连接器都会返回 1 作为导出的行数。将收集近似活动计数连接器属性设置为 True 将返回导出的行数,但有以下限制:
    • 如果 Hive 表统计信息不准确(这种情况并不常见),则启用此属性可能会导致插入查询的性能开销。
    • 如果 Hive 表上存在并发插入,可能会导致显示的行数不准确,从而获得近似结果,而不是精确数字。
  • 如果升级了 Hive 或更改了标准 Hive JAR 的位置,则需要重新启动 tdqg-node。
  • 时间戳精度的缺省值为九 (9);使用 Hive 到 Teradata 链接时,Teradata QueryGrid 会截断小数位数超过六位的数据。
  • 如果远程系统时区与发起程序系统时区不同,则 WHERE 子句中使用的日期文本不会转换为远程系统时区。
  • 连接器不支持 UTF-16 补充字符。表数据中的补充字符可能会导致数据截断。
  • 如果表字符集不是 Latin 或 UTF-16,则不支持对 Hive 表的 VARCHAR、STRING 和 CHAR 列执行 IMPORT。