Spark SQL 表中,经常会存在很多小文件(大小远小于 HDFS 块大小),在这种情況下,Spark 会启动更多的 Task
来处理这些小文件,当 SQL 逻辑中存在 Shuffle 操作时,会大大增加 hash 分桶数从而严重影响性能。

欢迎免费使用小程序搜题/刷题/查看解析,提升学历,成考自考报名,论文代写、论文查重请加客服微信skr-web

Spark SQL 表中,经常会存在很多小文件(大小远小于 HDFS 块大小),在这种情況下,Spark 会启动更多的 Task
来处理这些小文件,当 SQL 逻辑中存在 Shuffle 操作时,会大大增加 hash 分桶数从而严重影响性能。

A.正确
B.错误
正确答案B
访客
邮箱
网址

通用的占位符缩略图

人工智能机器人,扫码免费帮你完成工作


  • 自动写文案
  • 自动写小说
  • 马上扫码让Ai帮你完成工作
通用的占位符缩略图

人工智能机器人,扫码免费帮你完成工作

  • 自动写论文
  • 自动写软件
  • 我不是人,但是我比人更聪明,我是强大的Ai
Top