在很多小文件场景下,Spark 会起很多 Task,当 SQL 逻辑中存在 Shuffle 操作时,会大大增加 hash 分桶数,严重影响<br class="markdown_return">性能。 Fusioninsighte 中,针对小文件的场景通常采用()算子,来对 Table 中的小文件生成的 partition 进行合并,减<br class="markdown_return">少 partition 数,从而避免在 shuffle 的时候,生成过多的 ash 分桶,提升性能?

在很多小文件场景下,Spark 会起很多 Task,当 SQL 逻辑中存在 Shuffle 操作时,会大大增加 hash 分桶数,严重影响
性能。 Fusioninsighte 中,针对小文件的场景通常采用()算子,来对 Table 中的小文件生成的 partition 进行合并,减
少 partition 数,从而避免在 shuffle 的时候,生成过多的 ash 分桶,提升性能?

分类： H13-711 V3.0 HCIA-Big Data 华为大数据真题题库
发表：2023年01月12日 18时01分22秒
作者： admin
阅读： (25)

欢迎免费使用小程序搜题/刷题/查看解析，提升学历，成考自考报名，论文代写、论文查重请加客服微信skr-web

在很多小文件场景下,Spark 会起很多 Task,当 SQL 逻辑中存在 Shuffle 操作时,会大大增加 hash 分桶数,严重影响
性能。 Fusioninsighte 中,针对小文件的场景通常采用()算子,来对 Table 中的小文件生成的 partition 进行合并,减
少 partition 数,从而避免在 shuffle 的时候,生成过多的 ash 分桶,提升性能?

A.group by
B.coalesce
C.connect
D.Join

正确答案D

× 提示：小程序已经收录此题，请在小程序查看名师解析。翰林刷小程序提供搜题，刷题，助你轻松通过考试

人工智能机器人，扫码免费帮你完成工作

自动写文案
自动写小说
马上扫码让Ai帮你完成工作

人工智能机器人，扫码免费帮你完成工作

自动写论文
自动写软件
我不是人，但是我比人更聪明，我是强大的Ai

Top