A.RDD(Resilient distributed dataset)叫做彈性分布式數(shù)據(jù)集,是spark中最基本的數(shù)據(jù)抽象
B.Resilient:表示彈性的,彈性表示
C.Destributed:分布式,可以并行在集群計算
D.Dataset:就是一個集合,用于存放數(shù)據(jù)的
您可能感興趣的試卷
你可能感興趣的試題
A.mapPartitions
B.lookup
C.mapPartitionsWithIndex
D.count
A.寬依賴
B.窄依賴
C.分區(qū)關(guān)系
D.繼承關(guān)系
A."Hello"(0),"Hello"(5)
B."Hello".take(1),"Hello".reverse(0)
C."Hello"(1),"Hello"(5)
D."Hello".take(0), "Hello".takeRight(1)
A.import scala.math._
B.import sqrt
C.import math._
D.import math.sqrt
A.1
B.2
C.3
D.4
最新試題
scala的函數(shù)參數(shù)的求值策略有哪些。()
執(zhí)行Spark任務:兩個工具()。
下列代碼的運行結(jié)果是()。
Linux crontab中* * * * * /usr/local/run.sh這句話5個*號分別代表什么?()
spark中的寬窄依賴描述正確的()。
scala中在REPL命令行運行以下操作:下列選項正確的是()。
配置Hadoop時,修改namenode進程所在節(jié)點的配置包含在哪一個配置文件中()。
如果我們現(xiàn)有一個安裝2.6.5版本的hadoop集群,在不修改默認配置的情況下存儲200個每個200M的文本文件,請問最終會在集群中產(chǎn)生多少個數(shù)據(jù)塊(包括副本)?()
關(guān)于Java中傳遞參數(shù)的說法,哪個是錯誤的?()
下列哪種類型的文件不是HDFS集群的元數(shù)據(jù)存儲格式?()