單項(xiàng)選擇題在Spark中,假設(shè)lines是一個(gè)DStream對(duì)象,以下哪個(gè)語句可以周期統(tǒng)計(jì)這個(gè)流上的單詞數(shù)?()

A.lines.flatMap(_.split”””)).map(word=>(word,1)).reduce(_+_).print()
B.lines.flatMap(_.split”””)).map(word=>(word,word.length())).reduceByKey(_+_).print()
C.lines.flatMap(_.split”””)).map(word=>(word,1)).reduceByKey(_+_).print()
D.lines.flatMap(_.split”””)).flatMap(word=>(word,1)).groupByKey(_+_).print()


您可能感興趣的試卷

你可能感興趣的試題

2.多項(xiàng)選擇題Spark應(yīng)用程序有哪幾種參數(shù)設(shè)置方法?()

A.在應(yīng)用的配置文件Spark-defaults.conf中進(jìn)行配置
B.在提交應(yīng)用時(shí),通過--conf 進(jìn)行設(shè)置
C.在應(yīng)用的代碼里面,通過SparkContext的setProperty方法進(jìn)行設(shè)置
D.在應(yīng)用的代碼里面,通過SparkerConf對(duì)象進(jìn)行設(shè)置

3.單項(xiàng)選擇題在FusionInsight HD產(chǎn)品中,Kafka服務(wù)的角色名稱是?()

A.Producer
B.Broker
C.Consumer
D.ZooKeeper

4.多項(xiàng)選擇題FusionInsight HD中,關(guān)于Hive UDF二次開發(fā),如下敘述正確的是?()

A.用戶自定義的UDF在被使用之前,需要先在Hive系統(tǒng)中創(chuàng)建UD只
B.用戶自定義的UDF,不允許加入?yún)R總和狀態(tài)等信息
C.用戶自定義的UDF,可以根據(jù)實(shí)際情況添加deterministic和statefull
D.安全集群下,用戶自定義的UDF,建議在每次使用前都創(chuàng)建一次