您可能感興趣的試卷
你可能感興趣的試題
A.客戶端緩存有集群的拓?fù)湫畔?br />
B.服務(wù)端緩存有集群的拓?fù)湫畔?br />
C.兩者都是
D.兩者都不是
在Spark中,假設(shè)lines是一個(gè)DStream對(duì)象,filter語句可以過濾掉80%的數(shù)據(jù),針對(duì)以下兩個(gè)語句說法正確的是:()
X:lines.filter(...).groupByKey(...)
Y:lines.groupByKey(...).filter(...)
A.X比Y的性能更高
B.X比Y的性能更低
C.X和Y和性能一樣
D.無法確性X和丫的性能差異
A.分桶表,按照天分桶
B.分區(qū)表,按天分區(qū)
C.傾斜表,傾斜字段選擇日期,傾斜值隨機(jī)
D.分區(qū)+分桶表,按照時(shí)間分區(qū),每個(gè)分區(qū)2560個(gè)桶
最新試題
Fusionlnsight HD中,一個(gè)部署在Tomcat上的應(yīng)用,需訪問HBase服務(wù),這種場(chǎng)景下推薦使用機(jī)機(jī)賬號(hào)。()
對(duì)于HBase rowkey的設(shè)計(jì)原則,如下敘述正確的是?()
在Spark應(yīng)用開發(fā)中,以下哪項(xiàng)的代碼能正確進(jìn)行單詞統(tǒng)計(jì)?()
用戶要開發(fā)一個(gè)應(yīng)用去訪問HBase服務(wù),先申請(qǐng)了一個(gè)機(jī)機(jī)賬號(hào)teste1,并給它設(shè)置訪問HBase服務(wù)的權(quán)限:然后下載該賬戶的keytab文件,并使用該賬號(hào)運(yùn)行應(yīng)用。后續(xù)此應(yīng)用增加業(yè)務(wù)需求,需訪問Hive服務(wù),那么在給tested用戶補(bǔ)充授予了訪問Hive組件權(quán)限后,需重新下載該用戶的keytab文件。()
在MapReduce應(yīng)用程序開發(fā)中,setMapOutputCompressorClass類的作用是什么?()
Flume寫入HDFS時(shí),文件的生成當(dāng)時(shí)有哪些?()
FusionLnsigh HD,Oozie支持HDFS Action。()
FusionLnsigt HD用戶想通過HBase shell操作來查詢某個(gè)HBase表中的內(nèi)容,這中場(chǎng)景下推薦管理員給這個(gè)用戶分配一個(gè)機(jī)機(jī)賬號(hào)。()
存在如下業(yè)務(wù)場(chǎng)景:用戶上網(wǎng)日志文件已經(jīng)存放在HDFS上,日志文件內(nèi)容格式是:每條上網(wǎng)記錄三個(gè)字段,分別是姓名,性別,上網(wǎng)時(shí)間,字段之間用“,”護(hù)分隔;要求打印輸出所有上網(wǎng)總時(shí)間大于兩小時(shí)的女性網(wǎng)友。請(qǐng)問如下哪些代碼片段能實(shí)現(xiàn)上述業(yè)務(wù)場(chǎng)景?()
Spark Streaming可以從Kafka接收數(shù)據(jù)并進(jìn)行計(jì)算,計(jì)算結(jié)果只能存入HDFS,不能再寫回Kafka。()