存在如下業(yè)務(wù)場景:用戶上網(wǎng)日志文件已經(jīng)存放在HDFS上,日志文件內(nèi)容格式是:每條上網(wǎng)記錄三個字段,分別是姓名,性別,上網(wǎng)時間,字段之間用“,”護(hù)分隔;要求打印輸出所有上網(wǎng)總時間大于兩小時的女性網(wǎng)友。請問如下哪些代碼片段能實現(xiàn)上述業(yè)務(wù)場景?()
A.A
B.B
C.C
D.D
您可能感興趣的試卷
你可能感興趣的試題
A.Producer負(fù)責(zé)生產(chǎn)數(shù)據(jù),Consumer負(fù)責(zé)消費(fèi)數(shù)據(jù),Producer和Consumer之間需要建立Socket鏈接
B.Producer既可以發(fā)送數(shù)據(jù)到Broker上,又可以發(fā)送數(shù)據(jù)到Consumer上
C.Producer作為消息生產(chǎn)者,可以直接將數(shù)據(jù)寫入Zookeeper
D.Producer連接任意一個正常的Broker實例就可以生產(chǎn)數(shù)據(jù)
A.必須對查詢字段進(jìn)行排序
B.必須對uniqueKey字段進(jìn)行排序
C.第一次查詢請求時,需指定查詢參數(shù),操作方法如下,solrQuery.set(CursorMarkParams.CURSOR_MARK_PARAMCursorMarkParams.CURSOR_MARK_START)
D.查詢時,請求中不能帶有start參數(shù),Solr的返回結(jié)果中會有nextCursorMark,在下次調(diào)動使用這個值為oursorMark
A.valcounts=textFile.map(line=>line.split(“”)).map(-rd=>(word,1)).reduceByKey(_+_)
B.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).reduceByKey(_+_)
C.valcounts=textFile.map(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
D.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
最新試題
在Spark中,關(guān)于廣播變量以下說法正確的是?()
存在如下業(yè)務(wù)場景:用戶上網(wǎng)日志文件已經(jīng)存放在HDFS上,日志文件內(nèi)容格式是:每條上網(wǎng)記錄三個字段,分別是姓名,性別,上網(wǎng)時間,字段之間用“,”護(hù)分隔;要求打印輸出所有上網(wǎng)總時間大于兩小時的女性網(wǎng)友。請問如下哪些代碼片段能實現(xiàn)上述業(yè)務(wù)場景?()
用戶要開發(fā)一個應(yīng)用去訪問HBase服務(wù),先申請了一個機(jī)機(jī)賬號teste1,并給它設(shè)置訪問HBase服務(wù)的權(quán)限:然后下載該賬戶的keytab文件,并使用該賬號運(yùn)行應(yīng)用。后續(xù)此應(yīng)用增加業(yè)務(wù)需求,需訪問Hive服務(wù),那么在給tested用戶補(bǔ)充授予了訪問Hive組件權(quán)限后,需重新下載該用戶的keytab文件。()
關(guān)于Fusionlnsight HD的Spark,以下哪些編程語言可以用來開發(fā)Spark應(yīng)用?()
關(guān)于Kafka的特點如下᧿述正確的是?()
Oozie的workflow.xml文件是工作流配置文件。()
Fusionlnsight HD中,屬于Streaming的數(shù)據(jù)分發(fā)方式有哪些?()
在Solr的應(yīng)用查詢場景中,當(dāng)對查詢結(jié)果深度翻頁時,需使用游標(biāo)進(jìn)行深度翻頁。下面對游標(biāo)說法正確的是?()
Fusionlnsight HD中,Streaming的特點?()
Fusionlnsight HD中,關(guān)于Hive的數(shù)據(jù)加載功能(通過Hivede LOAD命令導(dǎo)入數(shù)據(jù)),以下敘述錯誤的是?()