多項選擇題關(guān)于聚焦爬蟲的工作原理,下列描述正確的是()

A.根據(jù)一定的搜索策略,從URL 隊列中選擇下一步要抓取的網(wǎng)頁URL
B.我們需要根據(jù)爬取需求定義聚焦爬蟲的爬取目標,并進行相關(guān)的描述
C.聚焦爬蟲會根據(jù)一定的網(wǎng)頁分析算法過濾與主題無關(guān)的鏈接,保留有用的鏈接
D.有用的鏈接會放入等待抓取的URL 隊列


您可能感興趣的試卷

你可能感興趣的試題

2.單項選擇題用于robots.txt 文件中,標記不允許的是()

A.disallow
B.User-agent
C.allow

3.單項選擇題下列選項中,被稱為主題網(wǎng)絡(luò)爬蟲的是()

A.聚焦網(wǎng)絡(luò)爬蟲
B.深層網(wǎng)絡(luò)爬蟲
C.通用網(wǎng)絡(luò)爬蟲
D.增量式網(wǎng)絡(luò)爬蟲

4.單項選擇題下列數(shù)據(jù)中,能夠被網(wǎng)絡(luò)爬蟲抓取的是()

A.互聯(lián)網(wǎng)非公開信息
B.網(wǎng)站后臺信息
C.互聯(lián)網(wǎng)公開的且可訪問到的信息
D.用戶的注冊信息