欧美午夜免费观看福利片,五月天婷综合交清中文字幕,亚欧视频二区,成熟自由性生活视频免费,91av视频在线,久操视频网

您的位置:首 頁(yè) > 新聞中心 > 公司網(wǎng)站制作 > 公司網(wǎng)站制作爬蟲“黑洞”

公司網(wǎng)站制作

公司網(wǎng)站制作爬蟲“黑洞”

發(fā)布:2020-10-21 12:00:31 瀏覽:3628

       爬蟲“黑洞”。爬蟲在搜集藏文網(wǎng)頁(yè)的過(guò)程中, 必須考慮可能出現(xiàn)的“黑洞”情況。

       爬蟲黑洞是指, 在抓取一張網(wǎng)頁(yè)的鏈接時(shí), 鏈接本身是一個(gè)無(wú)限循環(huán), 導(dǎo)致爬蟲抓取時(shí)跟著循環(huán), 浪費(fèi)資源。有時(shí)一些URL看起來(lái)不同, 但實(shí)際指向同一張網(wǎng)頁(yè), 也會(huì)使爬蟲陷入重復(fù)抓取的境地。

       為了避免爬蟲誤入黑洞, 一般采取兩種策略。一是爬蟲回避動(dòng)態(tài)網(wǎng)頁(yè), 因?yàn)閯?dòng)態(tài)網(wǎng)頁(yè)常常會(huì)把爬蟲帶入黑洞。識(shí)別動(dòng)態(tài)網(wǎng)頁(yè)時(shí), 只需要判斷URL中是否出現(xiàn)問(wèn)題, 含問(wèn)號(hào)的就是動(dòng)態(tài)網(wǎng)頁(yè)。二是使用Visited表記錄已經(jīng)訪問(wèn)過(guò)的URL, 凡是遇到新的URL存在于Visited表, 就放棄對(duì)該URL的繼續(xù)處理。例如:當(dāng)遇到a→b→c→d→c→e這樣的環(huán)路鏈接, 爬蟲就會(huì)掉進(jìn)去, 反復(fù)抓取c、d對(duì)應(yīng)的頁(yè)面。使用Visited表, 就能避免這個(gè)問(wèn)題。

>>> 查看《公司網(wǎng)站制作爬蟲“黑洞”》更多相關(guān)資訊 <<<

本文地址:http://scmenchuang.cn/news/html/21003.html

趕快點(diǎn)擊我,讓我來(lái)幫您!
聂荣县| 望奎县| 隆化县| 泽州县| 淅川县| 都安| 鸡泽县| 体育| 泾阳县| 千阳县| 剑河县| 武隆县| 阳新县| 集安市| 延安市| 桑植县| 沙坪坝区| 区。| 宾阳县| 嘉善县| 定西市| 南平市| 涟源市| 六枝特区| 忻州市| 呼伦贝尔市| 东兰县| 洪湖市| 加查县| 区。| 油尖旺区| 蕉岭县| 临武县| 呼和浩特市| 博爱县| 大城县|