欧美午夜免费观看福利片,五月天婷综合交清中文字幕,亚欧视频二区,成熟自由性生活视频免费,91av视频在线,久操视频网

您的位置:首 頁 > 新聞中心 > 資訊動態(tài) > 網(wǎng)頁采集

資訊動態(tài)

網(wǎng)頁采集

發(fā)布:2022-04-11 12:56:39 瀏覽:4647

       網(wǎng)頁采集。網(wǎng)頁采集作為政府網(wǎng)站網(wǎng)頁在線歸檔的首要環(huán)節(jié),就是利用相關(guān)工具,以既定的頻率和方式,及時選擇值得保存的政府網(wǎng)頁內(nèi)容。網(wǎng)頁采集的第一步是要確定采集對象,政府網(wǎng)頁歸檔保存的信息采集對象是域名中含有“gov.cn”的政府網(wǎng)站,為確保政府網(wǎng)頁的采集質(zhì)量,需要對目標網(wǎng)站進行評價,將那些信息規(guī)模大、原生性信息多、更新頻繁的政府網(wǎng)站選定為采集對象。在確定要采集的目標政府網(wǎng)站之后,還應(yīng)根據(jù)實際需求選擇相應(yīng)的采集方式。

       完整性采集和選擇性采集是目前比較常用的網(wǎng)絡(luò)資源采集方式,它們各有優(yōu)缺點,為了彌補其各自的不足,可以實現(xiàn)兩種采集方式的優(yōu)勢互補,采用融合二者優(yōu)點的混合型采集方式,在對選定的政府網(wǎng)站中所有網(wǎng)頁進行完整性采集的同時,通過人工干預(yù)的方式對網(wǎng)頁內(nèi)容進行甄別,對其中有證據(jù)價值、歷史價值、研究價值的重要網(wǎng)頁,有選擇性地進行深層次的頻繁采集,這樣既考慮到了政府網(wǎng)頁采集面的廣度,同時又照顧到了重要網(wǎng)頁采集的深度。

       而網(wǎng)頁的采集與捕獲最終還需要依靠相應(yīng)的網(wǎng)絡(luò)爬蟲工具來實現(xiàn),目前面向網(wǎng)頁存檔的爬蟲工具比較多,其中Heritrix、HTTrack最為常用,可利用這些工具來有針對性地完成對目標政府網(wǎng)站網(wǎng)頁的自動批量在線采集。

>>> 查看《網(wǎng)頁采集》更多相關(guān)資訊 <<<

本文地址:http://scmenchuang.cn/news/html/30389.html

趕快點擊我,讓我來幫您!
邛崃市| 贞丰县| 深圳市| 庆元县| 临澧县| 镇巴县| 黎川县| 六盘水市| 怀仁县| 嵊泗县| 明溪县| 游戏| 新竹县| 汨罗市| 萍乡市| 万宁市| 安泽县| 岳阳市|