爬山虎采集器是一款優(yōu)秀的網頁采集工具。軟件最大優(yōu)勢就是智能分析,可視化界面,無需學習編程,點擊式界面,自動生成采集腳本,可以采集互聯(lián)網99%的網站。有需要的小伙伴歡迎來西西下載體驗。
軟件特色:
適用各種網站
能夠采集互聯(lián)網99%的網站,包括單頁應用Ajax加載等等動態(tài)類型網站
一鍵提取數據
簡單易學,通過可視化界面,鼠標點擊即可抓取數據
快速高效
內置一套高速瀏覽器內核,加上HTTP引擎模式,實現(xiàn)快速采集數據
軟件功能:
獨創(chuàng)高速內核
自研的瀏覽器內核,速度飛快,遠超對手
智能識別
對于網頁中的列表、表單結構(多選框下拉列表等)能夠智能識別
向導模式
簡單易用,輕松通過鼠標點擊自動生成
腳本定時運行
可按照計劃定時運行,無需人工
廣告屏蔽
定制的廣告屏蔽模塊,兼容AdblockPlus語法,可添加自定義規(guī)則
多種數據導出
支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、網站等
使用方法:
第一步:輸入采集網址
打開軟件,新建任務,輸入需要采集的網站地址。
第二步:智能分析,全程自動化提取數據
進入到第二步后,爬山虎采集器全自動智能分析網頁,并且從中提取出列表數據。
第三步:導出數據到表格、數據庫、網站等
運行任務,將采集到的數據導出為Csv、Excel以及各種數據庫,支持api導出。
安裝說明:
打開爬山虎采集器下載頁http://m.elephantinaurance.com
點擊下載安裝程序。
下載完成后,直接運行安裝程序 PashanhuV2Setup.exe。
然后一直點擊下一步,直到完成。
安裝完成后,可以看到爬山虎采集器V2的主界面
更新日志:
優(yōu)化網頁表格數據的識別,可按照表格列名自動命名字段
優(yōu)化時間提取
修復當有自定義字段,沒有匹配到不保存數據的問題
添加時間戳變量
計劃任務,每間隔分鐘增加開始秒