亚洲伊人久久大香线蕉AV,91国偷自产一区二区三区蜜臀

軟件介紹

WebHarvy網(wǎng)頁采集大師漢化版是一個國外采集工具，網(wǎng)站首發(fā)漢化版本，本程序已經(jīng)漢化了90%，對有限制的網(wǎng)頁進(jìn)行編輯的軟件非常易于使用且功能強大的應(yīng)用,可以從網(wǎng)頁自動抽取數(shù)據(jù)(文本,URL和圖像)并且以不同的格式保存提取內(nèi)容。

應(yīng)用說明

WebHarvy是一個方便的應(yīng)用程序旨在使您能夠自動從網(wǎng)頁中提取數(shù)據(jù)并保存提取的內(nèi)容在不同的格式。 WebHarvy,捕獲數(shù)據(jù)從web頁面一樣容易導(dǎo)航到頁面包含數(shù)據(jù)和點擊數(shù)據(jù)捕獲。WebHarvy會智能地識別數(shù)據(jù)模式發(fā)生在web頁面。使用WebHarvy,您可以提取數(shù)據(jù),如產(chǎn)品目錄或搜索結(jié)果從不同的網(wǎng)站,在不同的類別,如房地產(chǎn)、電子商務(wù)、學(xué)術(shù)研究、娛樂、技術(shù)等。從網(wǎng)頁中提取的數(shù)據(jù)可以保存在不同的格式。通常web頁面顯示數(shù)據(jù),如在多個頁面的搜索結(jié)果。 WebHarvy可以自動爬行和提取數(shù)據(jù)從多個頁面。

軟件特點

WebHarvy可以讓您分析網(wǎng)頁上的數(shù)據(jù)

可以顯示從一個HTML地址上分析連接數(shù)據(jù)

可以延伸到下一個網(wǎng)頁頁面

可以指定搜索數(shù)據(jù)的范圍以及內(nèi)容

可以將掃描的圖片下載保存

支持在瀏覽器上復(fù)制鏈接搜索

支持配置對應(yīng)資源項目搜索

可以使用項目名稱以及資源名稱查找

功能特點

視覺點和點擊界面

WebHarvy是一個可視化的網(wǎng)頁提取工具。其實完全沒有必要編寫任何腳本或代碼用來提取數(shù)據(jù)。使用WebHarvy的內(nèi)置瀏覽器瀏覽網(wǎng)頁。您可以選擇用鼠標(biāo)點擊來提取數(shù)據(jù)。它是那么容易！

智能識別模式

自動識別網(wǎng)頁中出現(xiàn)的數(shù)據(jù)模式。所以，如果你需要從一個網(wǎng)頁刮項目（姓名，地址，電子郵件，價格等）的列表，你不需要做任何額外的配置。如果數(shù)據(jù)重復(fù)，WebHarvy會自動刮。

導(dǎo)出捕獲的數(shù)據(jù)

可以保存從各種格式的網(wǎng)頁中提取的數(shù)據(jù)。 WebHarvy網(wǎng)站刮板的當(dāng)前版本允許你導(dǎo)出的刮數(shù)據(jù)作為XML，CSV，JSON或TSV文件。您還可以刮下數(shù)據(jù)導(dǎo)出到一個SQL數(shù)據(jù)庫。

從多個頁面提取

通常網(wǎng)頁顯示數(shù)據(jù)，如在多個頁面中的產(chǎn)品目錄。 WebHarvy可以自動抓取并從多個網(wǎng)頁中提取數(shù)據(jù)。只是指出了“鏈接到下一頁'和WebHarvy網(wǎng)站刮板將自動刮從所有頁面的數(shù)據(jù)。

基于關(guān)鍵字的提取

基于關(guān)鍵字的提取可讓您捕捉從搜索結(jié)果頁面輸入關(guān)鍵字的列表數(shù)據(jù)。您創(chuàng)建的配置將被自動重復(fù)所有給定輸入關(guān)鍵字，而挖掘的數(shù)據(jù)�？梢灾付ㄈ我鈹�(shù)量的輸入關(guān)鍵字

通過代{過}{濾}理服務(wù)器提取

提取匿名和防止提取網(wǎng)絡(luò)軟件被封鎖的Web服務(wù)器，您必須通過代{過}{濾}理服務(wù)器訪問目標(biāo)網(wǎng)站的選項�？梢允褂靡粋€單一的代{過}{濾}理服務(wù)器地址或代{過}{濾}理服務(wù)器的地址列表。

提取分類

WebHarvy網(wǎng)站刮板允許您從一個鏈接列表，從而導(dǎo)致一個網(wǎng)站內(nèi)的相似頁面抽取數(shù)據(jù)。這使您可以使用一個單一的配置刮網(wǎng)站內(nèi)的類別或小節(jié)。

使用正則表達(dá)式提取

WebHarvy可以應(yīng)用正則表達(dá)式（正則表達(dá)式）在文本或網(wǎng)頁的HTML源代碼，并提取去匹配的部分。這種強大的技術(shù)為您提供了更多的靈活性，同時拼搶的數(shù)據(jù)。