<menuitem id="4do4h"></menuitem>

<sup id="4do4h"><code id="4do4h"></code></sup>

<rt id="4do4h"><label id="4do4h"></label></rt><rp id="4do4h"><code id="4do4h"></code></rp>

<button id="4do4h"><samp id="4do4h"></samp></button>

<ul id="4do4h"><tt id="4do4h"></tt></ul>

西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站！

軟件教程 | 最新更新 | 下載排行 | 軟件分類 | 軟件專題

搜索

西西首頁(yè) 電腦軟件安卓軟件電腦游戲安卓游戲排行榜專題合集

您的位置：首頁(yè) → 編程&書集 → 源碼相關(guān) → python爬取138看書網(wǎng)小說(shuō)源碼

軟件: 軟件文章

軟件介紹
軟件截圖
相關(guān)軟件
其他版本
用戶評(píng)論
下載地址

python爬取138看書網(wǎng)小說(shuō)源碼

軟件大小:1KB
更新時(shí)間:2020-09-21 07:48
軟件語(yǔ)言:中文
軟件廠商:
軟件類別:國(guó)產(chǎn)軟件 / 免費(fèi)軟件 / 源碼相關(guān)
軟件等級(jí):
應(yīng)用平臺(tái):WinXP, Win7, win8
官方網(wǎng)站:暫無(wú)
應(yīng)用備案:

本地下載文件大小:1KB

相關(guān)軟件

Python編程神器5.2官方版
/中文/
python小游戲dist電腦版
/中文/
Python照片壓縮
/中文/
Python 3d游戲v1.0
/中文/
python翻譯
/中文/
python數(shù)獨(dú)小游戲(pygame windows)電腦版
/中文/
Python 3v3.0.1手機(jī)版
/中文/
Python學(xué)習(xí)手冊(cè)清爽版v1.3安卓版
/中文/
python庫(kù)插件(Microsoft IronPython)v2.7.9.1000最新官方版
/中文/
Python腳本編輯器(Thonny)v3.2.7官方版
/中文/

頂好評(píng):50%

踩壞評(píng):50%

報(bào)錯(cuò)

請(qǐng)簡(jiǎn)要描述您遇到的錯(cuò)誤，我們將盡快予以修正。

轉(zhuǎn)帖到論壇

輪壇轉(zhuǎn)帖HTML方式

輪壇轉(zhuǎn)帖UBB方式

本類軟件分類

本類精品

易語(yǔ)言殺進(jìn)程源碼
887KB/中文/5.2

本類下載排行

裝機(jī)必備軟件

QQ2024聊天工具
網(wǎng)易音樂(lè) 視頻播放
360安全衛(wèi)士安全軟件
迅雷11 下載工具
驅(qū)動(dòng)精靈硬件驅(qū)動(dòng)
釘釘 辦公聊天

軟件介紹

python爬取138看書網(wǎng)小說(shuō)源碼，來(lái)自論壇大神原創(chuàng)制作的一個(gè)爬取源碼，可以幫您爬取138小說(shuō)網(wǎng)的小說(shuō)資源，支持分類搜索查找功能，支持目錄爬取，自帶書簽系統(tǒng)，讓您看小說(shuō)更加輕松。本次帶來(lái)python爬取138看書網(wǎng)小說(shuō)源碼資源下載，需要看小說(shuō)的朋友們不妨試試吧！

python爬取138看書網(wǎng)小說(shuō)源碼

python爬取138看書網(wǎng)小說(shuō)源碼作者說(shuō)明

記錄一下今天爬的第二個(gè)小說(shuō)網(wǎng)，第二次弄起來(lái)比較熟練了，不像第一次弄一半就得找教程邊看邊搞。

但實(shí)際上爬小說(shuō)應(yīng)該是最簡(jiǎn)單的事情了吧，涉及的技術(shù)也沒(méi)有那么深。

把代碼發(fā)出來(lái)讓想剛?cè)腴T卻不知道從何下手的同萌新們看看吧，看教程總是云里霧里的，還是還得上手多練練才能加深印象。

這個(gè)小說(shuō)爬蟲還是有點(diǎn)垃圾，多線程沒(méi)有，而且有些函數(shù)也是用的跟*一樣，這玩意該怎么改進(jìn)也沒(méi)有頭緒。

python爬取138看書網(wǎng)小說(shuō)源碼演示一覽

import requests

import lxml

import re

headers = {

'user-agent': 'User-AgentMozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'

}

print ('本腳本僅適用于138看書網(wǎng)：https://www.13800100.com/')

#url_list = 'https://www.13800100.com/list/72262/'

url_list = (input('粘貼小說(shuō)目錄url，必須是小說(shuō)目錄，小說(shuō)首頁(yè)不支持\n'))

downurl = 'https://www.13800100.com/article/'

url_list = requests.get(url_list)

text_list = url_list.text

#爬小說(shuō)書名

text_title = re.findall(r'<div class="cate-tit">(.*?)</h2>',text_list,re.S)[0]

text_title = text_title.replace('\r\n','')

text_title = text_title.replace('<h2>','')

text_title = text_title.replace(' ','')

#爬小說(shuō)目錄列表

text_list_info = re.findall(r'<div class="bd">.*?</div>',text_list,re.S)[0]

text_list_info = re.findall(r'<a href="/article/(.*?)" class="name">(.*?)</a>',text_list)

for i in text_list_info:

#每章小說(shuō)的url和每章章名

list = i[0]

name = i[1]

download = downurl + list

download_info = requests.get(url = download,headers=headers)

html=download_info.text

html_info = re.findall(r'<div class=".*?">(.*?)</div>',html,re.S)[0]

html_info = html_info.replace (' 　　','')

html_info = html_info.replace ('<br/>',('\n'))

html_info = html_info.replace ('　　','')

print (name)

#輸出為記事本

with open ('%s.txt' % text_title,'a+',encoding = 'utf-8')as f:

f.write(' '+ name + '\n')

f.write('\n')

f.write(html_info + '\n')

f.write('\n')

print ('下載完成')

軟件標(biāo)簽: python 小說(shuō) 源碼

腳本要求輸入的url必須是小說(shuō)的目錄，而不是小說(shuō)的首頁(yè)

軟件截圖

python爬取138看書網(wǎng)小說(shuō)源碼

上一張下一張(1 / 1)

安裝詳細(xì)截圖

其他版本下載

下載地址

python爬取138看書網(wǎng)小說(shuō)源碼

本類最新軟件

本類軟件推薦

PHP和MySQL Web開發(fā)第4版源代碼

SSH框架整合小案例

51單片機(jī)150個(gè)例程

PHP操作excel類(PHPExcel)1.7.7

逐夢(mèng)旅程：Windows游戲編程之從零開始配套源代碼

HTML 5開發(fā)精要與實(shí)例詳解配套源碼

HTML-CSS-JavaScript標(biāo)準(zhǔn)教程實(shí)例版

c語(yǔ)言經(jīng)典編程900例

C# 教務(wù)管理系統(tǒng)源碼

易語(yǔ)言殺進(jìn)程源碼

C++Builder學(xué)習(xí)大全中文版

最新評(píng)論查看所有(0)條評(píng)論 >

TOP

軟件下載

聯(lián)系我們 | 發(fā)展歷程 | 版權(quán)聲明 | 下載幫助(？) | 廣告服務(wù) | 軟件提交 | 意見反饋

聲明：西西軟件園為非贏利性網(wǎng)站不接受任何贊助和廣告

<sup id="t49sw"><ol id="t49sw"></ol></sup>

<li id="t49sw"><small id="t49sw"></small></li><ul id="t49sw"><kbd id="t49sw"><strong id="t49sw"></strong></kbd></ul>