看连载小说同志们的福利来了

huaerfan

浏览: 11768 次
性别:
来自: 北京

最近访客更多访客>>

fsfish

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

python

python 小说自动

最近迷上了看《那时汉朝》，在网上找手机电子书，无奈，塔读的收费，网页连载的倒是免费，但是不适合手机看，太麻烦，倒是可以吧连载的复制下来，整合成txt文档，放在手机里，看着方便，但是就拿《那时汉朝》来说，连载的就600多节，这要是复制粘贴肯定累死人了，为了方便，下面的这个程序变产生了.

程序功能：把连载的小说自动从网上下载到本地，生成txt文档

使用之前需要安装Python的环境，而且要分析写连载网站是否具有规则，没有规则是无法使用此程序的，呵呵，没那么智能

# -*- coding: UTF-8 -*-
import httplib
import re
import string
conn = httplib.HTTPConnection("网址")
conn.request("GET","/连载章节目录网页地址")
r1 = conn.getresponse()
p = re.compile(r"<a.*?</A>")
aList = p.findall(r1.read())
f = open("nashihanchao/那时汉朝.txt", "w")
articalList = []
for e in aList:
	href = re.compile(r"read_.*?html")
	hrefList = href.findall(e)
	if hrefList:
		title = re.compile(r"第\d*?节")
		titleList = title.findall(e)
		titleNumRegx = re.compile("\d*")
		titleNum = titleNumRegx.findall(titleList[0])
		articalList.append({'name': string.atoi(titleNum[2]),'href':hrefList[0]})
		articalList.sort(key=lambda obj:obj.get('name'), reverse=False)
for e in articalList:
	print "loading",e.get('name'),e.get('href')
	conn.request("GET",e.get('href'))
	r = conn.getresponse()
	contentRegx = re.compile(r"<TD CLASS=ART>[\w\W]*?</TD>")
	contentList = contentRegx.findall(r.read())
	content = contentList[0]
	content = content.replace("<TD CLASS=ART>","")
	content = content.replace("</TD>","")
	content = content.replace("<br><br><br>","\n")
	content = content.replace("<br><br>","\n")
	content = content.replace("<br>","\n")
	content = content.replace("　　","\n")
	print >>f,content
f.close()
conn.close()

3
顶

6
踩

分享到：

python实现二分查找算法

2013-09-08 01:28
浏览 2031
评论(1)
分类:非技术
查看更多

1 楼 wsh303496225 2013-09-08

有个叫小说阅读下载器的软件可以满足你的需求

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

看连载小说同志们的福利来了

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

看连载小说同志们的福利来了

评论

发表评论

相关推荐

最近访客更多访客>>