python源码分享
本站提供的Python代码仅供学习
请勿违法使用
58同城
默认爬北京源保存到D盘
from bs4 import BeautifulSoup
import requests
import time
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
}
def get_info(url):
tc_data = requests.get(url,headers = headers)
data = BeautifulSoup(tc_data.text,'lxml')
title = data.select('#__layout > div > section > section.list-main > section.list-left > section> div> a > div.property-content > div.property-content-detail > div.property-content-title > h3')
info = data.select('#__layout > div > section > section.list-main > section.list-left > section > div > a > div.property-content > div.property-content-detail > section')
money = data.select('#__layout > div > section > section.list-main > section.list-left > section > div > a > div.property-content > div.property-price')
for title , info , money in zip(title , info , money):
xx = {
'标题': title.get_text().split(',',1),
'信息': info.get_text().replace(" ", "").replace("\n"," "),
'价格': money.get_text().split(',',1),
}
f = open("D:/58.TXT", "a")
f.write(str(xx) + '\n')
print(xx)
if __name__ == '__main__':
urls = ['https://bj.58.com/ershoufang/p{}/?PGTID=0d30000c-0253-9e2a-70d5-494ade5aa8e5&ClickID=1'.format(str(i)) for i in range(1,50)]
for url in urls:
get_info(url)
time.sleep(5)
1 文章名称:python源码分享
2 文章永久网址:https://www.xhily.com/590.html
3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长0000F进行删除处理。
4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
7 如无特别声明本文即为原创文章仅代表个人观点,版权归《无用笔记》所有,欢迎转载,转载请保留原文链接。
2 文章永久网址:https://www.xhily.com/590.html
3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长0000F进行删除处理。
4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
7 如无特别声明本文即为原创文章仅代表个人观点,版权归《无用笔记》所有,欢迎转载,转载请保留原文链接。
THE END
