python源码分享

无用笔记

代码分享

2021-3-12

本站提供的Python代码仅供学习

请勿违法使用

58同城

默认爬北京源保存到D盘

from bs4 import BeautifulSoup
import requests
import time


headers = {
            'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
          }

def get_info(url):
    tc_data = requests.get(url,headers = headers)
    data = BeautifulSoup(tc_data.text,'lxml')
    title = data.select('#__layout > div > section > section.list-main > section.list-left > section> div> a > div.property-content > div.property-content-detail > div.property-content-title > h3')
    info = data.select('#__layout > div > section > section.list-main > section.list-left > section > div > a > div.property-content > div.property-content-detail > section')
    money = data.select('#__layout > div > section > section.list-main > section.list-left > section > div > a > div.property-content > div.property-price')
    for title , info , money in zip(title , info , money):
        xx = {
            '标题': title.get_text().split(',',1),
            '信息': info.get_text().replace(" ", "").replace("\n"," "),
            '价格': money.get_text().split(',',1),

        }
        f = open("D:/58.TXT", "a")
        f.write(str(xx) + '\n')
        print(xx)




if __name__ == '__main__':
    urls = ['https://bj.58.com/ershoufang/p{}/?PGTID=0d30000c-0253-9e2a-70d5-494ade5aa8e5&ClickID=1'.format(str(i)) for i in range(1,50)]
    for url in urls:
        get_info(url)
    time.sleep(5)

1 文章名称：python源码分享
2 文章永久网址：https://www.xhily.com/590.html
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长0000F进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。
7 如无特别声明本文即为原创文章仅代表个人观点，版权归《无用笔记》所有，欢迎转载，转载请保留原文链接。

THE END