python爬虫爬取懂车帝车价汽车信息爬虫程序代码csv版QZQ

【代码】python爬虫爬取懂车帝车价汽车信息爬虫程序代码csv版QZQ。

自然111111

328人浏览 · 2025-09-13 10:25:31

自然111111 · 2025-09-13 10:25:31 发布

import requests
from lxml import etree
import csv
import time

# 确保已安装所需库：pip install requests lxml
url = 'https://www.dongchedi.com/sales'

# 添加请求头，模拟浏览器访问
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36',
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
    'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2'
}

try:
    # 获取网页内容
    print("正在获取网页内容...")
    response = requests.get(url, headers=headers)
    response.raise_for_status()  # 检查请求是否成功
    code = response.text
    html = etree.HTML(code)

    # 使用XPath提取数据 - 先获取所有车辆信息的父节点列表
    car_items = html.xpath('//*[@id="__next"]/div[1]/div[2]/div/div[4]/div/div/ol/li')
    print(f"找到 {len(car_items)} 条车辆信息")

    # 准备写入CSV文件
    with open("懂车帝车价.csv", 'w', encoding='utf-8', newline='') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(["序号", "名称", "车型描述", "价格", "销量"])

        # 遍历每个车辆信息节点
        for index, item in enumerate(car_items, 1):
            # 从每个节点中提取具体信息
            car_name = item.xpath('.//div[3]/div[1]/a/text()')#名称
            car_sales = item.xpath('.//div[3]/div[1]/span/text()')#车型
            car_price = item.xpath('.//div[3]/p/text()')#价格
            car_description = item.xpath('.//div[4]/div/p/text()')#销量




            # 处理提取到的数据，确保不为空
            name = car_name[0].strip() if car_name else "未知名称"
            sales = car_sales[0].strip() if car_sales else "车型描述"
            price = car_price[0].strip() if car_price else "价格未知"
            description = car_description[0].strip() if car_description else "销量"





            # 写入数据
            writer.writerow([index, name, sales, price, description])
            print(f"已写入 {index}: {name} - {price}")
            time.sleep(0.1)  # 轻微延迟，避免过于频繁

    print("数据已成功保存到懂车帝车价.csv")

except requests.exceptions.RequestException as e:
    print(f"请求出错: {e}")
except Exception as e:
    print(f"发生错误: {e}")

加入社区！打开量化的大门，首批课程上线啦！

更多推荐

python爬虫入门案例day05:Pexels

量化交易与投资社区

终极指南：如何避免RateLimitExceededException的Laravel API安全防护

在构建RESTful API时，避免RateLimitExceededException是每个开发者必须掌握的关键技能。Dingo API作为Laravel和Lumen框架的强大RESTful API包，提供了完整的速率限制机制来保护你的应用程序免受恶意请求和过量访问。本文将为你详细介绍如何配置和使用这些安全功能。## 🛡️ 什么是速率限制及其重要性速率限制是API安全的第一道防线，它能

量化交易与投资社区

xxHash算法的学术研究：引用分析与相关改进论文综述

xxHash作为当前最快的非加密哈希算法，在学术界和工业界都引起了广泛关注。其极致的速度和优秀的质量特性使其成为哈希算法研究的重要对象。本文将深入分析xxHash在学术研究中的引用情况，并综述相关的改进论文和研究进展。## 📊 xxHash算法概述与技术特点xxHash是由Yann Collet开发的一种极速非加密哈希算法，主要包含三个版本：XXH32（32位哈希）、XXH64（64位哈