python爬虫——新浪新闻网络爬虫

python爬虫——新浪新闻网络爬虫import requestsfrom bs4 import BeautifulSoupnewsurl = "http://news.sina.com.cn/china/"res = requests.get(newsurl)res.encoding = 'utf-8'#print(res.text)soup = BeautifulSoup(res.te

Nani_xiao

1280人浏览 · 2017-08-21 10:18:13

Nani_xiao · 2017-08-21 10:18:13 发布

python爬虫——新浪新闻网络爬虫

import requests
from bs4 import BeautifulSoup
newsurl = "http://news.sina.com.cn/china/"
res = requests.get(newsurl)
res.encoding = 'utf-8'
#print(res.text)

soup = BeautifulSoup(res.text, 'html.parser')

for news in soup.select('.news-item'):
    #print(news)
    if len(news.select('h2')) > 0:
        h2 = news.select('h2')[0].text
        time = news.select('.time')[0].text
        a = news.select('a')[0]['href']
        print(time, h2, a)

爬取效果：

这里写图片描述

加入社区！打开量化的大门，首批课程上线啦！

更多推荐

终极指南：如何避免RateLimitExceededException的Laravel API安全防护

在构建RESTful API时，避免RateLimitExceededException是每个开发者必须掌握的关键技能。Dingo API作为Laravel和Lumen框架的强大RESTful API包，提供了完整的速率限制机制来保护你的应用程序免受恶意请求和过量访问。本文将为你详细介绍如何配置和使用这些安全功能。## 🛡️ 什么是速率限制及其重要性速率限制是API安全的第一道防线，它能

量化交易与投资社区

终极指南：5步复现Spring Boot安全风险CVE-2016-1000027

Spring Boot安全风险CVE-2016-1000027是一个严重的Java反序列化问题，允许攻击者通过恶意序列化数据执行任意代码。本文将详细解析这一问题的原理、复现方法和修复方案。## 🔍 问题背景与原理剖析CVE-2016-1000027问题源于Spring Framework中的`HttpInvokerServiceExporter`和`RemoteInvocationSer