Python 使用urllib检测网站的状态码是否为404或200

在本文中，我们将介绍如何使用Python的urllib库来检测一个网站的状态码，以确定网站是否为404或200。

什么是状态码？

在通过HTTP协议访问网站时，服务器会返回一个状态码，用于表示服务器对客户端请求的处理结果。常见的状态码有200、404等。

状态码200表示服务器成功返回了客户端请求的页面；
状态码404表示服务器未能找到客户端请求的页面。

使用urllib库

Python的urllib库是一个用于处理HTTP请求的常用库，它提供了一系列用于发送和接收HTTP请求的功能。我们可以使用urllib库中的urlopen函数来发送HTTP请求，并获取返回值中的状态码。

下面是一个简单的示例代码，通过urllib库判断一个网站是否为404或200：

import urllib.request

def check_website_status(url):
    try:
        response = urllib.request.urlopen(url)
        status_code = response.getcode()
        if status_code == 200:
            print("网站状态码:", status_code)
            print("网站状态: 成功")
        else:
            print("网站状态码:", status_code)
            print("网站状态: 未找到")
    except urllib.error.HTTPError as e:
        print("网站状态码:", e.code)
        print("网站状态: 未找到")

# 检测示例网站
check_website_status("https://www.google.com")

在上述示例代码中，我们先导入了urllib库中的request模块，然后定义了一个名为check_website_status的函数，函数参数为网站的URL。在函数内部，我们首先使用urlopen函数发送HTTP请求并获取响应，然后通过getcode方法获取状态码。根据状态码的不同，我们打印出不同的信息，以判断网站的状态。

在示例代码中，我们检测了一个名为google的网站，在代码输出中，我们可以看到该网站的状态码为200，表示该网站成功返回了客户端请求的页面。