如何在Python中读取（或写入）二进制数据？

在Python中，你可以通过使用open()函数并指定二进制模式来读取或写入二进制数据。如下示例，你可以使用open()函数指定rb模式来打开二进制文件并读取二进制数据：

with open('example.bin', 'rb') as file:
    data = file.read()
    print(data)

在这个例子中，我们使用with语句打开一个二进制文件，并将文件对象赋值给file变量。我们使用file.read()方法读取文件内容，并将其存储在data变量中。最后，我们使用print()函数输出二进制数据。

当你想要将二进制数据写入文件时，你可以使用wb模式打开文件。如下示例所示：

data = b'\x00\x01\x02\x03'
with open('example.bin', 'wb') as file:
    file.write(data)

在这个例子中，我们使用b前缀定义了一个二进制数据对象，并将其赋值给data变量。接着，我们使用with语句打开一个二进制文件，并将文件对象赋值给file变量。我们使用file.write()方法将data写入到文件中。最后，我们使用print()函数输出二进制数据。

需要注意的是，如果你是在Windows系统上读取二进制文件，你可能需要使用rb模式。因为Windows系统默认将'\r\n'作为换行符，当你使用默认的r模式时，它会将'\r\n'转换为'\n'，这可能会导致二进制数据损坏。使用rb模式可以避免这种问题。

如果你想要一次读取或写入大量二进制数据，你可以使用memoryview对象来避免大量的内存占用。

with open('example.bin', 'rb') as file:
    chunk = memoryview(bytearray(1024))
    while file.readinto(chunk):
        process_data(chunk)

在这个例子中，我们使用memoryview对象定义一个包含1024字节的缓冲区。我们使用bytearray()函数初始化缓冲区，并将其转换为memoryview对象，并将其赋值给chunk变量。使用with语句打开一个二进制文件，并将文件对象赋值给file变量。我们循环读取文件内容，每次读取时将文件内容存储在chunk对象中。最后，我们将chunk对象传递给process_data()函数进行处理。

这里有另一个写入大量二进制数据的示例：

data = b'\x00\x01\x02\x03' * 1024 * 1024
with open('example.bin', 'wb') as file:
    for pos in range(0, len(data), 1024):
        file.write(memoryview(data)[pos:pos+1024])

在这个例子中，我们创建一个包含了1048576个字节的二进制数据对象，并将其赋值给data变量。我们使用with语句打开一个二进制文件，并将文件对象赋值给file变量。我们循环处理data并将每个1KB的缓冲区对象写入到文件中。

结论

在Python中，你可以使用open()函数并指定二进制模式来读取或写入二进制数据。如果你要一次读取或写入大量二进制数据，你可以使用memoryview对象来避免大量的内存占用。需要注意的是，在Windows系统上读取二进制文件时，你可能需要使用rb模式来避免将'\r\n'转换为'\n'而导致二进制数据损坏的问题。希望这篇文章能够帮助你更好地理解如何在Python中读取和写入二进制数据。如果你有任何疑问或建议，请随时在评论区留言。