Pandas读取CSV文件报错
在本文中,我们将介绍Pandas读取CSV文件时报错的问题:FileNotFoundError: File b’\xe2\x80\xaa
阅读更多:Pandas 教程
问题原因
该问题的原因是文件路径中含有不可见字符(invisible characters)。例如在Windows系统中,复制文件路径时经常会复制一些隐藏字符在文件路径前面,这些隐藏字符在程序读取时会被解释为不可识别的字符而导致报错。
解决方法
我们可以通过以下方法解决该问题:
- 可以手动删除文件路径中的不可见字符,以确保文件路径正确无误。
- 使用字符串的strip()方法移除字符串前后的空格,可以避免不可见字符的影响。
path = r"C:\Users\Admin\Desktop\example.csv"
df = pd.read_csv(path.strip())
- 使用正则表达式来匹配路径,以确保文件路径正确无误
import re
path = r"C:\Users\Admin\Desktop\example.csv"
regex = re.compile(r"[\x00-\x7f]+")
match = regex.search(path.strip())
if match:
df = pd.read_csv(match.group())
- 更换文件路径为绝对路径
import os
path = r"example.csv"
abs_path = os.path.abspath(path)
df = pd.read_csv(abs_path)
总结
在读取CSV文件时,尽量避免使用含有不可见字符的文件路径,可以使用strip()方法或正则表达式为文件路径去除不可见字符,也可以使用绝对路径来避免该问题的发生。