我正在尝试使用pandas函数read_SAS从SAS的.sas7bdat格式读取数据:
将熊猫作为pd导入
df=pd.read_sas('D:/input/houses.sas7bdat',格式='sas7bdat')
df.head()
df数据帧中有两种数据类型——float64和object。我对float64数据类型完全满意,因此我可以自由地将其转换为int、string等。
问题在于对象数据类型,我可以在df数据框中看到,包装如下:
b'Text'
或者像这样:
b'12345'
而不是
文本
或
12345
我无法将其分别转换为string或int或“normal”对象数据类型。我也不能用切片或替换技术来删除b”。所以我不能使用对象数据类型的列。
请告诉我如何摆脱b”
添加此encoding=“utf-8”
因此,线路如下所示:
df=pd.read\u sas('D:/input/houses.sas7bdat',format='sas7bdat',encoding=“utf-8”)