从 .xls 文件读取数据时出现 Python 错误

     2023-02-19     267

关键词:

【中文标题】从 .xls 文件读取数据时出现 Python 错误【英文标题】:Python Error when reading data from .xls file 【发布时间】:2015-05-29 23:54:37 【问题描述】:

我需要将一些xls文件读入Python。示例数据文件可以通过Link:data.file找到。我试过了:

import pandas as pd
pd.read_excel('data.xls',sheet=1)

但它给出了一个错误信息:

错误 *** 代码页 21010 -> 编码 'unknown_codepage_21010' -> LookupError: unknown encoding: unknown_codepage_21010 Traceback (最 最近通话最后一次):

文件“”,第 1 行,在 pd.read_excel('data.xls',sheet=1)

文件“C:\Anaconda3\lib\site-packages\pandas\io\excel.py”,第 113 行, 在 read_excel return ExcelFile(io, engine=engine).parse(sheetname=sheetname, **kwds)

文件“C:\Anaconda3\lib\site-packages\pandas\io\excel.py”,第 150 行, 在 初始化 self.book = xlrd.open_workbook(io)

文件“C:\Anaconda3\lib\site-packages\xlrd__init__.py”,第 435 行,在 open_workbook ragged_rows=ragged_rows,

文件“C:\Anaconda3\lib\site-packages\xlrd\book.py”,第 116 行,在 open_workbook_xls bk.parse_globals()

文件“C:\Anaconda3\lib\site-packages\xlrd\book.py”,第 1170 行,在 parse_globals self.handle_codepage(数据)

文件“C:\Anaconda3\lib\site-packages\xlrd\book.py”,第 794 行,在 句柄代码页 self.derive_encoding()

文件“C:\Anaconda3\lib\site-packages\xlrd\book.py”,第 775 行,在 派生编码 _unused = unicode(b'trial', self.encoding)

文件“C:\Anaconda3\lib\site-packages\xlrd\timemachine.py”,第 30 行, 在 unicode = lambda b, enc: b.decode(enc)

LookupError:未知编码:unknown_codepage_21010

有人可以帮忙解决这个问题吗?

PS:我知道如果我在windows excel中打开文件并重新保存,代码可以工作,但我正在寻找无需手动调整的解决方案。

【问题讨论】:

这不仅仅是 pandasc 的问题。其他人有相同的problem 【参考方案1】:

使用 ExcelFile 类,我成功地将文件读入 python。 让我知道这是否有帮助!

    import xlrd
    import pandas as pd

    xls = pd.ExcelFile(’C:\data.xls’)
    xls.parse(’Index Constituents Data’, index_col=None, na_values=[’NA’])

【讨论】:

看起来您在此处的代码中没有使用 xlrd,但是您导入了它。【参考方案2】:

以下内容对我有用。

import xlrd


my_xls = xlrd.open_workbook('//myshareddrive/something/test.xls',encoding_override="gb2312")

【讨论】:

你知道如何将my_xls转换成DataFrame吗?

使用 pandas read_excel() 将 .xls 文件格式导入 python 时出现 CompDocError

】使用pandasread_excel()将.xls文件格式导入python时出现CompDocError【英文标题】:CompDocErrorwhenimporting.xlsfileformattopythonusingpandasread_excel()【发布时间】:2020-02-0816:37:54【问题描述】:我正在尝试导入IMF的GDP数据。它是一个扩展名为.xls格... 查看详情

从文件/rdd 读取数据时出现 Unicode 错误

】从文件/rdd读取数据时出现Unicode错误【英文标题】:Unicodeerrorwhilereadingdatafromfile/rdd【发布时间】:2019-12-2013:15:41【问题描述】:从文本文件中获取数据后,我正在尝试创建具有正确架构的数据框。在RDD中,所有数据类型都是字... 查看详情

从python中的xls或xlsx文件读取后将数据转换为字符串

】从python中的xls或xlsx文件读取后将数据转换为字符串【英文标题】:Convertdatatostringafterreadingfromaxlsorxlsxfileinpython【发布时间】:2013-09-0114:30:44【问题描述】:我正在编写一个函数,用于从xls/xlsx文件中读取数据并插入到db中。但... 查看详情

在 Python 中读取 Twitter json 文件时出现 KeyErrors

】在Python中读取Twitterjson文件时出现KeyErrors【英文标题】:KeyErrorswhilereadingTwitterjsonfilesinPython【发布时间】:2015-06-2508:38:15【问题描述】:我正在尝试使用从twitter收集的数据分析json文件,但是当我尝试搜索关键字时,它说找不... 查看详情

将数据帧写入/读取到 csv 时出现问题 - 最终形状 - Python

...以我有单独的数据框。然后,我将每个数据帧写入一个csv文件。最初它有34列。之后,我将csv文件读入一个新的数据框,现在我有35 查看详情

如果我将偏移量设置为非零,则在使用 hyperslab 从 HDF5 文件中读取数据时出现异常

】如果我将偏移量设置为非零,则在使用hyperslab从HDF5文件中读取数据时出现异常【英文标题】:GettingexceptionwhilereadingdatafromHDF5fileusinghyperslabifIsetOffsetnonzero【发布时间】:2014-09-2413:56:37【问题描述】:这里我试图从hdf5文件中读... 查看详情

在 Python Pandas 中使用 read_parquet 从 AWS S3 读取镶木地板文件时出现分段错误

】在PythonPandas中使用read_parquet从AWSS3读取镶木地板文件时出现分段错误【英文标题】:SegmentationFaultwhilereadingparquetfilefromAWSS3usingread_parquetinPythonPandas【发布时间】:2020-01-0712:26:12【问题描述】:我有一个在AWSEC2(在AWSLinux上)上运... 查看详情

在 C# winforms 中读取 csv 文件时出现数据错误

】在C#winforms中读取csv文件时出现数据错误【英文标题】:dataerrorwhenreadingcsvfileinC#winforms【发布时间】:2012-01-3018:37:06【问题描述】:我有一个C#winforms正在从csv文件中读取一列。它正确读取了4列中的3列。csv文件中的第4列是S4,... 查看详情

为啥打开 .xlsm 而不是 .xls 时出现 python xlrd 错误

】为啥打开.xlsm而不是.xls时出现pythonxlrd错误【英文标题】:Whyispythonxlrderrorswhenopeninga.xlsminsteadof.xls为什么打开.xlsm而不是.xls时出现pythonxlrd错误【发布时间】:2019-08-0205:49:14【问题描述】:Python程序可以很好地打开.xls,但不会打... 查看详情

从python中的.h5文件获取帧时出现Unicode错误

】从python中的.h5文件获取帧时出现Unicode错误【英文标题】:UnicodeErrorwhilegettingframefrom.h5fileinpython【发布时间】:2017-05-0606:56:55【问题描述】:我正在尝试使用pandas.HDFStore读取.h5文件使用此代码:importpandasaspdstore=pd.HDFStore(\'store.h5... 查看详情

从套接字读取数据时出现问题

】从套接字读取数据时出现问题【英文标题】:Issuewhilereadingdatafromasocket【发布时间】:2018-10-3108:10:11【问题描述】:我正在尝试将数据发送到我的服务器并在另一端接收它,但似乎我无法传输数据这是我的客户端代码:publicvoid... 查看详情

从内容 uri 读取文件时出现权限错误

】从内容uri读取文件时出现权限错误【英文标题】:Permissionerrorwhenreadingfilefromcontenturi【发布时间】:2019-07-0703:41:11【问题描述】:我一直在尝试制作一个简单的文档选择器,它允许用户选择一个文件并返回以base64编码的所选文... 查看详情

使用 Python 中的列表理解读取 GPX 文件时出现 UTF 错误

】使用Python中的列表理解读取GPX文件时出现UTF错误【英文标题】:UTFerrorwhenreadinginGPXfilesusinglistcomprehensioninPython【发布时间】:2021-11-1015:10:46【问题描述】:我正在尝试获取一批GPX文件并将它们连接到pandas数据帧中,然后导出为C... 查看详情

尝试从文本文件中读取时出现“索引超出范围错误”

】尝试从文本文件中读取时出现“索引超出范围错误”【英文标题】:"Indexoutofrangeerror"whiletryingtoreadfromatextfile【发布时间】:2017-10-0322:20:37【问题描述】:我在处理这段代码时遇到了一些问题。我正在尝试从名为“level1... 查看详情

使用python将数据从csv文件插入oracle时出现错误ORA-01722:无效数字

】使用python将数据从csv文件插入oracle时出现错误ORA-01722:无效数字【英文标题】:whileinsertingdatatooraclefromcsvfileusingpythongettingerrorORA-01722:invalidnumber【发布时间】:2017-08-0220:36:24【问题描述】:我正在尝试将数据加载到oracle表中。h... 查看详情

从 Access 数据库中读取字段时出现 IndexOutOfRangeException

】从Access数据库中读取字段时出现IndexOutOfRangeException【英文标题】:IndexOutOfRangeExceptionwhenreadinginafieldfromanAccessDatabase【发布时间】:2015-02-0421:47:08【问题描述】:我在将值从Access数据库中读取到列表中时遇到问题。这些值如下所... 查看详情

使用 SAS 令牌从 Azure 阶段读取时出现雪花错误

...发布时间】:2021-05-1604:42:19【问题描述】:当我们尝试将文件复制到雪花表中时,Azureblob的雪花阶段给出错误错误:无法访问远程文件:访问被拒绝。请检查您的凭据我们可以列出文件但无法复制文件。当我们从第三方源系统(Az... 查看详情

从 MVC .Net 核心控制器读取 JSON 时出现问题

...e中的WebAPI。它以JSON格式返回的内容必须从名为landing.js的文件中读取。问题是数据到达变量(数据)但我无法访问它的方法,它总是设计未定 查看详情