在python中读取文本奇怪的错误(代码片段)

author author     2022-10-20     804

关键词:

我打开的文件看起来像这样:http://pastebin.com/ucH5ayHa

并尝试使用简单的python阅读它:

f1 = open("goldstandard-answer-utf-8.txt", "r")

print f1.readline();

for line in f1:
    print line

f1.close()

打印行都不打印整个文档。 readline和for循环分别打印:

</file>

这很奇怪。显然它与文档中的标签有关,但我尝试用lmxl etree或美丽的汤解析它都会产生类似的结果。有没有办法强制python打印行和忽略标记,如果这是有道理的?

编辑:(建议通过评论包括)预期输出与pastebin条目完全相同:2028.htm.txtMäkitalo,ÖstenMäkitalo,ÖstenMäkitalo,JessicaLindbäck,ÖstenMäkitalo,ÖstenMäkitalo,RobertBrännström等...

答案

如果文件真的是用utf-8编码的,顾名思义,请尝试打开它:

import codecs

f = codecs.open('goldstandard-answer-utf-8.txt', 'r', encoding='utf-8')

如何在python中读取带有特殊字符的文本文件(代码片段)

我正在尝试使用特殊字符读取文本文件,例如:الحمدللهربالعالمين我正在使用:importfileinputfileToSearch="test_encoding.txt"withopen(fileToSearch,'r',encoding='utf-8')asfile:counter=0;forlineinfile:print(line)但Python崩溃了这条消息:Tracebac 查看详情

在 python 中使用 beautifullsoup4 抓取网页时出现奇怪的文本缩进

】在python中使用beautifullsoup4抓取网页时出现奇怪的文本缩进【英文标题】:weirdtextindentationwhenwebscrapingwithbeautifullsoup4inpython【发布时间】:2021-12-3121:56:29【问题描述】:我正在尝试网页抓取github这是代码:importrequestsasreqfrombs4impor... 查看详情

在 C++ 中嵌入 python:奇怪的分段错误

】在C++中嵌入python:奇怪的分段错误【英文标题】:EmbeddingpythoninC++:strangesegmentationfaults【发布时间】:2015-02-0315:32:09【问题描述】:(抱歉标题含糊,但它表明我对这个问题感到多么目瞪口呆)。所以我正在从C++程序运行Python... 查看详情

如何将图像保存和读取为文本,嵌入在代码中

】如何将图像保存和读取为文本,嵌入在代码中【英文标题】:Howtosaveandreadimageastext,embeddedinthecode【发布时间】:2017-02-1413:33:18【问题描述】:我知道这是一个奇怪的问题,但我真的需要它来工作。我有一个非常小的.png图像,... 查看详情

Flutter/Dart:读取文本文件以奇怪的字符为前缀

】Flutter/Dart:读取文本文件以奇怪的字符为前缀【英文标题】:Flutter/Dart:readingintextfileisprefixedbyweirdcharacters【发布时间】:2020-01-1912:38:36【问题描述】:我正在从AndroidStudio迁移到Flutter。在AndroidStudio项目中,我使用以下代码以JSO... 查看详情

为啥我的 Python 代码在从文本文件中读取时会打印额外的字符“”?

】为啥我的Python代码在从文本文件中读取时会打印额外的字符“”?【英文标题】:WhydoesmyPythoncodeprinttheextracharacters""whenreadingfromatextfile?为什么我的Python代码在从文本文件中读取时会打印额外的字符“”?... 查看详情

我的 CSS 代码中的奇怪错误使文本随机获得巨大的“边距”

】我的CSS代码中的奇怪错误使文本随机获得巨大的“边距”【英文标题】:WeirdbuginmyCSScodemakingthetextrandomlygetahuge"margin"【发布时间】:2011-05-3001:40:16【问题描述】:我不知道为什么会这样。我有thiscodehere。它工作正常,但... 查看详情

如何将文本文件中的值分配给python函数中的数组并将其用作全局?(代码片段)

我使用的是windows10和python2.7.14。在命令提示符下运行python脚本。我想在文本文件中读取一些行并与某些文本进行比较,如果匹配则应该存储在数组中。而且我希望数组应该是全局的。但在我的脚本中,我无法将内容存储在数组中... 查看详情

将文本中的数字读入python中的变量(代码片段)

假设我有一个仅具有以下格式的文本文件,其中每一行都有两个数字,并用空格隔开:246699116713这是我尝试执行的代码:withopen('text_file.txt')asfile:lines=[]foriinfile:lines.append(i)print(lines)我的代码的问题是它不断用数字打印“”,我不... 查看详情

python从文件中读取数据(代码片段)

一、读取整个文件内容在读取文件之前,我们先创建一个文本文件resource.txt作为源文件。resource.txt mynameisjoker,Iam18yearsold,Howaboutyou? 如何读取文件全部内容,我们编写到reader.py文件中。reader.py1withopen(‘resource.txt‘)asfile_obj:2... 查看详情

markdownrubybundleinstall中出现奇怪的openssl错误(代码片段)

查看详情

Python Builder加载文件奇怪的错误

】PythonBuilder加载文件奇怪的错误【英文标题】:PythonBuilderLoadfileStrangeerror【发布时间】:2016-03-1310:21:41【问题描述】:当我运行此代码时,它给了我以下错误。(尽管main.kv在同一路径中)。这是错误>>returnmainwindow()TypeError:\... 查看详情

python读取写入txt文本内容(代码片段)

一、python中打开文件,python中读写txt文件,首先得打开文件,即使用open()函数,lastpath1=r'D:apache-jmeter-4.0insrcWaveId.txt'file1=open(lastpath,'r'')可以使用不同的模式打开文件,如:r,r+,w,w+... 查看详情

纯文本不会显示在 IE 中 - 而是奇怪的胡言乱语

...时间】:2012-06-1304:27:37【问题描述】:我有一个页面可以读取服务器上的文件并使用Ajax输出。在Firefox和Chrome中,文档显示正常,在IE9中,要么什么都不显示,要么显示一些奇怪的乱码。网站在这里:http://199.193.248.80/test/ 查看详情

在 Python 中使用 xlrd 将数字 Excel 数据读取为文本

】在Python中使用xlrd将数字Excel数据读取为文本【英文标题】:ReadingnumericExceldataastextusingxlrdinPython【发布时间】:2011-02-1323:05:52【问题描述】:我正在尝试使用xlrd读取Excel文件,我想知道是否有办法忽略Excel文件中使用的单元格格... 查看详情

python在没有换行符的情况下读取文件中的行(代码片段)

查看详情

opencv入门(c++/python)-使用opencv读取和编写视频(代码片段)

...进一步推进,我们将详细讨论此实现中使用的功能。Pythonimportcv2#Createavideocaptureobject,inthiscasewearereadingthevideofromafilevid_capture=cv2.VideoCapture('Resources/Cars.mp4')if(vid_capture.isOpened() 查看详情

第一个单词只出现在表单文本框中(代码片段)

...一个全名,如“亨廷顿公园”,但是......表格中的第一个文本框只显示“亨廷顿”,而不是名称的第二部分。下面是剪辑的屏幕。$query="SELECT*FROM`siteinformation`WHERE`id`='".$sitedrop."'" 查看详情