关键词:
【中文标题】从 archive.org 下载文件【英文标题】:Download file from archive.org 【发布时间】:2015-10-14 23:04:01 【问题描述】:我想从archive.org下载一个文件,目标是正确的,但是它给出了一个0KB的文件,使用相同的脚本,并从我自己的服务器下载相同的文件,它变成了TRUE,并且文件已下载。
这是脚本,提示链接:
$saveit = '<a href="Files/direct_download.php?path='.$directLink.'/&file='.$fileName.'" id="'.$id.'" style="cursor: pointer;" target="_BLANK">';
$saveit .='<img src="'.$path2icons.'Download32_32.png" class="embedDownload masterTooltip" title="حفظ الملف" align="absmiddle" />';
$saveit .='</a>';
echo $saveit;
direct_download.php:
$url = $_GET['path'];
//echo $url.'<br>';
$fileName = $_GET['file'];
//echo $fileName;
set_time_limit(0);
header("Pragma: public");
header("Expires: 0");
header("Cache-Control: must-revalidate, post-check=0, pre-check=0");
header("Cache-Control: private",false);
header("Content-Type: application/download");
header("Content-Disposition: filename=$fileName");
$ch = curl_init($url.$fileName);
curl_exec($ch);
curl_close($ch);
exit();
提前致谢
【问题讨论】:
【参考方案1】:-
尝试添加用户代理:
curl_setopt( $ch, CURLOPT_USERAGENT, "My User Agent" );
-
尝试通过 wget 下载文件。
system("wget ....")
【讨论】:
如何知道用户代理,功能系统从服务器被禁用 例如,您可以使用来自 $_SERVER['HTTP_USER_AGENT'] 的用户用户代理sh从web.archive.org下载存档的web(代码片段)
python快速脚本从archive.org获取所有连接的页面,并在uploads文件夹中下载文件(代码片段)
json从archive.org获取所有快照作为列表(代码片段)
获取 archive.org 保存的文件的最新版本
】获取archive.org保存的文件的最新版本【英文标题】:Gettingthemostrecentversionofafilekeptbyarchive.org【发布时间】:2013-04-0518:37:11【问题描述】:我有一组收获的原子提要。他们中的一些人已经有几年了,一些帖子链接到不再存在的图... 查看详情
从封面艺术档案 (archive.org) API 中获取专辑封面会由于重定向导致 CORS 错误
】从封面艺术档案(archive.org)API中获取专辑封面会由于重定向导致CORS错误【英文标题】:FetchingalbumartfromtheCoverArtArchive(archive.org)APIleadstoCORSerrorsduetoredirects【发布时间】:2020-09-2703:26:44【问题描述】:我正在为MusicBrainzAPI开发一个... 查看详情
sh一个bash脚本,通过todo.txt中列出的记录id执行internetarchive(archive.org)资料的批量下载(代码片段)
archive.org:互联网档案馆
Archive.org:互联网档案馆 2009年的最后一天,辞旧迎新,互联网也同样如此,在过往40年的基础上一步步积累发展。对于我们而言很希望通过以往的每个网页、见证和找寻历史,这就是今天所介绍的网站“archive.org”(中文名... 查看详情
从地图设计网站获取几何信息和名称
...题描述】:有一个地图设计网站,该网站的信息被“web.archive.org”作为快照。不过,我需要的几乎所有信息都可以在此快照中读取。网址是“https://web.archive.org/web/20130601211515 查看详情
为啥使用 ia-wrapper 将后续项目上传到 archive.org 时仍然存在陈旧的标头值?
】为啥使用ia-wrapper将后续项目上传到archive.org时仍然存在陈旧的标头值?【英文标题】:WhyarestaleheadervaluesstillaroundwhenuploadingasubsequentItemtoarchive.orgusingia-wrapper?为什么使用ia-wrapper将后续项目上传到archive.org时仍然存在陈旧的标头... 查看详情
PuTTY 连接管理器下载? [关闭]
...它们都指向丢失的页面/文件。【问题讨论】:0.7.1.136web.archive.org/web 查看详情
使用 C 解析 MIDI 文件 - (分配内存的可能问题)
...这里有一些最有用的(对于那些有兴趣的人):https://web.archive.org/web/ 查看详情
处理来自大型数据抓取的数据
...edatagrab【发布时间】:2021-01-1902:00:55【问题描述】:我从archive.org下载了一个大型(>75GB)数据抓取,其中包含2020年6月以来的大部分或全部推文。存档本身包含31个.tar文件,每个包含嵌套文件夹,最低级别包含几个压缩的.json文... 查看详情
从 UIDocumentPicker 下载文件并等待下载完成
】从UIDocumentPicker下载文件并等待下载完成【英文标题】:DownloadfilesfromUIDocumentPickerandwaituntildownloadhasfinished【发布时间】:2015-02-2318:53:29【问题描述】:我正在尝试从以下位置下载文件-documentPicker:didPickDocumentAtURL:方法。我尝试使... 查看详情
从 BD 下载文件
】从BD下载文件【英文标题】:DownloadFilefromBD【发布时间】:2018-11-3016:06:31【问题描述】:如何从db而不是从某个路径下载文件?我正在以这种方式上传文件:[HttpPost,ActionName("CandidateCreate")][ValidateAntiForgeryToken]publicIActionResultCandida... 查看详情
每天自动从网站下载文件
】每天自动从网站下载文件【英文标题】:Automaticallydownloadafilefromawebsiteeveryday【发布时间】:2022-01-2301:53:48【问题描述】:我需要每天自动从这个网站下载一个文件:“https://es.investing.com/indices/merv-historical-data”。要下载文件,... 查看详情
FileProvider - 从下载目录打开文件
】FileProvider-从下载目录打开文件【英文标题】:FileProvider-OpenFilefromDownloadDirectory【发布时间】:2017-08-2312:51:36【问题描述】:我无法从下载文件夹中打开任何文件。我可以用这个下载文件并保存在下载文件夹中:DownloadManager.Requ... 查看详情
从 Azure 文件共享下载和删除文件
】从Azure文件共享下载和删除文件【英文标题】:DownloadanddeletefilefromAzurefileshares【发布时间】:2021-12-0609:42:32【问题描述】:我有以下代码可以将文件从Azure文件共享下载到本地,并且工作正常。有什么办法,下载完成后可以删... 查看详情
从方法 startDownloadingUbiquitousItem 下载的文件是哪个文件夹?
】从方法startDownloadingUbiquitousItem下载的文件是哪个文件夹?【英文标题】:WhichfolderisthefilesdownloadedfrommethodstartDownloadingUbiquitousItem?【发布时间】:2020-02-0407:18:02【问题描述】:方法下载的文件是什么文件夹?我找不到从这个方法... 查看详情