从 archive.org 下载文件

     2023-03-06     251

关键词:

【中文标题】从 archive.org 下载文件【英文标题】:Download file from archive.org 【发布时间】:2015-10-14 23:04:01 【问题描述】:

我想从archive.org下载一个文件,目标是正确的,但是它给出了一个0KB的文件,使用相同的脚本,并从我自己的服务器下载相同的文件,它变成了TRUE,并且文件已下载。

这是脚本,提示链接:

$saveit = '<a href="Files/direct_download.php?path='.$directLink.'/&file='.$fileName.'" id="'.$id.'" style="cursor: pointer;" target="_BLANK">';
$saveit .='<img src="'.$path2icons.'Download32_32.png" class="embedDownload masterTooltip"    title="حفظ الملف" align="absmiddle" />';
$saveit .='</a>';
echo $saveit;

direct_download.php:

$url = $_GET['path'];

//echo $url.'<br>';

$fileName = $_GET['file'];

//echo $fileName;

set_time_limit(0);

header("Pragma: public");
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("Cache-Control: private",false);
header("Content-Type: application/download"); 
header("Content-Disposition: filename=$fileName");

$ch = curl_init($url.$fileName);
curl_exec($ch);
curl_close($ch);        
exit();

提前致谢

【问题讨论】:

【参考方案1】:
    尝试添加用户代理:

curl_setopt( $ch, CURLOPT_USERAGENT, "My User Agent" );

    尝试通过 wget 下载文件。

system("wget ....")

【讨论】:

如何知道用户代理,功能系统从服务器被禁用 例如,您可以使用来自 $_SERVER['HTTP_USER_AGENT'] 的用户用户代理

sh从web.archive.org下载存档的web(代码片段)

查看详情

python快速脚本从archive.org获取所有连接的页面,并在uploads文件夹中下载文件(代码片段)

查看详情

json从archive.org获取所有快照作为列表(代码片段)

查看详情

获取 archive.org 保存的文件的最新版本

】获取archive.org保存的文件的最新版本【英文标题】:Gettingthemostrecentversionofafilekeptbyarchive.org【发布时间】:2013-04-0518:37:11【问题描述】:我有一组收获的原子提要。他们中的一些人已经有几年了,一些帖子链接到不再存在的图... 查看详情

从封面艺术档案 (archive.org) API 中获取专辑封面会由于重定向导致 CORS 错误

】从封面艺术档案(archive.org)API中获取专辑封面会由于重定向导致CORS错误【英文标题】:FetchingalbumartfromtheCoverArtArchive(archive.org)APIleadstoCORSerrorsduetoredirects【发布时间】:2020-09-2703:26:44【问题描述】:我正在为MusicBrainzAPI开发一个... 查看详情

sh一个bash脚本,通过todo.txt中列出的记录id执行internetarchive(archive.org)资料的批量下载(代码片段)

查看详情

archive.org:互联网档案馆

Archive.org:互联网档案馆 2009年的最后一天,辞旧迎新,互联网也同样如此,在过往40年的基础上一步步积累发展。对于我们而言很希望通过以往的每个网页、见证和找寻历史,这就是今天所介绍的网站“archive.org”(中文名... 查看详情

从地图设计网站获取几何信息和名称

...题描述】:有一个地图设计网站,该网站的信息被“web.archive.org”作为快照。不过,我需要的几乎所有信息都可以在此快照中读取。网址是“https://web.archive.org/web/20130601211515 查看详情

为啥使用 ia-wrapper 将后续项目上传到 archive.org 时仍然存在陈旧的标头值?

】为啥使用ia-wrapper将后续项目上传到archive.org时仍然存在陈旧的标头值?【英文标题】:WhyarestaleheadervaluesstillaroundwhenuploadingasubsequentItemtoarchive.orgusingia-wrapper?为什么使用ia-wrapper将后续项目上传到archive.org时仍然存在陈旧的标头... 查看详情

PuTTY 连接管理器下载? [关闭]

...它们都指向丢失的页面/文件。【问题讨论】:0.7.1.136web.archive.org/web 查看详情

使用 C 解析 MIDI 文件 - (分配内存的可能问题)

...这里有一些最有用的(对于那些有兴趣的人):https://web.archive.org/web/ 查看详情

处理来自大型数据抓取的数据

...edatagrab【发布时间】:2021-01-1902:00:55【问题描述】:我从archive.org下载了一个大型(>75GB)数据抓取,其中包含2020年6月以来的大部分或全部推文。存档本身包含31个.tar文件,每个包含嵌套文件夹,最低级别包含几个压缩的.json文... 查看详情

从 UIDocumentPicker 下载文件并等待下载完成

】从UIDocumentPicker下载文件并等待下载完成【英文标题】:DownloadfilesfromUIDocumentPickerandwaituntildownloadhasfinished【发布时间】:2015-02-2318:53:29【问题描述】:我正在尝试从以下位置下载文件-documentPicker:didPickDocumentAtURL:方法。我尝试使... 查看详情

从 BD 下载文件

】从BD下载文件【英文标题】:DownloadFilefromBD【发布时间】:2018-11-3016:06:31【问题描述】:如何从db而不是从某个路径下载文件?我正在以这种方式上传文件:[HttpPost,ActionName("CandidateCreate")][ValidateAntiForgeryToken]publicIActionResultCandida... 查看详情

每天自动从网站下载文件

】每天自动从网站下载文件【英文标题】:Automaticallydownloadafilefromawebsiteeveryday【发布时间】:2022-01-2301:53:48【问题描述】:我需要每天自动从这个网站下载一个文件:“https://es.investing.com/indices/merv-historical-data”。要下载文件,... 查看详情

FileProvider - 从下载目录打开文件

】FileProvider-从下载目录打开文件【英文标题】:FileProvider-OpenFilefromDownloadDirectory【发布时间】:2017-08-2312:51:36【问题描述】:我无法从下载文件夹中打开任何文件。我可以用这个下载文件并保存在下载文件夹中:DownloadManager.Requ... 查看详情

从 Azure 文件共享下载和删除文件

】从Azure文件共享下载和删除文件【英文标题】:DownloadanddeletefilefromAzurefileshares【发布时间】:2021-12-0609:42:32【问题描述】:我有以下代码可以将文件从Azure文件共享下载到本地,并且工作正常。有什么办法,下载完成后可以删... 查看详情

从方法 startDownloadingUbiquitousItem 下载的文件是哪个文件夹?

】从方法startDownloadingUbiquitousItem下载的文件是哪个文件夹?【英文标题】:WhichfolderisthefilesdownloadedfrommethodstartDownloadingUbiquitousItem?【发布时间】:2020-02-0407:18:02【问题描述】:方法下载的文件是什么文件夹?我找不到从这个方法... 查看详情