我目前正在为pdf建立搜索引擎。 我正在使用弹性搜索来摄取pdf数据。 由于大多数人建议不要以弹性方式存储二进制文件,因此建议我将文件存储在Hadoop HDFS中。 但是,如何从Webapp检索存储的HDFS的实际文件。 有API吗? 或者只是将链接添加到pdf应该可以检索它 ...
提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供 中文繁体 英文版本 中英对照 版本,有任何建议请联系yoyou2525@163.com。
我即将开始使用php编写的小型应用程序,该应用程序将允许用户单击链接并让其从其他网站检索文件并将其交付给用户的浏览器,而无需重定向到远程站点[pdf文件] 。
在开始写作之前,我只是想检查一下是否有人知道已经这样做了。
我要做什么:
* 更新 *对不起,我忘了汤姆(Tom)提及,带有链接的网站可能未运行php,提供文件的网站将是唯一能够执行任何类型代码的网站。
有什么想法或建议吗?
-谢谢-sean
您可以在PHP中使用curl :-)。
直接来自网站的示例:
使用PHP的cURL模块获取example.com主页
<?php
$ch = curl_init("http://www.example.com/");
$fp = fopen("example_homepage.txt", "w");
curl_setopt($ch, CURLOPT_FILE, $fp);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_exec($ch);
curl_close($ch);
fclose($fp);
?>
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.