[英]file_get_contents getting wrong results
更新
我解决了问题并发布了答案。 但是,我的解决方案并不是 100% 理想的。 我宁愿只使用clearstatcache(true, $target)
或clearstatcache(true, $link)
从cache
中删除symlink
,但这不起作用。
我也宁愿首先阻止符号链接的缓存,或者在生成符号链接后立即从缓存中删除它。 不幸的是,我没有运气。 由于某种原因,创建符号链接后clearstatcache(true)
不起作用,它仍然被缓存。
我很乐意将赏金奖励给任何可以改进我的答案并解决这些问题的人。
编辑
我试图通过在每次运行clearstatcache
时生成一个文件来优化我的代码,这样我只需要为每个符号链接清除一次缓存。 出于某种原因,这不起作用。 每次路径中包含symlink
时都需要调用clearstatcache
,但为什么呢? 必须有一种方法来优化我拥有的解决方案。
我正在使用PHP 7.3.5
和nginx/1.16.0
。 有时file_get_contents
在使用symlink
时会返回错误的值。 问题是在删除并重新创建符号链接后,其旧值仍保留在缓存中。 有时返回正确的值,有时返回旧值。 它看起来是随机的。
我试图清除缓存或阻止缓存:
function symlink1($target, $link)
{
realpath_cache_size(0);
symlink($target, $link);
//clearstatcache(true);
}
我真的不想禁用缓存,但我仍然需要 file_get_contents 的 100% 准确度。
编辑
我无法发布我的源代码,因为它太长且太复杂,所以我创建了一个最小的、可重现的示例(index.php)来重现问题:
<h1>Symlink Problem</h1>
<?php
$dir = getcwd();
if (isset($_POST['clear-all']))
{
$nos = array_values(array_diff(scandir($dir.'/nos'), array('..', '.')));
foreach ($nos as $no)
{
unlink($dir.'/nos/'.$no.'/id.txt');
rmdir($dir.'/nos/'.$no);
}
foreach (array_values(array_diff(scandir($dir.'/ids'), array('..', '.'))) as $id)
unlink($dir.'/ids/'.$id);
}
if (!is_dir($dir.'/nos'))
mkdir($dir.'/nos');
if (!is_dir($dir.'/ids'))
mkdir($dir.'/ids');
if (isset($_POST['submit']) && !empty($_POST['id']) && ctype_digit($_POST['insert-after']) && ctype_alnum($_POST['id']))
{
$nos = array_values(array_diff(scandir($dir.'/nos'), array('..', '.')));
$total = count($nos);
if ($total <= 100)
{
for ($i = $total; $i >= $_POST['insert-after']; $i--)
{
$id = file_get_contents($dir.'/nos/'.$i.'/id.txt');
unlink($dir.'/ids/'.$id);
symlink($dir.'/nos/'.($i + 1), $dir.'/ids/'.$id);
rename($dir.'/nos/'.$i, $dir.'/nos/'.($i + 1));
}
echo '<br>';
mkdir($dir.'/nos/'.$_POST['insert-after']);
file_put_contents($dir.'/nos/'.$_POST['insert-after'].'/id.txt', $_POST['id']);
symlink($dir.'/nos/'.$_POST['insert-after'], $dir.'/ids/'.$_POST['id']);
}
}
$nos = array_values(array_diff(scandir($dir.'/nos'), array('..', '.')));
$total = count($nos) + 1;
echo '<h2>Ids from nos directory</h2>';
foreach ($nos as $no)
{
echo ($no + 1).':'.file_get_contents("$dir/nos/$no/id.txt").'<br>';
}
echo '<h2>Ids from using symlinks</h2>';
$ids = array_values(array_diff(scandir($dir.'/ids'), array('..', '.')));
if (count($ids) > 0)
{
$success = true;
foreach ($ids as $id)
{
$id1 = file_get_contents("$dir/ids/$id/id.txt");
echo $id.':'.$id1.'<br>';
if ($id !== $id1)
$success = false;
}
if ($success)
echo '<b><font color="blue">Success!</font></b><br>';
else
echo '<b><font color="red">Failure!</font></b><br>';
}
?>
<br>
<h2>Insert ID after</h2>
<form method="post" action="/">
<select name="insert-after">
<?php
for ($i = 0; $i < $total; $i++)
echo '<option value="'.$i.'">'.$i.'</option>';
?>
</select>
<input type="text" placeholder="ID" name="id"><br>
<input type="submit" name="submit" value="Insert"><br>
</form>
<h2>Clear all</h2>
<form method="post" action="/">
<input type="submit" name="clear-all" value="Clear All"><br>
</form>
<script>
if (window.history.replaceState)
{
window.history.replaceState( null, null, window.location.href );
}
</script>
这似乎很可能是Nginx
配置的问题。 没有这些行可能会导致问题:
fastcgi_param SCRIPT_FILENAME $realpath_root$fastcgi_script_name;
fastcgi_param DOCUMENT_ROOT $realpath_root;
这是我的Nginx
配置(你可以看到我已经包含了以上几行):
server {
listen 443 ssl http2;
listen [::]:443 ssl http2;
server_name www.websemantica.co.uk;
root "/path/to/site/root";
index index.php;
location / {
try_files $uri $uri/ $uri.php$is_args$query_string;
}
location ~* \.php$ {
try_files $uri =404;
fastcgi_pass unix:/var/run/php-fpm/php-fpm.sock;
fastcgi_param QUERY_STRING $query_string;
fastcgi_param REQUEST_METHOD $request_method;
fastcgi_param CONTENT_TYPE $content_type;
fastcgi_param CONTENT_LENGTH $content_length;
fastcgi_param SCRIPT_FILENAME $realpath_root$fastcgi_script_name;
fastcgi_param SCRIPT_NAME $fastcgi_script_name;
fastcgi_param PATH_INFO $fastcgi_path_info;
fastcgi_param PATH_TRANSLATED $realpath_root$fastcgi_path_info;
fastcgi_param REQUEST_URI $request_uri;
fastcgi_param DOCUMENT_URI $document_uri;
fastcgi_param DOCUMENT_ROOT $realpath_root;
fastcgi_param SERVER_PROTOCOL $server_protocol;
fastcgi_param GATEWAY_INTERFACE CGI/1.1;
fastcgi_param SERVER_SOFTWARE nginx/$nginx_version;
fastcgi_param REMOTE_ADDR $remote_addr;
fastcgi_param REMOTE_PORT $remote_port;
fastcgi_param SERVER_ADDR $server_addr;
fastcgi_param SERVER_PORT $server_port;
fastcgi_param SERVER_NAME $server_name;
fastcgi_param HTTPS $https;
# PHP only, required if PHP was built with --enable-force-cgi-redirect
fastcgi_param REDIRECT_STATUS 200;
fastcgi_index index.php;
fastcgi_read_timeout 3000;
}
if ($request_uri ~ (?i)^/([^?]*)\.php($|\?)) {
return 301 /$1$is_args$args;
}
rewrite ^/index$ / permanent;
rewrite ^/(.*)/$ /$1 permanent;
}
目前我在https://www.websemantica.co.uk有上面的例子。
尝试在表单中添加一些值。 它应该显示Success!
每次都是蓝色的。 有时是显示Failure!
红色的。 从Success!
Failure!
或相反亦然。 最终,它将显示Success!
每次,因此必须存在某种缓存问题。
它过多地取决于操作系统级别。 那么如何尝试开箱即用。 如何尝试通过readlink
读取文件的真实位置,并使用该真实位置路径?
$realPath = shell_exec("readlink " . $yourSymlink);
$fileContent = file_get_contents($realPath);
这是 PHP 所需的行为,您可以在此处看到这一点,因为 PHP 使用realpath_cache
来存储文件路径,因为性能增强,因此可以减少磁盘操作。
为了避免这种行为,也许您可以在使用get_file_contents
function 之前尝试清除realpath_cache
你可以尝试这样的事情:
clearstatcache();
$data = file_get_contents("Your File");
您可以在 PHP 文档上阅读更多有关clearstatcache的信息。
有两个缓存。
首先是操作系统缓存,然后是 PHP 缓存。
在大多数情况下clearstatcache(true)
之前file_get_contents(...)
完成这项工作。
但有时您还需要清除操作系统缓存。 在 Linux 的情况下,我可以想到两个要清除的地方。 PageCache (1) 和 dentries/inode (2)。
这清除了两个:
shell_exec('echo 3 > /proc/sys/vm/drop_caches')
注意:这有利于故障排除,但不适用于生产中的频繁调用,因为它会清除整个操作系统缓存并使系统花费一些时间重新填充缓存。
“问题出在删除并重新创建符号链接之后”
你如何删除符号链接? 删除文件(或符号链接)应自动清除缓存。
否则,您可能会看到如果您这样做会发生什么:
// This has "race condition" written all around it
unlink($link);
touch($link);
unlink($link); // Remove the empty file
symlink($target, $link);
如果这不能解决问题,那么可能是 nginx 的问题吗?
尝试将所有操作记录到日志文件中,以查看实际发生的情况。
...您可以完全不使用符号链接吗? 例如,将“文件名”和“实际符号链接目标”之间的映射存储在数据库、memcache、SQLite 文件,甚至 JSON 文件中。 使用例如 redis 或其他密钥库,您可以将“文件名”与真正的符号链接目标相关联并完全绕过操作系统解析。
根据用例,这甚至可能比使用符号链接更快。
有两个问题导致了这个问题。
首要问题
我已经在问题中发布并编辑。 这是 Nginx 配置的问题。
这些行:
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
fastcgi_param DOCUMENT_ROOT $document_root;
需要替换为:
fastcgi_param SCRIPT_FILENAME $realpath_root$fastcgi_script_name;
fastcgi_param DOCUMENT_ROOT $realpath_root;
第二期
第二个问题是我需要在调用file_get_contents
之前调用clearstatcache
。 我只想在绝对必要时调用clearstatcache
,所以我写了一个 function ,它只在目录包含symlink
时清除缓存。
function file_get_contents1($dir)
{
$realPath = realpath($dir);
if ($realPath === false)
return '';
if ($dir !== $realPath)
{
clearstatcache(true);
}
return file_get_contents($dir);
}
我留下我的第一个答案,因为它仍然是一个有效的答案。 我正在通过实现 clearstatcache(true,$filename) 来改进@DanBray 的答案。
有两个问题导致了这个问题。
首要问题
我已经在问题中发布并编辑。 这是 Nginx 配置的问题。
这些行:
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name; fastcgi_param DOCUMENT_ROOT $document_root;
需要替换为:
fastcgi_param SCRIPT_FILENAME $realpath_root$fastcgi_script_name; fastcgi_param DOCUMENT_ROOT $realpath_root;
第二期
第二个问题是我需要在调用 file_get_contents 之前调用 clearstatcache。 我只想在绝对必要时调用 clearstatcache ,所以我写了一个 function ,它只在目录包含符号链接时清除缓存。
function file_get_contents1234_hard_drives($dir_go_1){
$realPath = realpath($dir_go_1);
$myDirectory=opendir(dirname($realPath));
while($entryName=readdir($myDirectory)) {
$dirArray[]=$entryName;
}
/* Finds extensions of files used for my site theelectronichandbook.tech
function findexts ($filename) {
$filename=strtolower($filename);
$exts=split("[/\\.]", $filename);
$n=count($exts)-1;
$exts=$exts[$n];
return $exts;
}*/
// Closes directory
closedir($myDirectory);
// Counts elements in array
$indexCount=count($dirArray);
for($ArPos=1;$ArPos<=$indexCount;$ArPos++){
/*used for my site theelectronichandbook.tech
if($_SERVER['QUERY_STRING']=="hidden"){
$H="";
$af="./";
$atext="Hide";
}else{
$H=".";
$af="./?hidden";
$at="Show";
}*/
if(strpos($dirArray[$ArPos], "Symlink") !== false){
clearstatcache(true,$dir_go_1);
}
}
return file_get_contents($dir_go_1);
}
我用我的网络服务器测试了上面的代码,它工作正常。
尝试将代码放置在使用 Jquery 以及强制重新验证和清除 static 捕获的持续刷新的元素中。 此代码已从 @naveed 原始答案修改。
表格.php:
<meta http-equiv="Cache-Control" content="no-store, must-revalidate" />
<meta http-equiv="Expires" content="0"/>
<script src="https://ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js"></script>
<script>
jQuery(document).ready(function(){
jQuery('.ajaxform').submit( function() {
$.ajax({
url : $(this).attr('action'),
type : $(this).attr('method'),
dataType: 'json',
data : $(this).serialize(),
success : function( data ) {
// loop to set the result(value)
// in required div(key)
for(var id in data) {
jQuery('#' + id).html( data[id] );
}
}
});
return false;
});
});
var timer, delay = 30;
timer = setInterval(function(){
$.ajax({
type : 'POST',
url : 'profile.php',
dataType: 'json',
data : $('.ajaxform').serialize(),
success : function(data){
for(var id in data) {
jQuery('#' + id).html( data[id] );
}
}
}); }, delay);
</script>
<form action='profile.php' method='post' class='ajaxform'></form>
<div id='result'></div>
profile.php:
<?php
// All form data is in $_POST
// Now perform actions on form data here and create an result array something like this
clearstatcache();
$arr = array( 'result' => file_get_contents("./myfile.text") );
echo json_encode( $arr );
?>
如果您在get_file_contents
中传递任何 object、图像、gif、符号或任何不同的语言,则会导致在字符串之间接收symlink
/符号表示。
并且,用于删除浏览器的缓存或自动删除/过期缓存。
header("Cache-Control: no-cache, must-revalidate"); header("Expires: Mon, 26 Jul 1997 05:00:00 GMT");
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.