PHP中提供了许多强大的函数用于开发,其中get_headers是一种非常有用的函数。该函数会返回指定URL所引用的所有HTTP头信息,包括响应代码、响应消息、日期、服务器信息和其他头信息。在本文中,我们将从多个方面对get_headers进行详细阐述。
一、获取远程文件的HTTP头信息
get_headers最常用的功能之一就是获取远程文件的HTTP头信息。通过该函数,可以获取到服务器返回的各种信息,如响应代码、响应消息、日期、服务器信息、资源类型、资源大小、缓存时间等等。例如,我们可以编写下面的代码来获取指定URL的HTTP头信息:
$url = 'https://www.example.com/'; $headers = get_headers($url); foreach ($headers as $header) { echo $header . '\n'; }
上面的代码首先指定了要获取HTTP头信息的URL,然后调用get_headers函数获取到$header数组。我们使用foreach循环遍历数组,输出每个头信息。这样我们就可以在命令行或浏览器中查看响应的HTTP头信息。
二、判断URL是否有效
除了获取HTTP头信息,get_headers函数还常用于判断指定URL是否有效或是否可以正常访问。例如,我们可以编写下面的代码来判断一个URL是否可以正常访问:
$url = 'https://www.example.com/'; $headers = @get_headers($url); if ($headers && strpos($headers[0], '200')){ echo 'URL is valid.'; } else { echo 'URL is not valid.'; }
上面的代码首先指定要判断的URL,然后使用@符号屏蔽掉get_headers函数可能产生的错误信息,将返回结果存储在$headers数组中。我们通过判断数组中第一个元素是否包含字符’200’,从而判断URL是否有效。
三、获取指定URL的重定向信息
get_headers函数也可以用于获取指定URL的重定向信息。例如,我们可以编写下面的代码来获取百度搜索的重定向信息。
$url = 'https://www.baidu.com/s?wd=example'; $headers = get_headers($url,1); if (isset($headers['Location'])) { echo 'Redirect URL: ' . $headers['Location']; } else { echo 'No redirect URL.'; }
上面的代码首先指定要获取重定向信息的URL,然后将第二个参数设置为1以获取所有HTTP头信息。我们通过判断$headers数组中是否存在Location键来判断是否存在重定向信息,并输出重定向的URL。
四、发送自定义HTTP头信息
get_headers函数除了从服务器获取HTTP头信息外,还可以向服务器发送自定义的HTTP头信息。例如,我们可以编写下面的代码来向服务器发送自定义的HTTP头信息,以便在header中含有User-Agent字段,请注意本例中的HTML实体化:
$opts = array( 'http' => array( 'method'=>"GET", 'header'=>"User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64)\r\n" ) ); $context = stream_context_create($opts); $url = 'https://www.example.com/'; $headers = get_headers($url,false, $context); foreach ($headers as $header) { echo htmlentities($header) . '<br />'; }
上面的代码通过$opts数组定义了要发送的HTTP头信息,其中包含User-Agent信息。我们通过stream_context_create函数创建一个上下文,使用get_headers函数并将上下文传递给它。最后,我们在循环中输出服务器返回的HTTP头信息,注意使用htmlentities函数进行HTML实体化,以避免在浏览器中解析出现问题。
五、使用get_headers获取网站内容
在一些情况下,我们需要获取目标网站特定位置的HTML内容,get_headers是一种可以帮助我们完成这个任务的简单方式。例如,我们可以编写下面的代码来提取百度首页的顶部标签信息:
$url = 'https://www.baidu.com/'; $headers = get_headers($url, 1); $data = file_get_contents($url, false, stream_context_create(array( 'http' => array( 'method' => 'GET', 'header' => "User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36\r\n" ) ))); if (isset($headers['Content-Type']) && strpos($headers['Content-Type'], 'text/html') !== false) { preg_match('/^\<.+?\>/is', $data, $match); echo 'HTML: ' . htmlentities($match[0]); } else { echo 'No HTML content.'; }
上面的代码首先指定要获取HTML内容的URL,并使用get_headers函数获取HTTP头信息,将结果存储在$headers数组中。接下来,我们使用file_get_contents来获取页面内容,并在此期间使用stream_context_create发送自定义的HTTP头消息。最后,我们使用preg_match函数匹配HTML内容,并输出匹配的第一个标签。需要注意的是,我们在输出HTML标签之前使用htmlentities函数进行了HTML实体化。
六、小结
get_headers是一种非常实用的PHP函数,可以用于多种不同的目的,包括获取远程文件的HTTP头信息、判断URL是否有效、获取重定向信息和发送自定义HTTP头信息。通过本文的介绍,我们相信您已经能够在您的项目中合理运用get_headers函数了。
原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/160067.html