亲宝软件园·资讯

展开

php的curl携带header请求头信息实现http访问的方法

安陽 人气:0
这篇文章主要介绍了php的curl携带header请求头信息实现http访问的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

 导读:

curl请求时添加请求头信息可以模拟真人操作,不容易被当成是爬虫机器人(采集),从而可以绕过Incapsula等安全验证机制。

1、首先使用浏览器(示例使用的是火狐浏览器)访问接口网址,使用F12调试,查看请求头信息,如下:

2、实现代码:

<?php
/**
 * 开始访问请求
 * @param $url
 * @return bool|string
 */
function fetch_url($url) {
	$header = FormatHeader($url);
	$useragent = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0';
	$timeout= 120;
	$ch = curl_init($url);
	curl_setopt($ch, CURLOPT_FAILONERROR, true);
	//设置请求头信息
	curl_setopt($ch, CURLOPT_HTTPHEADER, $header);
	//不取得返回头信息	
	curl_setopt($ch, CURLOPT_HEADER, 0);
	// 关闭https验证
	curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
	curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
	curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true );
	curl_setopt($ch, CURLOPT_ENCODING, "" );
	curl_setopt($ch, CURLOPT_RETURNTRANSFER, true );
	curl_setopt($ch, CURLOPT_AUTOREFERER, true );
	curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout );
	curl_setopt($ch, CURLOPT_TIMEOUT, $timeout );
	curl_setopt($ch, CURLOPT_MAXREDIRS, 10 );
	curl_setopt($ch, CURLOPT_USERAGENT, $useragent);
	$content = curl_exec($ch);
	if(curl_errno($ch))
	{
		echo 'Error:' . curl_error($ch);
	}
	else
	{
		return $content;    
	}
	curl_close($ch);
}
 
//添加请求头
function FormatHeader($url)
{
 // 解析url
 $temp = parse_url($url);
 $query = isset($temp['query']) ? $temp['query'] : ''; 
 $path = isset($temp['path']) ? $temp['path'] : '/'; 
 $header = array (
 "POST {$path}?{$query} HTTP/1.1",
 "Host: {$temp['host']}",
 "Referer: http://{$temp['host']}/",
 "Content-Type: text/xml; charset=utf-8",
 'Accept: application/json, text/javascript, */*; q=0.01',
 'Accept-Encoding:gzip, deflate, br',
 'Accept-Language:zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
 'Connection:keep-alive',
 'User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0',
 'X-Requested-With: XMLHttpRequest',
 );
 return $header;
}
?>

3、调用示例:

<?php
//lcg_value() 返回范围为 (0, 1) 的一个伪随机数
$url="http://www.xxx.com/getdata.php?v=".lcg_value();
//访问网址
$html = fetch_url($url);

加载全部内容

相关教程
猜你喜欢
用户评论