百度知道小偷内容获取正则

小偷代码 2019-10-30 20:57:00 评论
//百度知道
$ch = curl_init(); //初始化
curl_setopt($ch, CURLOPT_URL, "https://zhidao.baidu.com/question/".$key.".html");  //设置选项,包括URL
curl_setopt($ch, CURLOPT_TIMEOUT, 3); //PHP获取超时
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$zhidao = curl_exec($ch);    //执行并获取HTML文档内容
curl_close($ch);      //释放curl句柄
$zhidao = iconv("GBK", "UTF-8", $zhidao); 
preg_match_all ('/,title: '([^']+)'/',$zhidao,$bt);
preg_match_all ('/
([sS]*?)
[sS]*?(]+)"|
)/',$zhidao,$wen); preg_match_all ('/wgt-replyer-all-uname[sS]*?> ([^>]+) [sS]*?

([sS]*?)
/',$zhidao,$da);
preg_match_all ('/其他类似问题[sS]*?

 

获取的参数有

标题

问题

回答

相关问题

 

第二版

<?php
//百度知道
$ch = curl_init(); //初始化
curl_setopt($ch, CURLOPT_URL, "https://zhidao.baidu.com/msearch/ajax/getsearchlist?word=111&pn=0");  //设置选项,包括URL
curl_setopt($ch, CURLOPT_TIMEOUT, 5); //PHP获取超时
curl_setopt($ch, CURLOPT_IPRESOLVE, CURL_IPRESOLVE_V4 );
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt ($ch,CURLOPT_REFERER,"https://zhidao.baidu.com");
$zhidao = curl_exec($ch);    //执行并获取HTML文档内容
curl_close($ch);      //释放curl句柄
$zhidao = json_decode($zhidao, true);
$zd = $zhidao['data']['entry'];
print_r($zhidao);

foreach($zd as $k=>$v){
    $tu ="";
    if (!empty($zd[$k]['title'])){
        $tu[$k] = '<img src="'.$zd[$k]['title'].'" class="s-img">';
    }
echo '<p style="clear:both;">'.$tu[$k].'<i class="fa fa-quora" aria-hidden="true"></i> <a href="/wenda/'.$zd[$k]['id'].'.html" target="_blank">'.strip_tags($zd[$k]['title']).'</a><br>'.strip_tags($zd[$k]['rcontent']).'</p>';
}

?>
<style>
.s-img{float:right;border-radius:3px;width: 121px;height: 83px;    background-size: cover;}
</style>
上一篇:360图片
下一篇:没有了

评论

说点什么吧
  • 全部评论(0
    还没有评论,快来抢沙发吧!