PHP实现简单采集
<?php
for ($k=2; $k < 8; $k++) {
//选择你要爬的url 找到变量的规律(一般都是伪静态) 实现批量采集 这里用循环爬取6页
$subject="https://edu.51cto.com/courselist/286/p".$k.".html?cate_id=0";
//匹配你要采集的内容 找到变量 将变量替换成(.*?) 记得转义特殊字符
$pattern='/<div class="title" title="(.*?)">(.*?)<\/div>/';
//爬取网页的内容并且把它放入变量 注意要开启php openssl扩展
$str=file_get_contents($subject);
//进行正则匹配规则 匹配我们想要的内容 将匹配的内容放入一个二维数组$res
$int=preg_match_all($pattern,$str,$res); //$int代表匹配到的个数
//循环输出二维数组里面的每个元素
for ($i=0; $i<$int;$i++)
{echo $res[0][$i];}
}
?>
本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可。
评论已关闭