本站创建于2006年,博主为Delphi老码农,暗黑忠实粉丝,主要用于学习经验分享
该日志由 samool 发表于 2020-02-16 15:09:00
QueryList不依赖任何框架和架构,它可以单独使用也可以引入到任意的PHP开发框架中去使用,如:Laravel、ThinkPHP;你可以使用它来构建简单的采集系统,也可以用它才构建高可用的分布式采集系统。它提供了丰富的基于CSS选择器的页面抽取API,完全模块化的设计,拥有强大的可扩展性。
QueryList 提供的一整套内容采集解决方案
QueryList官方网站
http://www.querylist.cc/
采集typecho文章列表页所有标题及对应URL
<?php
require 'vendor/autoload.php';
use QL\QueryList;
$url = 'https://xiaaijun.com/archives/';
$rules = array (
'herf' =>
array (
0 => 'div#archives>ul>li>a',
1 => 'href',
),
'title' =>
array (
0 => 'div#archives>ul>li>a',
1 => 'text',
),
);
$data = QueryList::get($url)->rules($rules)->range('')->queryData();
print_r($data);
输出内容:
上一篇: PHP对HTML标签转义及反转义 下一篇: GitHub 发布 2019 年度透明度报告
仅有一条评论 »
谢谢分享,学习到啦~