php爬虫执行js,php执行js

当我们使用php爬虫采集网站时经常会遇到内容使用ajax异步加载。一般采取的方案是PHP模拟再请求api接口获取数据,但是有时候前端js加密非常麻烦,我们需要将js的加密方法转换为php方法方便curl请求。当然通过了解我们可以通过3种方案解决。

第一种:使用phpv8js扩展执行js代码。(pecl自行下载安装,windows安装方法http://www.yuzhiwei.com.cn/archives/238.html/comment-page-1)

<?php
//初始化
$v8 = new V8Js();

//js代码
$js = "
    var char = 'abcdef';
    var password = '123456';
    function sign(char,password)
    {
        return char+password;
    }
    var token = sign(char,password);
    token;
";

//尝试执行js
try
{
    $ret = $v8->executeString($js, 'auth.js');
    echo '执行成功:' . PHP_EOL;
    var_dump($ret);
}
catch (Exception $e)
{
    echo '代码异常' . PHP_EOL;
    var_dump($e->getMessage());
}

输出:abcdef123456

第二种:使用phantomjs加载网页,phantomjs软件内置一款webkit内核的浏览器,通过php的api调用完成真正的模拟访问,等待页面加载完成提取dom即可。(安装方法自行百度)

访客
邮箱
网址

通用的占位符缩略图

人工智能机器人,扫码免费帮你完成工作


  • 自动写文案
  • 自动写小说
  • 马上扫码让Ai帮你完成工作
通用的占位符缩略图

人工智能机器人,扫码免费帮你完成工作

  • 自动写论文
  • 自动写软件
  • 我不是人,但是我比人更聪明,我是强大的Ai
Top