使用PHP的cURL库可以简单和有效地去抓网页。你只需要运行一个脚本,然后分析一下你所抓取的网页,然后就可以以程序的方式得到你想要的数据了。无论是你想从从一个链接上取部分数据,或是取一个XML文件并把其导入数据库,那怕就是简单的获取网页内容,cURL 是一个功能强大的PHP库。本文主要讲述如果使用这个PHP库。
启用 cURL 设置
首先,我们得先要确定我们的PHP是否开启了这个库,你可以通过使用php_info()函数来得到这一信息。
<?php
如果你可以在网页上看到下面的输出,那么表示cURL库已被开启。
如果你看到的话,那么你需要设置你的PHP并开启这个库。如果你是在Windows平台下,那么非常简单,你需要改一改你的php.ini文件的设置,找到php_curl.dll,并取消前面的分号注释就行了。如下所示:
//取消下在的注释
如果你是在Linux下面,那么,你需要重新编译你的PHP了,编辑时,你需要打开编译参数——在configure命令上加上“–with-curl” 参数。
一个小示例
如果一切就绪,下面是一个小例程:
<?php // 设置你需要抓取的URL // 设置header // 设置cURL 参数,要求结果保存到字符串中还是输出到屏幕上。 // 运行cURL,请求网页 // 关闭URL请求 // 显示获得的数据
如何POST数据
上面是抓取网页的代码,下面则是向某个网页POST数据。假设我们有一个处理表单的网址http://www.example.com/sendSMS.php,其可以接受两个表单域,一个是电话号码,一个是短信内容。
<?php
从上面的程序我们可以看到,使用CURLOPT_POST设置HTTP协议的POST方法,而不是GET方法,然后以CURLOPT_POSTFIELDS设置POST的数据。
关于代理服务器
下面是一个如何使用代理服务器的示例。请注意其中高亮的代码,代码很简单,我就不用多说了。
<?php
关于SSL和Cookie
关于SSL也就是HTTPS协议,你只需要把CURLOPT_URL连接中的http://变成https://就可以了。当然,还有一个参数叫CURLOPT_SSL_VERIFYHOST可以设置为验证站点。
关于Cookie,你需要了解下面三个参数:
CURLOPT_COOKIE,在当面的会话中设置一个cookie CURLOPT_COOKIEJAR,当会话结束的时候保存一个Cookie CURLOPT_COOKIEFILE,Cookie的文件。 本文介绍如何使用PHP脚本修改Linux或Unix系统口令。 你必须安装下面的工具和软件: – 修改口令的Shell脚本; – Sudo 访问权; – Apache or Lighttpd web 服务器; – PHP服务端程序。 步骤1: 安装可以修改用户口令的shell脚本 该脚本可以实际用于修改Linux用户的口令(已在Linux和FreeBSD测试)。 例子: shell脚本代码 #!/bin/sh # \ exec expect -f “$0″ ${1+”$@”} set password [lindex $argv 1] spawn passwd [lindex $argv 0] sleep 1 expect “assword:” send “$password\r” expect “assword:” send “$password\r” expect eof运行shell脚本(下载链接): $ chpasswd username password 下载该脚本, 然后拷贝到你的web根目录或者Web服务器的其它位置(用户可读): $ cp chpasswd /var/www/或者, 如果你使用Lighttpd Web服务器: $ cp chpasswd /home/lighttpd 步骤2: 通过sudo以root身份执行命令 Apache或Lighttpd Web服务器进入后台运行后会马上使用非root权限。这样可以很好的防止口令修改, 就像passwd命令需要root权限才能修改其它用户帐号的口令。 通常, Apache 2使用www-data用户, Lighttpd使用lighttpd用户(皆为普通用户, 非root用户)。使用root用户登陆, 然后执行下面的命令: # visudo现在你的web服务器允许执行口令修改脚本(chpasswd)。如果你使用Apache Web服务器, 执行下面的命令: www-data ALL=NOPASSWD: /var/www/chpasswd或者, 如果你使用Lighttpd Web服务器, 执行下面的命令: httpd ALL=NOPASSWD: /home/lighttpd/chpasswd保存和退出文件。 步骤3. 创建一个基于PHP的接口 现在你需要写一个php脚本。这里有一个php脚本实例。你可以根据你的需要来修改。至少你需要正确设置好的shell脚本位置。打开php脚本和找到shellscript一行: $shellscript = “sudo /home/lighttpd/chpasswd”;修改shellscript指向到正确的位置。PHP的源代码从这里下载: 步骤4: 运行脚本 在你的web浏览器地址栏输入网地址 - https://mydomain.com/changepassword.php。你将会看到用户名和口令提示: 如果口令修改成功, 你会得到的确认提示: 由于一些原因, 如果口令修改失败, 你可以参考下面提示获得更多详细的错误信息: 步骤5: 安全 ◆永远不要通过http协议直接运行上面的脚本. 而是使用https协议。 ◆把脚本放入到受口令保护的目录。 ◆永远不要信任用户的输入。上面的php脚本只是一个例子。在现实的生产环境中, 你需要考虑采用更强大的用户输入确认。讨论PHP编程的安全超出了本文的范围。你可以参考一本好的PHP书籍或者使用你喜欢的搜索引擎搜索相关的网站。 HTTP服务器认证
最后,我们来看一看HTTP服务器认证的情况。
<?php $data = curl_exec(); |