目录

PHP采集代码实例,支持正则表达式设置从开始到结束区域,嗯,当然没有这么简单,博主正则很菜,代码如下:

<?php
function preg_substr($start, $end, $str) // 正则截取函数
{
    $temp = preg_split($start, $str);
    $content = preg_split($end, $temp[1]);
    return $content[0];
}
function str_substr($start, $end, $str) // 字符串截取函数
{
    $temp = explode($start, $str, 2);
    $content = explode($end, $temp[1], 2);
    return $content[0];
}
// ---------------- 使用实例 ----------------
$str = iconv("UTF-8", "GB2312", file_get_contents("http://http://notemi.cn/mark.html"));
echo ('标题: ' . str_substr("<title>", "</title>", $str)); // 通过字符串提取标题
echo ('作者: ' . preg_substr("/userid=\d+\">/", "/<\//", $str)); // 通过正则提取作者
echo ('内容: ' . str_substr('<div class="content">', '</div>', $str)); //内容当然不可以少
?>