@curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.0)"); ob_start(); $result = @curl_exec($ch); $content = ob_get_clean(); ob_end_clean(); @curl_close($ch); return $content; } //取出script和style标签 public function stripHTML($string){ $pat = array( "/<script[^>].*?>.*?<\/script>/i", "/<style[^>].*?>.*?<\/style>/i" ); $rep = array('',''); return preg_replace($pat,$rep,$string); } //去除数组元素的标签 public function stripTags(&$arr){ foreach ($arr as $key => $val ) { if(is_array($val)){ $this->stripTags($arr[$key]); } else{ $arr[$key] = strip_tags($val); } } return $arr; } function show(){ echo "<pre>"; print_r($this->_sites); echo "</pre>"; } //End Class Engine } $engine = new Engine('http://www.163.com'); $engine->start(); $engine->show(); ?> 这只是引擎的主要部分,接下来要做的就是把相关信息存入数据库,然后接着对所有获取的连接再去检索,然后把相关信息再存入数据库,那么核心部分就是我们获取了这些信息之后根据信息内容来设定网站的关键字,然后给他一个排名,供以后搜索。设定网站的排名和关键字只能你自己去想了。 (责任编辑:laiquliu) |