采集 相关的软件列表

asp采集抓取网上房产信息的代码
ASP

asp采集抓取网上房产信息的代码

2020-02-16 标签:asp,采集,抓取,网上,房产,信息,代码,实现,如下,language,vbscript,codepage,936,include,file,conn,inc,function,doctype,html

实现代码如下: Untitled Document ") getcont=RegexHtml(getcont) dim KeyId,NewsClass,City,Position,HouseType,Level,Area,Price,Demostra dim ContactMan,

首页

DeDecms实现更漂亮整齐的缩略图

2020-02-16 标签:dedecms,实现,漂亮,整齐的,缩略图,本身,php,允许,图片,进行,各种,截取,重新,生成,合并,压缩,操作,因此,追求,完美

本身php就允许对图片进行各种截取、重新生成、合并、压缩等操作,因此为了追求完美,你可以参考下文。 刚开始使用DEDE不久,最初采集发现自动生成的缩略图片其实是根据自定义的最大长宽,原比例的缩小原图片,不利于图片索引页排版,不得已CSS里采用了自动判断调整高宽—但比较耗资源。所以还是决定改改缩图函数

首页

雨哲浅谈关于防采集而不影响收录内容篇

2020-02-16 标签:浅谈,关于,采集,而不,影响,收录,内容,站长,头痛,的事,除了,程序,和服,安全

让站长最头痛的事,除了程序和服务器安全外,可能就要算内容被采集了。当然,现在网络本身就是资源共享,我这里不谈采集的对错,只是就防采集说说个人看法。一、如何分辨搜索爬虫以前,在网上看到过关于用asp代码来捕捉搜索爬虫的代码,通过代码把爬虫的访问记录记录到文件。就此代码(原作者未知)我作了修改,加入程序

关关小说采集器[杰奇]采集出错的修正方法
首页

关关小说采集器[杰奇]采集出错的修正方法

2020-02-16 标签:关关,小说,采集,出错,修正,方法,最近,突然,喜欢,上了,呵呵,感觉,不错,但是在,内容,图片

最近突然喜欢上了小说站,呵呵,用关关小说采集器采集了一下,感觉不错! 但是在 采集 内容是图片 的小说时,出现错误,如下提示: #HY000Incorrect integer value: ' null ' for column ' attachid ' at row 1 的错误! 经过寻找发现修改

首页

正则获取图片地址 链接地址

2020-02-16 标签:正则,获取,图片,地址,链接,实现,代码,如下,reg,img,href,src,s,ig,问题,采集,过程中,遇到,数据库

实现代码如下:reg = /]*src\s*=\s*('|")?([^'">]*)\1([^>])*>/ig 正则获取图片地址 一、问题: 采集的过程中遇到一个问题:从数据库里读出来的图片没有正常显示,分析后发现是数据库里的图片以网站根目录为相对路径方式存储,图片地址如:/uplo

首页

vbs或asp采集文章时网页编码问题

2020-02-16 标签:vbs,asp,采集,文章,网页,编码,问题,intro,研究,很长时间,最近,设计,友情链接,检测,脚本,而与,链接,的人,页面,很可能

'/*=========================================================================' * Intro研究网页编码很长时间了,因为最近要设计一个友情链接检测的VBS脚本,而与你链接的人的页面很可能是各种编码,以前采取的方法是:如果用

首页

asp只采集网站可见文本的正则

2020-02-16 标签:asp,只采,网站,可见,文本,正则,写的,function,origincode,dim,reg,set,n,ew,regexp,ignorecase,true,global

我写的是这样: Function ClearHTMLCode(originCode) Dim reg set reg = new RegExp reg.IgnoreCase = True reg.Global = True reg.Pattern = "()" originCode= reg.Rep

首页

简单的asp采集代码教程

2020-02-16 标签:简单,asp,采集,代码,教程,第一步,分析,页面,使用,浏览器,打开,http,sports,sina,com,cn,k,2008,09,15

采集开始 第一步是分析要采集的页面。  使用浏览器打开要采集的页面(如:http://sports.sina.com.cn/k/2008-09-15/04593948756.shtml,你可以其他页面),打开后,点击右键,查源文件。 第二步,找到要采集的内容所在位置。 假如我要采集这个页面上的标题和

首页

利用PHP制作简单的内容采集器的原理分析

2020-02-16 标签:利用,php,制作,简单,内容,采集,原理,分析,前几天,做了,小说,连载,程序,更新,麻烦,顺带,写了,八路

前几天做了个小说连载的程序,因为怕更新麻烦,顺带就写了个采集器,采集八路中文网的,功能比较简单,不能自定义规则,不过大概思路都在里面了,自定义规则可以自己来扩展。   用php来做采集器主要用到两个函数:file_get_contents()和preg_match_all(),前一个是远程读取网页内

首页

asp代理采集的核心函数代码

2020-02-16 标签:asp,代理,采集,核心,函数,代码,function,proxypage,url,set,retrieval,msxml,setproxy,255,80

Function ProxyPage(url) Set Retrieval = CreateObject("MSXML2.ServerXMLHTTP.5.0") With Retrieval .SetProxy 2 , "255.0.0.0:80" '代理ip:代理端口 .Open "Get", u