这就是我需要的东西。
以下为引用内容:
现在网上流行的小偷程序比较多,有新闻类小偷,音乐小偷,下载小偷,那么它们是如何做的呢,下面我来做个简单介绍,希望对各位站长有所帮助。
(一)原理
小偷程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。比如新闻小偷程序,很多都是调用了sina的新闻网页,并且对其中的html进行了一些替换,同时对广告也进行了过滤。用小偷程序的优点有:无须维护网站,因为小偷程序中的数据来自其他网站,它将随着该网站的更新而更新;可以节省服务器资源,一般小偷程序就几个文件,所有网页内容都是来自其他网站。缺点有:不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么小偷程序也要进行相应修改;速度,因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。
(二)事例
下面就XMLHTTP在ASP中的应用做个简单说明
<%
'常用函数
'1、输入url目标网页地址,返回值getHTTPPage是目标网页的html代码
function getHTTPPage(url)
dim Http
set Http=server.createobject("MSXML2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then
exit function
end if
getHTTPPage=bytesToBSTR(Http.responseBody,”GB2312″)
set http=nothing
if err.number<>0 then err.Clear
end function
‘2、转换乱玛,直接用xmlhttp调用有中文字符的网页得到的将是乱玛,可以通过adodb.stream组件进行转换
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject(”adodb.stream”)
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
‘下面试着调用http://www.3doing.com/earticle/的html内容
Dim Url,Html
Url=”http://www.3doing.com/earticle/”
Html = getHTTPPage(Url)
Response.write Html
%>
用ASP制作强大的搜索引擎
不知你上网时注意到没有:一些内容丰富的网站,总建有一个内容搜索引擎;一些大型的商业网站或者综合网站,都配有强大的网站搜索引擎,比如搜狐、新浪、雅虎等等。其方便的搜索查询功能至今给人们留下难以磨灭的印象,你只要输入你想浏览资料的关键字(比如:网页),一按“搜索”按钮,关于“网页”的资料列表就呈现在你的眼前;这只是搜索引擎的基本功能–搜索查询。笔者现在专门负责网上山东(http://www.china-sd.net)中山东搜索版块的建设,利用最常用的开发语言–asp开发搜索引擎的强大功能!下面我就搜索引擎主要组成部分和其中一些功能的实现代码讲解给大家,有什么不足之处请大家给予指出!
在这一章节中,我介绍一下搜索引擎的组成部分和主要功能。
搜索引擎的组成,大致分为三部分:
1、界面:这一部分主要是面向客户的,是可以看到的部分,比如您打开search.sina.com.cn事后看到的页面。
2、程序:这一部分主要是执行代码,根据客户的搜索要求去执行代码从而获得搜索结果;这些是我们看不到的。
3、数据库:所有的搜索引擎都离不开数据库,连著名的google.com也不例外;数据库是储存搜索资料的仓库,储存的越多,搜索得到的资料就会越多,这也是搜索引擎是否强大的闪耀点之一。
那么搜索引擎是否强大还有其他的闪耀点喽,是什么呢?对,搜索引擎数据库中的存储资料再多,我们不能够方便的去查找搜索,甚至查找不到所需的资料,那么这个数据库就是“死”的,毫无用处可言,所以程序代码起到非常重要的作用。
讲到这里,我应该给大家介绍一下搜索引擎的几个主要功能:
1、搜索查询:毫无疑问这是最基本的功能了,根据关键字找到符合关键字的相关资料。
2、分页显示:如果你搜索到的资料非常多,都放在一个页面里,那样给人的感觉就会使乱糟糟的一片;分页显示根据人们看书的习惯,将一部分内容放到第一页,其他的内容放到第二页、第三页等等。
3、搜索统计:一般包括查询资料的数量,分几个页面,每个页面含几个资料,当前页面资料范围等等。
4、搜索结果编排:搜索排名我想大家不会陌生,这些是综合网站搜索引擎挣money的一项措施,这也是强大搜索引擎中不可缺少的功能;比如根据点击量排名,根据收费排名、根据等级排名。
5、多个关键字查询:“如果要查找包含多个关键词的信息,可以用空格把关键词隔开”这是新浪搜索引擎版面中的一段文字,在一个文本框中打上多个关键字搜索查询资料。
6、整体统计:这个是对搜索引擎开通至今一些数据统计,包含“热门查询关键字”统计、数据库中资料整体统计、每个类别所含资料统计等等。
以上功能代码主要根据笔者的要求来书写,大家可以在我写的代码上做修改,以成为你自己需要的功能代码。
好了,经过了一节的热身后,我们也可以进入实战阶段,首先,我们先建一个数据库,作为资料的存储,这里我将数据库的文件名为information.mdb,使用access创建数据库,当然你也可以使用sqlserver创建。
建立四个表:www(存储资料),sort(大类),samll(小类),key(查询关键字)
1、www表:id—自动编号,sitename—站点名称,url—站点链接,faq—简要说明,key—关键字,time– -添加时间,level—站点等级,sortid—大类id,smallid—小类id,hot—站点点击次数。
2、sort表:id—自动编号,sort
3、small表:id—自动编号,small
4、key表:keyname—关键字;keyhot—出现的次数
用asp建立与数据库的连接:conn.asp
<%
on error resume next
connstr="DBQ="+server.mappath("information.mdb")+";DefaultDir=;DRIVER={Microsoft Access Driver (*.mdb)};"
Set conn=Server.CreateObject("ADODB.CONNECTION")
conn.open connstr
%>
说明:使用Server.MapPath()表示的路径为文件的相对路径,我这里conn.asp和information.mdb在同一个目录下。我想这些都很简单,大家很容易理解和接受的!好,将数据库建立起来后,我们就可以建设强大功能的搜索引擎。请期待哦!嘻嘻~~~~
用asp制作强大的搜索引擎 — 模糊搜索
根据一个关键字,搜索到相关的资料,这里的“相关”是指资料中有类似这个关键字的字符串。例如:“山东”这个关键字,只要数据库中资料里包含“山东”这个关键字的都要把它们找出来。模糊搜索的应用其实很简单,只要使用一个sql语句就可以实现,下面咱们看看他的语句的写法。
sql语法中你会发现这么几个判定词:LIKE、NOT LIKE和 BETWEEN。 LIKE判定词是一个非常有用的符号。不过,在很多情况下用了它可能会带给你太多的数据,所以在用到它之前最好先开动脑筋多想想自己到底想获得什么数据。 NOT LIKE是反其道而行了。BETWEEN假设你想取出一定范围内的数据,而且你事先知道范围的起点和终点,那么你不妨采用BETWEEN 判断词。这几个判定词根据不同的环境使用,一般最常用的就是like和”%”结合了。
dim sql,key
key=request(”key”)
sql=”select * from www where sitename like ‘%”&key&”%’ or faq like ‘%”&key&”%’ or key like ‘%”&key&”%’ ”
说明:这里的sql语句目的就是检索数据库中sitename字段中是否包含key,faq字段中是否包含key,key字段中是否包含key,这样做的目的是让搜索的范围包含到“站点名称”、“站点简要说明”、“站点关键字”。如果你只想搜索关键字只要使用 sql=”select * from www where key like ‘%”&key&”%’ ” 就可以了。“like”中都使用了“or”来相连,“or” “或者”的意思,意思是不论哪一个like 符合条件,都要把搜索到的资料输出显示出来。
OK,现在大可不必去看看能不能执行或者说执行的结果如何,因为搜索引擎大部分功能的实现都是靠sql语句的书写了。等我把其他的相关sql语句的功能实现介绍完后,大家再看看效果,呵呵!别着急!!
需要用到fso和msxml,需要看一些例子,找到了这些
http://www.ddvip.net/web/asp/index7.asp
http://msdn.microsoft.com/library/en-us/xmlsdk/html/dom_reference.asp
利用fso制做
(右下角)站点当前容量。好像和本机查看的容量不太一样,本机大概十几个G,这里只能看到大约6个G多。(有时间完善修改-2004-10-23)
希望用xmldom或者xmlhttp取得refer页面的标题,研究中…
没错,就这么一点
[Ctrl+A 全部选择 提示:你可先修改部分代码,再按运行]
详细原因可以参见
http://www.quirksmode.org/css/100percheight.html
!blueidea 郭爽的Blog 龚睿
刚开始奇怪为什么要写成正则替换
!blueidea
的方式(为了正确显示,使用了全角的英文!),而不是直接替换“blueidea”后来才发现,因为在链接或者图片路径中可能也会出现blueidea的字符,而全部替换就会导致图片或者链接失效。中文关键字就没有这个问题,:)
不知道别人是怎么解决这个问题的。
[Ctrl+A 全部选择 提示:你可先修改部分代码,再按运行]
http://dxcode.net/pr/index.php
这个也可以查,还可以查 alexa排名
http://www.guanqun.com/googlealexa.aspx
这个问题困扰我很久,突然看到这个文章
http://www.fiftyfoureleven.com/sandbox/weblog/2004/mar/lists-vs-divs/
Should we use lists instead of divs?Posted Mar-19-2004 Skip to the discussion (now closed): 2 comments
Via Tanketism in Anne Van Kesteren’s weblog, I found Absolute Lists: Alternatives to Divs.
In summary, the author suggests replacing your
This article discusses how to get rid of div elements altogether, and step into a world of pure semantics utilizing only lists for an entire page.
Now, why would we do this?
Because our content is really just a big list?
Because using
Lets look at these individually.
Because our content is really just a big list
Now, from what the specs say about lists one could argue that the information contained in an html document is, if anything, “Ordered information”.
However, one look at example 1 from the article and its source code and it becomes obvious that this is just not semantically good.
A header and then it’s content on the next list item? In a nested unordered list no less? I feel like I’m heading back to tables!
Even if one could work out a sematically valid way of presenting this information (perhaps the header and it’s subsequent content held within the same
pair), do we need it?
Because using
Clearly something has been overlooked here, and part of what is missing can be found by reading Grouping elements: the DIV and SPAN elements from the W3C specs.
So now it begs the question: Is there something confusing to user-agents about the sequence of our documents?
The specs say it all and there’s no reason to read further than the section about headings:
A heading element briefly describes the topic of the section it introduces.
No list required, when we venture to the next topic, we can use a header.
As far as the order is concerned, right to left, top to bottom:
lang="en" xml:lang="en">Summary
In summary, there is no need to mark up traditional documents as lists. Using
Using headings and presenting content contained between headings from one logical thought to another takes care of the order of our document.