菲律宾优德娱乐正规吗

下一个 向上的 以前的


下一代网络搜索:设置dafa888登陆注册 的网站

玛蒂A.赫斯特
加州优德官网 伯克利分校,
http://www.sims.berkeley.edu/¨赫斯特

IEEE数据工程公告,
下一代专题网络搜索,Luis Gravano(编辑),
2000年9月。

摘要:

目前的网络搜索在引导用户方面最为成功到适当的网站。一旦进入网站,用户可以选择跟踪超链接或使用网站搜索,但后者是出了名的问题。一个解决办法是发展专门化明确支持任务用户类型的搜索接口使用特定于站点的信息执行。一种新的方法支持基于任务的站点搜索是动态呈现合适的组织搜索结果并建议查找内容的元数据接下来,作为搜索和超文本的个性化混合。

介绍

调查显示,搜索引擎用户满意度上升最近。一项调查显示,80%的搜索引擎用户说他们总能找到他们想要的东西[21]. 这是一个在平均查询长度仍然很短的情况下,令人惊讶的结果-大约2个字。人们怎么能找到他们想要的东西呢这么短的询问?

由于没有公开发表的大规模分析,dafa888登陆注册 目前不得不猜猜看。我想答案是,总的来说,大多数人使用网络搜索引擎来寻找好的起点-讨论感兴趣主题的网站主页。关于``“辣根”很普遍;它并不表示它是什么用户想知道或做辣根,所以最好的事情是搜索引擎所能做的就是提供关于辣根,用户可以更详细地阅读。

这是一个多阶段的搜索过程,从一般查询和然后变得更具体,在非网络搜索中有很好的记录[14]. 像Dialog和Lexis Nexis被教先写一个一般的查询,看看怎么写返回了许多(数千)个结果,然后优化查询附加条款,直到产生合理数量的文件。在这些旧系统中,用户必须首先选择一个集合,或者来源,搜索。许多搜索者都是专业人士知道很多年后哪些来源是可用的经验。

相比之下,在web搜索中,初始查询的目的似乎是主要是选择来源-一个感兴趣的网站。一次在源代码处,用户可以选择使用超链接进行导航通过多页可用信息,或使用网站搜索。

在本文中,我使用术语“site”来表示具有某种统一主题的信息。这可能是一个建筑图像、食谱等项目的集合,或者是生物医学文献,或者电子商务公司的目录,或者公司或优德官网 的内部网(主题是工作的种类和人们使用的信息组织),或者开始被称为垂直的“vortal”门户网站,它提供了关于主题。FindLaw是vortal的一个例子,提供搜索超过几十个不同的法律来源,包括法律杂志,美国最高法院的判决和法律新闻。

主要的搜索引擎公司现在提供特定于站点的搜索他们产品套件的一部分。例如,Inktomi宣布计划开发一个允许灵活划分信息集,允许为文档分配权重取决于它们出现在集合的哪个部分以及什么与它们相关联的各种上下文[19]. 最好利用这一潜在的强大设施,需要了解如何有效地组合这些信息。

在网络搜索的早期,像“辣根”这样的查询很可能已经检索到了一些感觉像是随机页面的内容。但是两个从那以后事情变了。首先,更多高质量的内容在众多的主题中都能找到,第二,搜索引擎现在专注于返回最终版本地点,而不是页面这样一般的疑问。例如,搜索``“辣根”在Lycos上找到了辣根信息的链接委员会,列为

娱乐>食物
商业>工业>食品和相关产品>水果和蔬菜

web目录类别,以及百科全书条目的点击率辣根与

参考>百科全书>Microsoft Encarta>H
参考>百科全书>百科全书。com>H公司

类别。接下来是各种食物的主页产品公司。(很遗憾,dafa888登陆注册 不能运行相同的查询使用1996年的搜索引擎进行比较。)

搜索引擎在分类标签上显示点击量的事实是重要的,因为web目录类别及其关联链接,被手动选择为具有代表性的起点搜索。baidu 搜索引擎以使用超链接inlink而闻名信息排名的网页,基于的想法,如果许多网页链接到页面,链接到页面的质量可能更高(递归地)因为它实际上是作者“推荐”的其他页面的。其他人也记录了使用用于评估页面质量的链接信息[12,1]和其他网络搜索引擎使用此信息。然而,谷歌现在也加入了在搜索结果中输入分类信息,列出分类标签在搜索结果下面,如果该类别已分配给它。对一般性简短问题的非正式测试平均2.7次排名前十的热门歌曲。1

最近的一项研究[1]提供了有趣的证据网站中的页数是预测至少对于流行的娱乐话题来说是基于链接的排名。换句话说,根据inlink,一个主题上最受欢迎的网站information是那些在主题;好消息来源。这支持了一个论点,那就是什么网络搜索最擅长的是让人们找到正确的网站或收集,然后开始复杂的信息查找。

网站搜索和任务

在一个精心设计的网站,超链接提供了有用的提示在它们的背后,以及下一步要去哪里,一个特征也被称为``气味''[5,16]. 一位可用性专家声称一般来说,用户不会太反对以下许多链接因为他们反对必须遵循不明确支持的链接他们的任务。如果用户不确定下一步要去哪里或必须求助到“后退”按钮,网站的可用性可能会降低戏剧性地[20].

当用户不得不使用搜索工具时,结果在一个网站上通常是无序的和显示断章取义,而不是指出各种点击在网站。可用性专家和电子商务研究人员都对质量低劣的网站搜索,并声称数十亿的业务每年因网站设计和网站搜索不佳而损失惨重[20,11].

什么是解决方案?考虑下面的类比。跟随超链接就像坐火车,而使用网站搜索就像驾驶全地形四轮驱动汽车。在火车上,那里是一个固定数量的选择去哪里和如何到达那里。从托皮卡到圣达菲你得经历冻伤瀑布不管这对你是否有意义。另一方面,你是不太可能迷路-如果你看看你在地图上的位置,所有很清楚。相比之下,四轮驱动的陆地巡洋舰会带你去任何地方,但你可能会被夹在你的行踪完全迷失了方向。

理想的搜索界面采用了每种技术的最佳方面。dafa888登陆注册 想要一个神奇的火车系统在新的轨道上根据dafa888登陆注册 的位置提出有用的方向到目前为止dafa888登陆注册 正在努力做的。铁轨沿着把土地铺好,但要越过裂缝,找到所有有用的东西地球的一部分。它们还允许dafa888登陆注册 随时备份在每个选择点都有不同的路线。

任务的重要性

找出铺设这些铁轨的最佳方法是非常重要的,因为就像有很多关于这些的信息网站上,人们使用的方式也有很多种信息。为了减少可能的路线,搜索界面以及网站结构应该反映人们对网站做了什么,也就是说,什么任务他们尝试在现场完成。

JaredSpool的研究公司最近的一项研究揭示了这种重要性网站使用中用户满意度的任务完成[18]. 研究比较了10个不同的地点;每个参与者搜索他们感兴趣的信息每个站点。之后,斯波洛的团队要求参与者进行评分根据网站的速度来判断。令人惊讶的是,页面下载之间没有关联速度和感知速度等级。事实上,参与者认为下载速度最快的网站是最慢的,反之亦然。

然而,知觉速度与参与者在实现他们在现场。这也与参与者的强烈程度有关以为他们通常“知道下一步该怎么做”在他们的任务。Spool的结论是相关证据表明如果目标是提高感知速度,那就更重要了专注于网站设计,帮助用户完成任务,而不是专注于任务无关的特性,比如下载速度。

我现在已经说过,网站搜索应该反映一个用户的任务想在网站上完成,我建议了一个比喻关于一辆神奇的火车,它能根据你想去的地方铺设轨道去看看你到目前为止所做的,一个融合了超文本和搜索。在本节剩下的部分中,我将更详细地描述这个想法,并概述dafa888登陆注册 在这个方向。

元数据

在dafa888登陆注册 想出这个新主意之前,还需要一种配料。这就是元数据的概念。元数据通常被称为意思是“关于数据的数据”。大多数文档都有与它们相关联的元信息,即描述文档的外部属性,这有助于确定它及其产生和使用的环境。这些属性包括作者、出版日期、篇幅文档、发布者和文档类型。

此外,面向内容的主题或类别元数据已经成为最近几年比较流行,很多人对此感兴趣在描述不同领域内容的标准中。网状物像Yahoo和looksmart这样的目录是dafa888登陆注册 熟悉的例子如上所述,网络搜索引擎已经开始在包含其他搜索结果的分类标签。

医学文献、建筑等收藏图像具有更丰富的元数据;有些物品有一打甚至更多附加到它们的内容属性。想想类别元数据由:正交集类别的集合,它们一起可以用来描述一个主题。医学领域,不同的方面是疾病类型,药物类型,生理学,手术类型,病人类型,等等这些类型的面的复杂组合,每种类型有层次结构。例如,一篇题为``吸入和全身皮质类固醇治疗:它们有助于哮喘患者吸气性肌无力指定网格类别类固醇抗炎药,哮喘,肌肉疾病,呼吸肌,吸入给药,成人,倍氯米松,病例对照研究,强的松,风险因素,等等。

研究人员早就报告说,在搜索中使用元数据是有问题,因为分配的标签通常与用户不匹配期望[15,6]. 此外,类别元数据是经常不一致。不过,我相信搜索结果中的元数据未得到充分利用,可能会产生显著改进,尤其是支持基于任务的搜索拥有大量类似风格的物品(如生物医学文章、建筑图像和食谱)。

元数据可以作为自由文本的对比,因为自由文本和元数据都可以搜索,但是自由文本查询通常必须服从相关性排序,元数据可以像在标准数据库查询中那样检索。更容易的是准确地实现查询“查找已将类别标签“肯定行动”分配给实施``查找所有关于平权行动的文件'。

例如:享乐主义

写这篇论文的结果是,我的网站我认为你的注意力集中体现了我认为可以有助于使用元数据改进面向任务的站点搜索。2在这种情况下,收集是配方信息;实际上是一个数据库问题(不需要模糊匹配),但很多想法都可以向信息检索的模糊需求转移。食谱是关于分层分面元数据是大家都熟悉的。这个伊壁鸠鲁使用的方面是主要成分,烹饪,准备方法、季节/场合和课程/菜肴。每一个都有子类别;例如,课程/菜肴的子类别包括开胃菜,面包,甜点,三明治,酱汁,面和蔬菜。该系列有超过11000个食谱。

配方的标准搜索界面要求用户选择关键字搜索或向下搜索类别层次结构。例如,在一个不同的配方网站(称为猛增)选择主菜>家禽,得到57个菜谱。为了进一步完善这些选择显示其他超链接类别:

家禽:鸡肉食谱
家禽:鸭子食谱
家禽:野鸡
家禽:游戏食谱
家禽:鹅
家禽:火鸡

选择鸡肉会检索到一份约40份食谱和两份以上的食谱子类别:

鸡肉开胃菜
糖尿病鸡食谱

如果我开始的话,我也可以找到鸡肉开胃菜开胃菜类。不过,如果我想看意大利语以鸡肉为主菜的食谱,我必须首先选择Region>Italian,然后查看所有665份意大利食谱。网站也一样允许在类别上搜索特定术语,因此我可以执行在意大利区搜索“鸡肉”,希望一切顺利。

这个接口的一个问题是我没有知道有多少配方有一个给定的属性,直到我遵循链接。在什么时候知道这些信息会更有用必须决定下一步去哪里。研究人员人机交互社会倡导的重要性这种情况下的信息预览[17]. 另一个缺点是指在给定的条件下发生的子范畴的不规则性类别。为什么只有开胃菜被列为一个特殊的类别,但是不是主菜?

在大多数情况下,配方查找是浏览和搜索任务,所以是dafa888登陆注册 关于组合的想法的主要候选两种技术中的佼佼者。享乐主义网站做得很好干这个。在这个网站上,在选择了主要成分>家禽之后,图1如图所示。


  
图1:一个享乐主义网站的方法草图用于浏览描述配方集合的动态元数据。在选择主菜类型(家禽)后,用户可以对结果使用四种其他类型的元数据。
\开始{figure}\开始{center}\开始{tabular}{\vert\vert p{3cm}p{3cm}p{3cm}p{3cm}p{。。。…}{\vert\vert l\vert\vert}{…}\\\hline公司\结束{tabular}\end{center}\结束{figure}

这个视图允许我减少其他元数据方面。它还告诉我将产生多少个食谱如果我根据一个如果在它的次层级的术语。如果我选择开胃菜图形视图2结果。


  
图2:图形结果修正结果1通过选择开胃菜元数据类型。
\开始{figure}\开始{center}\开始{tabular}{\vert\vert p{3cm}p{3cm}p{3cm}p{3cm}p{。。。…}{\vert\vert l\vert\vert}{…}\\\hline公司\结束{tabular}\end{center}\结束{figure}

请注意,我已经动态地创建了这个类别组合。可以从菜式>开胃菜开始,然后通过主要成分>家禽,结果是在同一点上。

现在我可以通过选择一种制剂来进一步完善配方类型,上面显示了其子层次结构。或者,我可以选择菜肴,系统会显示同一套44只鸡开胃菜的食谱根据烹饪类型而定,如加勒比海,意大利人,低脂,对孩子友好。

该网站还允许搜索文档子集。在示例中在上面,我可以搜索44个鸡肉开胃菜食谱来分离包括鳄梨或其他成分的。搜索也是允许在整个数据集中使用。但是,搜索的结果是显示为一个长长的无序食谱列表,因此失去了好处浏览界面的。但是,有一个高级搜索表单它允许用户选择一组主要成分和其他元数据类型。与浏览相比,它受到了影响然而,在不帮助用户避免空或大结果集。

此接口支持对多个不同的各种与食谱相关的任务,例如“帮我找个夏天”意大利面,“(配料类型与事件类型),‘我怎么能用鳄梨在沙拉里(配料类型与菜肴类型)以及``如何烘焙鲈鱼(配制型和成分型)。它没有支持其他任务,如菜单规划和客户组织评论。

示例:Yahoo

epicurious网站提供了一个很好的例子来说明如何合并元数据进入搜索过程中,充当一种动态确定的超链接。这不同于Yahoo的目录结构,其中路径由前进。Yahoo目录确实合并了某些类型的元数据-最显著的地区类型与其他类别混杂在一起-但通常只有两种类型的组合不跟踪用户希望看到的内容。例如,查找UC伯克利下面的链接,我点击的链接是优德官网 和优德官网 >大专院校>美国>美国>优德官网 加利福尼亚的>校园>伯克利.这使用了交叉链接(符号链接),因此当我终于看到加州优德官网 伯克利分校的链接时,分类是:U、 美国各州>加利福尼亚>教育类>优德官网 和优德官网 >公开>加利福尼亚优德官网 >校园.之后点击伯克利,这是一个新的分类标签关于加州优德官网 伯克利分校的信息U、 美国各州>加利福尼亚>城市>伯克利>教育类>优德官网 还有优德官网 >公开>加州优德官网 伯克利分校.这条路和我走过的那条完全不同超链接。来处理大多数类别都是最好的通过多种元数据,雅虎做了大量的交联这会导致遍历的实际类别标签在用户。一个允许用户选择哪些类型的元数据的系统视图下一步应该更有效。

与这种笨拙地使用元数据相比,雅虎有一个很好的方法动态链接其餐厅选择网站的元数据。顶层它提供了帮助任务选择的链接餐厅,包括地图和电话簿。在任何人之前可以进行搜索时,用户必须导航区域元数据选择城市的层次结构。然后用户可以选择一种菜肴链接或发布有关餐厅名称或菜肴类型的查询,产生符合这些标准的餐厅名单。之后选择特定餐厅的超链接时,用户会看到餐厅信息摘要,包括按“查找附近”标签分组的链接。这些链接包括电影、酒吧、俱乐部和咖啡馆都可以在地理位置上找到所选餐厅的邻居。(研究人员也提供此类功能[4]). 还有一个标有“更多A&E”的链接(A&E表示艺术和娱乐但这打破了概念模型,其中列出了城市,而不是那些仅限于附近选定的餐厅。

从本质上说,雅虎认为很多用户在搜索餐厅收集实际上是在从事一项更大的任务被解释为老套的“寻找晚间娱乐”任务:晚餐和附近的电影。两个元数据方面组合在一起这里:区域层面和娱乐层面,娱乐方面的两个次级层次已经联系在一起一起-餐厅(有美食属性)和电影。

集成搜索

epicurious站点在动态建议元数据方面做得很好为了帮助用户有组织地减少文档集,利用信息预览显示有多少文档每次选择后的结果,并允许用户轻松备份到在搜索过程中通过单击超链接的早期状态表示目前为止的路径。但是,接口没有将搜索结果交织到类别结构中,然后直接的改进是组织搜索结果根据用于浏览界面。

但是,一个大型的文本集合如MedLine集合生物医学文摘的搜索和组织比像是食谱。可能需要额外的设施来申请这种动态元数据接口量大如医学文本,且信息检索风格排名靠前可能需要与关键字搜索一起帮助分类结果。此外,元数据在某些情况下更具有层次性与配方示例相比,还有更多类型的元数据可用,所以在任何给定的时间只显示一个子集。系统应该动态确定类型要显示的元数据,基于用户到目前为止做了什么以及他们过去的历史(这个想法在其他情况下被追求[10,13]). 例如,为患者开药的临床医生可能希望始终能够查看与此患者的特别过敏。

示例:生物医学文本

考虑下面的例子。比如一个叫Care医生需要找到有关使用可的松注射作为针对特定病人的哮喘治疗方法。使用dafa888登陆注册 提议的系统,医生护理可以从选择一个初始类别开始通过直接键入某些术语。假设她已经知道了高级概念的网格类别标签哮喘类固醇但不想记住类别更具体术语的标签。通过直接指定这些标签,收藏。4这将返回99篇文章,其中包含共有2000个网状主题标题,其中577个是唯一的。

显示了一个接口的示例把上面讨论过的想法结合起来。系统为护理医生提供了一种方法来开始处理这种大的结果集。它表示到达这一点的路径两篇文章的标题,下面的建议,下面是完整的文档列表。


  
图3:提出的浏览方法的草图搜索生物医学文本。
\开始{figure}{\small\开始{center}\开始{tablar}{\vert\vert p{4.4cm}p{4.4cm。。。…ert\vert}{$~~~$\it…}\\\hline\hline\结束{tabular}\end{center}\end{figure}

在顶部显示了一个超链接路径,指明了所做的两个选择远。这些链接允许用户轻松返回到早期阶段在航行过程中;通过选择哮喘link,Care医生会看到与这个术语相关的文件,不依赖类固醇。

下面是一个框,显示一些选定的文档标题。这是一篇评论文章和一个荟萃分析,这是适当的考虑到目前为止导航过程中使用的高级术语。其他评论也存在于这个结果集中,但是讨论具体的类固醇等在这一点上没有显示。这说明了另一个问题重要思想:搜索界面应该与检索到的文档符合当前导航的一般性国家。例如,在搜索的早期阶段,概述文章应该显示出来,但是随着搜索变得更加具体,所以应该是文件。

标题框下面是类别列表。左撇子侧面显示了化学物质的类固醇部分的子集网格。只有类固醇子树中发生的那些类别在这个结果集的99个文档中显示了重要的内容。甾体元数据层次结构隐式地显示了甾体的哪个分支他们所居住的家庭,以及这些文件的数量指特定类固醇的亚集合。因此用户看到了一个预览,如果他们添加了这些术语中的任何一个,将会发生什么到查询;结果将大大减少。而是用户只需单击类别标签,从而导航到搜索空间的一部分它包含类固醇术语和其他术语远。用户随后可以通过按照屏幕顶部的超链接路径。

右边的一列显示了用户首选的类别集成到接口中。说Care医生关心这种特殊的肌肉骨骼和耐药性问题病人。这些类别将出现在结果的所有视图上集合,以及集合中有多少文档的预览。这些首选项可以由用户直接指定从以前的选择,或基于引文结构或受欢迎程度在页面访问方面。最后,用户可以选择全部查看与当前集中的文档相对应的类别,如果首选覆盖系统的组织设施。

显示器的最底部允许Dr.Care扫描直接检索结果,还允许她重新排序标题以各种方式。按受欢迎程度排序要考虑其他用户已查看文档。它还提供了一个“排序依据”类固醇'选项。这是因为类固醇是最近才出现的选择的类别(这也是它出现在左手类别中的原因列)。结果排序将使用用类似的甾体对文档进行亚层次分组一起。最后,用户可以调用集群选项来显示根据文件的总体情况显示文档的文本或图形共性[9].


正如这些来自不同领域的例子所显示的那样,它们之间存在着共性支持域间有效的搜索策略。在dafa888登陆注册 的新的研究项目,弗拉门戈,dafa888登陆注册 正在调查这些想法以新颖的组合方式使用元数据进行灵活的信息访问。dafa888登陆注册 的最终目标是开发一个通用的方法来指定面向任务的搜索界面跨越了各种领域和任务。dafa888登陆注册 建议在一个灵活的向用户提供关于下一步要去哪里的信息的方式这些建议和提示反映了用户的个人任务。

网站搜索的其他方法

专用接口

另一种改进网站搜索的方法是创建一个专门的将站点上的信息结构引入帐户。dafa888登陆注册 的一个研究项目在尝试改进内部网搜索。内部网包含这些信息与一个组织的内部运作有关这个名为chacha的系统以如下方式组织web搜索结果反映组织的基本结构。“大纲”或“目录”由first创建记录从根页面到每个web intranet中的页面。用户发出查询后,这些最短路径被动态地组合在一起形成一个分层的轮廓搜索结果出现的上下文[]. 例如,查询“地震”的点击率将显示在机械工程系,一个科学教育项目,以及指示紧急疏散计划的管理页面。

这个界面已经被部署为加州优德官网 伯克利分校的网站搜索引擎在过去的两年里,平均收到约200000个查询月。根据用户访谈和调查,有时有助于查看搜索命中发生的上下文,尤其是当查询没有产生好的结果时。另一方面如果搜索结果是相对简单。此外,内部网的结构并不总是反映用户的任务;通常是其他的组织起来会更合适。例如,用户试图了解有关老生伐木影响的研究关心正在考虑的不同种类的伐木,但是结果不是来自哪个优德官网 系。

另一个搜索接口的示例,它遵循信息是citeser接口[7]哪个专注于类型信息科学参考文献-而不是内容域。搜索结构反映了基本信息的结构:引文有超链接同一作者的其他论文,以及引用目标文章的文章。的搜索结果用户的集合被用于排名和生产信息统计,例如有多少篇文章引用了一个特定的作者的论文。界面显示了一些特殊的链接在一般搜索中是有意义的,并且是为什么人量身定做的搜索感兴趣的研究文献。

答疑

我相信还有很多其他的网络搜索方法会随着时间的推移而繁荣。包括租用专家网站,用户与在某一领域有专长的人进行匹配回答他们的问题是收费的。有些服务连接客户端和专家通过电话,避免了打字和通过移动设备(Keen.com和Exp.com是两个例子)。

自动回答问题的系统也在改进,这些将成为组织网站的重要补充更快、更便宜地处理客户问题。而不是从零开始生成答案,这些系统尝试将对最相关的句子、段落或已写入的信息页。它们不同于标准的搜索引擎使用问题和从中得出答案的文本。例如,一个关于磁盘已满时该怎么做的问题需要链接到有关压缩文件或购买新磁盘的答案。A用户询问“为什么我的电脑一直挂着?”想找到关于如何避免这种情况的信息,而用户询问``我怎么让我的电脑打印想知道如何扭转局面。问题的语法,以及内容词,决定了可接受答案的种类。

在一个有限的领域里回答问题可能是非常强大的,但它是在广阔的领域里更难。复杂的问题回答除了众所周知的AskJeeves,其中问题类型预先手动链接到具体的答案页。然而,研究人员[2,8]和公司(如AnswerLogic和Inquizzit)正在开发领域特定的自然语言处理算法和词汇资源在接下来的两到三年内大大提高了自动答疑功能年。

技术人员对可能发生的事情越来越感兴趣考虑了“真实世界”元数据。我的想法是“马自达好机修工在哪里?”应该自动注意提问者的当地时间和地点对附近的修车点提出建议并在提问时打开。这种需求情境感知问答系统有望发展壮大以及对网络移动设备的需求。

与通用Web搜索集成

回到本文的主题,什么是角色通用搜索引擎在上面提出的框架中?一般的搜索引擎应该朝着任务导向的方向发展解决方案,而不是面向集合的解决方案今天是奥兰迪。换句话说,搜索引擎需要匹配用户请求任务描述。朝这个方向前进的一步是用术语解释多单词查询他们的隐性任务。例如,使用文档类型确定要返回的结果。作为一个简单的例子查询“review”和另一个术语,如戏剧名称应该带回来剧院评论网站。目前未声明对于大多数查询,至少对于广告服务器来说,用户的任务是买东西。最终我设想了任务目录补充目录,搜索引擎提供搜索这些描述。


致谢

我要感谢Jan Pedersen的许多有益的谈话关于网络搜索,Doug Cook了解Inktomi的详细信息目前的搜索结果统计,埃里克布鲁尔,艾米艾略特,丹格拉泽、路易斯·格拉瓦诺、贾森·洪、拉什米·辛哈和哈尔·瓦里安对这篇文章有帮助的评论。这项研究得到了国家科学基金会的职业资助,NSF9984741。

参考文献

1
布莱恩·阿门托、洛伦·泰文和威尔·希尔。
“权威”是指质量吗?预测专家质量评级网络文档。
第23届国际ACM/SIGIR年会论文集会议,第296-303页,希腊雅典,2000年。

2
克莱尔•卡迪、文森特•吴、大卫•皮尔斯和克里斯•巴克利。
研究统计和语言知识来源在一般知识问答。
第六届应用自然语言处理论文集会议(ANLP-2000),第180-187页。计算协会语言学/摩根考夫曼,2000年5月。

陈冠希,马蒂A。赫斯特,洪杰森,林俊杰。
恰恰:一个组织内部网搜索结果的系统。
第二届USENIX互联网研讨会论文集技术和系统,科罗拉多州博尔德,1999年10月11日至14日。
出现。

4
丁俊彦、路易斯·格拉瓦诺和纳拉亚南·希瓦库马尔。
计算web资源的地理范围。
第二十六届国际会议记录超大数据库(VLDB'00)2000年9月。

5
乔治·W·福纳斯。
有效的视图导航。
中华医学会1997年人因会议论文集计算系统,第1卷,共页论文:信息结构,页367-3741997年。

6
弗雷德里克·盖伊、陈慧敏、芭芭拉·诺加德、迈克尔·巴克兰、金英金,陈爱涛,林拜伦,雅克普拉特和雷拉森。
对不熟悉的元数据的高级搜索技术。
元数据'99第三届IEEE元数据会议,医学博士贝塞斯达,1999年4月。

7
C、 李·贾尔斯、库尔特·波拉克和史蒂夫·劳伦斯。
citeeser:一个自动引文索引系统。
数字图书馆98-第三届ACM数字会议图书馆,第89-98页,宾夕法尼亚州匹兹堡,1998年6月。

8
Sanda Harabagiu,Marius Pasca和Steven Maiorano。
开放域文本问答实验。
科林会议记录-2000.协会计算语言学/摩根考夫曼,2000年8月。

9
Marti A.Hearst,David Karger和Jan O.Pedersen。
分散/聚集作为导航检索结果的工具。
在Robin Burke,编辑,AAAI秋季研讨会工作说明人工智能在知识导航与检索中的应用研究,剑桥,马萨诸塞州,1995年11月。

10
海姆·赫什、丘姆基·巴苏和布赖恩·D·戴维森。
学会个性化。
ACM的通信,43(8),2000年8月。

11
马克·赫斯特。
99年假日电子商务。
http://www.creativegood.com1999年9月。

12
乔恩·克莱因伯格。
超链接环境中的权威资源。
第九届亚洲金属协会离散型研讨会论文集算法1998年。

13
亨利·利伯曼。
Letizia:协助网页浏览的代理。
第十四届国际联席会议纪要人工智能(IJCAI-95),第924-929页,1995年。

14
加里·马尔基奥尼尼。
电子环境中的信息寻求.
剑桥优德官网 出版社,1995年。

15
凯伦·马基、波琳·阿瑟顿和克劳迪娅·牛顿。
受控词汇与自由文本检索语句分析在线搜索。
在线评论,1982年4:225-236。

16
彼得·皮罗利。
大范围信息跟踪的计算模型可浏览文本集合。
ACM-SIGCHI人类因素会议论文集计算系统,第3-10页,加拿大温哥华,1997年5月。

17
凯瑟琳·普莱桑、本·什内德曼、科阿·多恩和汤姆·布伦斯。
网络环境下查询预览的接口与数据结构信息系统。
美国计算机学会信息系统汇刊,17(3):320-3411999年。

18
塔拉·斯坎隆,威尔·施罗德,理查德·丹卡,尼娜·吉尔摩,马修·克莱,萝莉兰德斯曼、艾米·莫雷尔、保罗·索耶和贾里德·斯波普。
设计信息丰富的网站.
用户界面工程,1999年。

19
克里斯·谢尔曼。
Inktomi在里面。
http://websearch.about.com/internet/websearch/library/weekly/aa041900a.htm,2000年4月。

20
贾里德线轴。
网站可用性:设计师指南.
摩根考夫曼,1998年。

21
丹尼·沙利文。
Npd搜索和门户网站研究。
http://searchenginewatch.internet.com/reports/npd.html2000年7月6日。
NPD的网址是http://www.npd.com。

关于此文档。。。

下一代网络搜索:设置dafa888登陆注册 的网站

此文档是使用乳胶2HTML格式翻译版本98.1p1发布(1998年3月2日)

版权所有©1993、1994、1995、1996、1997,尼科斯·德拉科斯, 利兹优德官网 计算机学习组。

命令行参数是:
最新HTML -拆分0 data-engineering.tex.

翻译是由玛蒂赫斯特于2000年10月5日发起的


脚注

…命中。1
这些问题是辣根,选举,结肠癌,性,伯克利,肯定行动,中国,聊天,食谱,联合航空。
...搜索。2
http://www.epicurious.com/e_eating/e02美元\_$食谱/浏览_main.html
...猛增
http://soar.berkeley.edu/recipes/
...收藏。4
此示例的数据由对1995-1999年的Medline/Healthstar数据库进行查询1999年7月,使用加州数字图书馆接口系统。该集合包含8400年的文章摘要日记本。文章信息是通过手工下载和处理的以获得号码。在某些情况下,细节被简化了为了便于解释。

下一个 向上的 以前的
马蒂·赫斯特
2000年10月5日