妙趣扑克王APP资料
什么是垂直搜索引擎?_
日期:2019-09-13 14:12    编辑:admin    来源:妙趣扑克王APP
其特点就是专□□□、精□□、深□,且具有行业色彩,相比较通用搜索引擎的海量信息无序化□□,垂直搜索引擎则显得更加专注、具体和深入□□。 叮铃铃垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页□,而是范围极为缩

  其特点就是“专□□□、精□□、深”□,且具有行业色彩,相比较通用搜索引擎的海量信息无序化□□,垂直搜索引擎则显得更加专注、具体和深入□□。

  叮铃铃垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页□,而是范围极为缩小□、极具针对性的具体信息。因此,特定行业的用户更加青睐垂直搜索引擎,是垂直搜索引擎的长期、稳定的群体。

  搜索引擎的出现,整合了众多网站信息□,恰恰起到了信息导航的作用。通用搜索引擎就如同互联网第一次出现的门户网站一样,大量的信息整合导航,极快的查询,将所有网站上的信息整理在一个平台上供网民使用□□,于是信息的价值第一次普遍的被众多商家认可,迅速成为互联网中最有价值的领域。互联网的低谷由此演变为第二次高峰。大家熟知的搜索引擎Google、百度、雅虎等是通用搜索引擎现如今的杰出代,他们为互联网的发展做出了重要的贡献。然而□□,搜索引擎行业也不是一家公司就可以独撑天下的,从百度的上市□、yahoo中国的并购一系列动作表明,如今的搜索引擎大战如同门户网站初期的竞争一样激烈。

  垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。 垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据□□,好比网页搜索是以网页为最小单位□□□,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位□□□。然后将这些数据存储到数据库,进行进一步的加工处理□□□,如□□:去重、分类等□,最后分词、索引再以搜索的方式满足用户的需求□□□。 整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户□□□。 垂直搜索引擎的应用方向很多,比如企业库搜索□□□、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。 举个例子来说明会更容易理解□,比如购物搜索引擎,整体流程大致如下:抓取网页后□□□,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏□□、……”然后对信息进行清洗、去重□□、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。 垂直搜索引擎大体上需要以下技术 1.Spider 2.网页结构化信息抽取技术或元数据采集技术 3□□.分词、索引 4□□.其他信息处理技术 垂直搜索引擎的技术评估应从以下几点来判断 1□.全面性 2□□□.更新性 3.准确性 4.功能性 垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的□。行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。]

  垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合□□,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户□□。 垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位□,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库□,进行进一步的加工处理,如:去重□、分类等,最后分词、索引再以搜索的方式满足用户的需求。 整个过程中□□,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。 垂直搜索引擎的应用方向很多,比如企业库搜索□□□、供求信息搜索引擎□□□、购物搜索□□□、房产搜索□、人才搜索、地图搜索□□□、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。 举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后□,对网页商品信息进行抽取,抽取出商品名称、价格□□□、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘□、显示屏□□□、……□”然后对信息进行清洗、去重、分类□□□、分析比较□□□、数据挖掘□□□,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。 垂直搜索引擎大体上需要以下技术 1.Spider 2.网页结构化信息抽取技术或元数据采集技术 3.分词、索引 4.其他信息处理技术 垂直搜索引擎的技术评估应从以下几点来判断 1.全面性 2.更新性 3.准确性 4.功能性 垂直搜索的进入门槛很低□□,但是竞争的门槛很高□□。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。]

  • 本类最新
  • 时尚
  • 新闻
  • 生活
  • 视觉
  • 微爱
返回顶部