关灯
护眼
字体:

第0040章 搜索引擎算法

首页书架加入书签返回目录

请安装我们的客户端

更新超快的免费小说APP

下载APP
终身免费阅读

添加到主屏幕

请点击,然后点击“添加到主屏幕”

汽车相关的信息上去,去抓取更多的优质网页。

    第三,用户反馈机制,也就是跟踪用户的点击情况和浏览情况。

    所以HITS算法中引入了另外一种网页,称为Hub网页,Hub网页是提供指向权威网页链接集合的WEB网页。

    这里有四个好处,提升信息反馈速度、增加热点反馈的时效性、节约计算机资源以及围绕最终目的,让更多使用我们搜索引擎的用户得到有用信息。

    所以现在简单总结一下,搜索引擎的算法基础就是超链分析,算法的优劣势就在于如何让搜索结果更具有参考价值,让用户获得更有效的信息。

    然而就在孟谦在说最后一个规律算法的过程中,来自IBM的杰尔夫突然起身惊呼,“OH MY GAD!Artificial Intelligence?!”

    孟谦转过头看了一眼对方,皱了皱眉。

    第一,刚才我们提到了,好的搜索引擎是要看在同一关键词下谁的反馈结果更能满足用户需求,那么当用户在搜索某个东西的时候,从大概率来说,他想要看到的结果应该是与这个东西具有更垂直型相关的内容。

    搜索引擎这个东西,需要用到网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,当然,2000年这个时候,还用不上自然语言处理技术,大数据处理也更后世的概念不太一样。

    相比之下,谷歌的Pagerank就多了两件很重要的事情,第一件事情是,把A页面到B页面的链接解释为A给B的投票行为,谷歌在这里会同时考评A和B的等级从而形成新的等级。

    张树新一一做了介绍,这两名外籍男子一名来自IBM,一名来自谷歌,听意思要么是已经挖过来了,要么就是打算挖过来的,两人之前都是搜索引擎项目组的。

    抓取网页信息,然后用某种机制对这些网页进行排序,当用户输入关键词进行搜索时,根据关键词匹配出按照机制进行排列的网页。

    临近下午一点,孟谦到了沪上浦东,这还是他重生后第一次来沪上,这个前世他也经常来的地方。

    因此搜索引擎的好坏决定的就是同样的关键词下,你是否能让相对更多的人获得他们想要的内容。

    因为每一个技术都离不开算法。

    孟谦看了一眼IBM出来的哥们,对方愣了一下有点好像不确定的点了点头。

    不过曾经的孟谦第一次来沪上是在07年的时候,2000年的沪上他还真没见过。

    “我不太清楚在座各位在搜索引擎方面的建树和理解,我只能先按照我的节奏说下去,如果谁有问题可以随时打断我。”孟谦走到黑板前直入正题。

    这里还有一个小小的心理问题,那就是同行之间很少会做超链接,所以拥有更多垂直类网站链接的网站,它的专业性肯定比被乱七八糟网站链接的网站要更大概率靠谱。

    也就是说,在整个网页评级系统中,加入用户反馈分。

    沪上作为华夏的金融中心,是一张给世界看的名片。

    几乎所有人都觉得白度的超链分析是三个算法中最落后的,但有些事情我们还是要多角度的看一看,白度的超链分析在某种程度上可以算得上是奠定了搜索引擎的发展基础。

    至于HITS,其理论基础依然没变,它最大的特点或者说改变就在它意识到Pagerank算法平均的分布权值不符合链接的实际情况。

    第二,建立关键词库热度排序机制,现在的几家搜索引擎企业都对网页做了排序,而我对关键词也做了排序,而且给关键词做排序非常简单,那就是看用户的搜索量。

    来到张树新租的地方,有五名男子正等在那边,其中有两人一看就是外籍男子。

    “张总准备把分公司放在浦东么?”到了目的地后,孟谦凭借记忆对比,如果没看错的话这里应该是张江高科技园区。

    举个例子,客户在搜索汽车的时候,不管他是想买车,还是想了解汽车知识,汽车类的专业网页对他的帮助应该都是更大的。

    浦东四大重点开发区域中,世人相对熟知的应该就是金融中心陆家嘴和科技中心张江了。
上一页目录下一章

请安装我们的客户端

更新超快的免费小说APP

下载APP
终身免费阅读

添加到主屏幕

请点击,然后点击“添加到主屏幕”