论坛风格切换切换到宽版
  • 5463阅读
  • 0回复

Google提供同义词的搜索结果 尝试自然语言理解技术 [复制链接]

上一主题 下一主题
离线李唐
 

只看楼主 倒序阅读 0楼 发表于: 2010-06-02
Google提供同义词的搜索结果 尝试自然语言理解技术
  Google官方博客今天号称现在已经将自然语言理解技术用于搜索中同义词的识别,比方在一定的上下文环境中Google搜索认为"pictures"和"photos"是相同的,以 [pictures developed with coffee]这个查询为例,可以看见搜索结果中的"photos"被加粗了,这是一次大胆的尝试,这要源于Google发现70%的人在搜索中使用同义词,通过四年的努力,Google现在的同义词识别错误率为1/50,也就是说每50个使用同义词识别的查询中会出现一次错误识别。比方 [dell system speaker driver precision 360],Google认为"precision"与"PC"是同义词。

  自然语言理解是人工智能中难点,Google通过分析数PB(1,000,000,000,000,000 (1015)字节)的Web文档提取的同义词,可以根据不同的语境识别不同的同义词,如:

  [dura ace track bb axle njs], Google认为 "bb"表示"bottom bracket".
     [software update on bb color id], "bb"表示"blackberry "
     [bb cream dark], 这里的bb被认为是 "blemish balm".
     [southeastern usa bb fitness & figure],这里的"bb." 的同义词是"bodybuilding"  

     根据文章介绍,Google主要分析用户查询和页面内容的关联,比方大量用户查询"XYZ BCN",但搜索结果页面中却使用"XYZ Barcelona",Google认为"BCN"是"Barcelona"的同义词,当然这必须是使用"XYZ"的这种上下文环境下。下面是关于Google同义词识别技术的一个简单介绍《Making search better in Catalonia, Estonia, and everywhere else》。

    Matt Cutts在其博客也建议站长SEO不要在文章中堆砌相同意义的不同形式的关键词。不过不大可能,因为不是所有语境下都使用同义词结果。
评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
快速回复
限100 字节
 
上一个 下一个