谷歌被暂停境外网页搜索

2009年06月20日 01:52新京报 】 【打印0位网友发表评论

谷歌中国被指传播色情内容一事又有了新的进展。国家有关部门昨日已召见谷歌中国负责人,责成其暂停该网站境外网页搜索业务和联想词搜索业务,并要求其立即进行整改,彻底清理淫秽色情和低俗内容。“谷歌中国”网站负责人已承认大量传播淫秽色情和低俗信息,并就此事向公众道歉。该负责人表示,将严格按照政府执法部门的要求进行整改,及时将整改情况报告有关部门。

此前,央视以《新闻联播》、《焦点访谈》、《新闻1+1》三档节目的密集火力报道这一事件,并在昨晚的《新闻联播》中跟进了事件的进展。网易、新浪、腾讯、搜狐等门户网站也均在几乎相同的位置上挂出事件专题;两天之内,“谷歌涉黄”成为媒体上最受关注的热词。

对具体业务影响不大

本报讯 (记者彭梧实习生 林其玲)昨晚20时30分,谷歌中国向媒体发出一份公告表示:谷歌一直在中国采取措施,努力摒除网络低俗信息(例如对于儿童有害的信息)。

谷歌昨天已与政府相关部门就Google.cn服务以及外文搜索中存在的低俗内容及图片进行了沟通,并采取一切必要措施来解决搜索结果中存在的问题。这是一项复杂的工程,目前已经取得很大进展,绝大部分存在问题的搜索结果已解决。

不过从昨天开始,谷歌已停止在国内提供联想词检索服务。这项技术是谷歌在今年三月正式在中国推出的。谷歌对用户输入的检索词进行分析,并根据与该词组最常一起被搜索的相关词,自动提供联想式下文。

例如用户搜索“物理学原理”,谷歌搜索会“自动联想”到狭义相对论、大爆炸和量子力学等一些用户最常与“物理学原理”一起搜索的词语,减少用户的输入负担,提高搜索效率。

但这项技术联想功能的“过于强大”也为谷歌带来麻烦。在被喊停之前,用户通过谷歌检索一些正常的关键词,往往会由于某些搜索组合频繁出现,一些“涉黄”的词组被“联想”到搜索词后面来。

昨天有不愿具名的搜索引擎专家称,“被喊停的两项业务当中,国际网页检索对用户体验的影响不大,因为这种只存在于后台的检索范围界定就只影响小部分用户,中文用户搜索最多的还是国内网页。联想词检索服务被喊停或多或少会影响到一些用户体验,尤其是那些习惯了谷歌这项功能的用户。不过,这件事情对谷歌的影响更多是品牌层面的,具体业务层不会有太大影响。”

暂无司法机构介入

本报讯 (记者彭梧实习生 林其玲)尽管自互联网举报中心成立并多次曝光“涉黄”网站以来,谷歌是首家被定性为“违法”的企业,但截至昨天下午,尚未有司法机构介入调查此事的消息曝光。

按照互联网举报中心主任李家明的说法,谷歌中国网站大量传播淫秽色情和低俗信息,严重违反了《全国人大常委会关于维护互联网安全的决定》和国务院《互联网信息服务管理办法》等法律法规,以及《互联网站禁止传播淫秽色情等不良信息自律规范》等行业自律规范。

来自境外互联网上的淫秽色情信息通过谷歌传播到我国境内是本次谷歌遭遇“强烈谴责”的重要原因之一。专家分析称,目前涉黄网站大多是国外网站,但是大多数国内用户对国外网站并不了解,谷歌搜索相当于把这些网站聚集起来。谷歌暂停国际网页检索相当于关闭打开国外涉黄网站的一扇大门。

■ 谷歌诉讼史

谷歌曾为“涉黄”与美打官司

本报综合报道 中国并不是第一个因为谷歌“涉黄”对其“点名”的国家。2006年1月,谷歌股价曾一天之内暴跌8.5%,创下该公司上市以来最大单日跌幅。而原因正是谷歌拒绝向美国司法部交出用户搜寻记录的要求,被后者告上法庭。

2005年夏天起,美国司法部一直要求谷歌提供某一周内所有键入谷歌的搜索关键词,并且要求谷歌从其数据库中提供100万个随机选择的网址。理由是网络充斥色情内容,通过此举政府可以估计有多少网民在搜索网页的过程中碰到对未成年人有害的信息,从而防止色情网页危害未成年人。美国其他搜索引擎,如雅虎、微软等都按要求向司法部提供了相关资料。

但谷歌认为,用户的隐私应当受到保护,提供色情内容的搜索,并非出于本意。自己就像水果刀制造商,只是制造了一个工具,用户拿水果刀杀人,政府不能追究水果刀制造商的责任。在谷歌提供的众多服务中,色情内容索引服务只是一方面,这并不意味着谷歌与色情业有染。

法官最后判决,谷歌只须交出它数据库中50000个搜索结果链接地址,司法部不得向谷歌索要任何用户搜索查询资料。

有法律专家对此评价:“如果律师们认识到个人使用搜索引擎的全部记录,都可以轻松得到的话,法院的传票就会满天飞,网民的隐私将被暴露在光天化日之下。”

■ 原理解读

谷歌为何“涉黄”

本报综合报道 在谷歌的搜索结果中为何会出现大量色情淫秽内容?这些内容是被有意放入网站还是自动索引?要解答这个问题,需要对搜索引擎的工作原理有所了解。

在谷歌成立以前,搜索引擎大多采取人工检索、排序的方式,将互联网上的内容组合在一起,呈现给用户,类似传统的电话号码簿制作。因此,此时搜索内容是经过人工处理的。

但是,随着互联网规模的飞速扩大,网页数量呈几何级数增长,人工检索的方式无法及时排序所有网页;同时,也无法准确地根据重要性排列网页,使用户在尽可能靠前的搜索结果页上看到自己想要找的内容。到谷歌成立的前一年1997年为止,四大商业搜索引擎中只有一个能够找到它自己(搜索自己名字时返回的前十个结果中有它自己)。

谷歌发明了“pagerank”算法来自动索引网页。谷歌的服务器自动发出很多小程序“robots”,像蜘蛛一样沿着互联网内每个网页爬行,并将网页要素带回服务器,建立索引;同时,根据该网页被别的网页链接的次数,以及其他一些要素,来决定它的重要程度并进行索引排序。

因此,用户的每一次搜索,都是对谷歌已经建立索引的服务器上发出请求,在自动检索建立的索引档案中查找答案。由于一些色情内容被检索的次数十分频繁,因此搜索引擎会自动将其提高到较为靠前的页面。谷歌引擎强大的技术性能,有时会成为双刃剑。

■ 背景知识

常见过滤技术

谷歌中国表示将根据有关部门要求进行整改。对色情网页的过滤,国际常用的技术有三种,关键词过滤、黑名单过滤、图像识别过滤。

基于关键词的过滤技术,是说只要网页文本中含有要被过滤的目标“关键词”,比如“性生活”、“fuck”等,这个网页就会被过滤掉,同一个网站内不含有该关键词的网页不会被过滤。

基于黑名单的过滤,是软件或者防火墙提前把一批涉黄网站过滤掉,而且一般情况下,软件和防火墙还会不断更新网址数据库,补充新增黑名单网站的网址信息。过滤的效果是整个网站都无法浏览。此类技术的原理类似于杀毒软件。

基于图像识别的过滤,是根据图像的裸露程度,而判定其是否为色情图片。基于图像识别的过滤技术还很不成熟,经常出现一些令人啼笑皆非的结果,例如“机器猫可以通过,加菲猫被过滤”等等。此前的某款国产过滤软件也是因为对色情图片识别准确率不好,而饱受质疑。

这三种技术都是基于牺牲网络资源为代价的,而且均存在误报警和漏报警现象。

过滤技术在国际上的竞争十分激烈。据《环球时报》报道,在我国工信部要求所有品牌电脑强制预装“绿坝-花季护航”软件后,美国的固体橡树公司(Solid Oak Software Inc.)在上周五称,他们在绿坝中发现其CyberSitter过滤软件的成份,包括一个待过滤的关键字黑名单,关于更新原软件的操作说明,以及一个过时的CyberSitter推广广告。该公司总裁称,对于绿坝抄袭一事,“我99.99%地确定”。(林其玲)

免责声明:本文仅代表作者个人观点,与凤凰网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

欢迎订阅凤凰网财经电子杂志《股市晚报》
  0位网友发表评论   
 
匿名
用户名 密码 注册
     
作者:    编辑: robot
凤凰网财经
热点图片1热点图片2
最热万象VIP
[免费视频社区] 锵锵三人行 鲁豫有约 军情观察室 更多
 
 
·宝宝中秋祝福 ·毛主席的光辉
·寂寞在唱歌 ·天亮了说晚安
·太阳照常升起 ·阿飞的小蝴蝶