9月11日午间消息,百度宣布升级“公立机构官网保护计划”,进一步加强对公立机构官方网站百度搜索结果的保护。通过该计划,网民在百度搜索政府机关、事业单位等公立机构时,百度将优先展示经过认证的公立机构官网或相关信息,并对搜索结果标注官方认证标识。
据介绍,截至目前,百度“公立机构官网保护计划”已引入超过10万家公立机构官网,涉及700万个搜索词,覆盖了政府机关、事业单位、医院、殡仪馆、学校、博物馆、景区等公立机构,未来覆盖范畴还将持续增加。
“在百度搜索中,每天有上千万次的搜索是寻找官方网站的。网民对搜索服务的权威性要求,永远是百度搜索最重要的进化方向之一。”百度搜索产品部负责人表示,百度通过“基础数据+搜索策略+前端展现”等手段,来保证公立机构官网的优先呈现。
据其介绍,首先,作为搜索引擎,百度的爬虫系统和日志系统会尽可能地穷尽网络上的海量信息数据,包括从网站的标题、内容、图片、音视频到网页间的链接指向关系等,并通过人工智能、大数据等手段,进一步分析各类数据中内外部之间的关联信息。
其次,在数据之上,百度通过自研的各种策略,进一步过滤清洗数据,降低互联网中不良数据对各类搜索效果的影响,同时进一步建立围绕官网识别和排序的自动化策略,当用户发起搜索需求时,相关官网的信息会优先展现。
最后,在前端展现上,百度会对公立机构官网增加“官网”标志、优先展示等方式。
此前,百度于2018年上线了公立医院品牌保护计划。据百度搜索产品部负责人介绍,截至今年5月,百度已对超过14.5万个公立医院名称(含简称、别称、俗称)进行保护。当用户搜索这些受保护的公立医院名称时,将不会出现其他医院的商业推广。
同时,当网友搜索到还没有认证的公立机构官网时,百度在结果页会给予“暂无认证的官方网站”的提醒,并提示用户登陆“百度公立机构官网保护共建平台”进行反馈、共建。
此外,就公立机构官网整体环境而言,由于部分公立机构官网存在建站不规范、封禁IP、robots声明等问题,百度在保护公立机构官网上,仍然面临一定的挑战。
对此,百度方面也表示,将借助技术手段不断优化基础数据和搜索策略、前端展现等环节,尽力提升搜索体验问题。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/444/568.htm]