当前位置:首页 > (完整版)聚焦搜索引擎的设计与开发查询系统设计与实现毕业设计
的Java类,继承自HttpServlet,开发中主要用于处理和响应客户端的请求。Servlet在容器中运行,其实例的和销毁创建由容器进行控制。每个Servlet的运行都拥有生命周期:首先,(1)(容器)创建Servlet实例。然后,init(初始化,显示相关Servlet实例信息)。再是,Service(处理和响应请求)。最后,destroy(销毁,释放资源)[9]。
2.4 MySQL
MySQL[5]是一个小型关系型数据库管理系统,开发者为瑞典MySQL AB公司。在2008年1月16号被Sun公司收购。而2009年,SUN又被Oracle收购.对于Mysql的前途,没有任何人抱乐观的态度.目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。
与其他的大型数据库例如Oracle、DB2、SQL Server等相比,MySQL自有它的不足之处,如规模小、功能有限(MySQL Cluster的功能和效率都相对比较差)等,但是这丝毫也没有减少它受欢迎的程度。对于一般的个人使用者和中小型企业来说,MySQL提供的功能已经绰绰有余,而且由于MySQL是开放源码软件,因此可以大大降低总体拥有成本。
本系统中用的是MySQL 5.6.24版本。
[5]
2.5 汉语分词
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。在各位ICTCLAS用户强烈的要求下,张华平博士正式发布ICTCLAS2013 版本,为了与以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,从本版本开始,系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年,内核升级10次,全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;
用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;
全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。
本系统需要对用户输入的查询语句进行分词,所以采用了网上免费提供的中科院分词系统,本系统使用的版本为:2013年UTF8编码版。
2.6 开放API平台
API[8](Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。
基于互联网的应用正变得越来越普及,在这个过程中,有更多的站点将自身的资源开放给开发者来调用。对外提供的API 调用使得站点之间的内容关联性更强,同时这些开放的平台也为用户、开发者和中小网站带来了更大的价值。
开放是目前的发展趋势,越来越多的产品走向开放。目前的网站不能靠限制用户离开来留住用户,开放的架构反而更增加了用户的粘性。在Web 2.0的浪潮到来之前,开放的API 甚至源代码主要体现在桌面应用上,而现在越来越多的Web应用面向开发者开放了API。
具备分享、标准、去中心化、开放、模块化的Web 2.0站点,在为使用者带来价值的同时,更希望通过开放的API 来让站点提供的服务拥有更大的用户群和服务访问数量。
站点在推出基于开放API 标准的产品和服务后,无需花费力气做大量的市场推广,只要提供的服务或应用出色易用,其他站点就会主动将开放API 提供的服务整合到自己的应用之中。同时,这种整合API 带来的服务应用,也会激发更多富有创意的应用产生。
为了对外提供统一的API 接口,需要对开发者开放资源调用API 的站点提供开放统一的API接口环境,来帮助使用者访问站点的功能和资源[9]。
当然,开放API 的站点为第三方的开发者提供良好的社区支持也是很有意义的,这有助于吸引更多的技术人员参与到开放的开发平台中,并开发出更为有趣的第三方应用。
本系统的天气模块调用的是百度API STORE里提供的天气信息与PM2.5与城市名开放平台。
第3章 系统需求分析
3.1 用户需求分析
用户需求分析分为两个方面,一个是搜索词分析,另外一个是用户搜索意图分析,通过搜索词的分析可以返回一个可能是用户需求的结果列表,通过用户搜索意图的分析并对搜索结果进行调整,可以获得此用户更加想要的结果列表。
3.2 系统可行性分析
在开发一个系统时,需要对可行性进行分析。可行性分析可从环境可行、经济可行、技术可行3方面进行分析。通过方方面面的分析,得出开发此系统的难度几何,开发出来后有没有市场。若是没有进行可行性分析就匆匆地进行开发,可能导致大问题。如:开发完系统,并在调试通过正式投入使用后,却发现用户对系统的需求并不大,根本用不到开发的系统,导致系统被淘汰,这样既浪费时间又浪费人力。又如:系统的市场着实存在,人们对系统的需求大,但是却没有考虑到自己的水平、技术能否应对此类系统的开发,在没有进行技术可行性分析就进行开发,导致开发到一般发现自己的水平有限,无法完成系统的开发,结果就是开发出一个半成品,而半成品的实际使用意义几乎为零,毕竟顾客看的只是最后的结果,只看系统的功能如何,使用起来方不方便。顾客并不关心开发人员使用了什么技术。因此若是因为自己的技术不过关而导致系统开发的夭折在顾客看来就是没有完成任务。诸如此类的情况都是浪费时间和人力的表现。由此可见,在真正着手开发系统前,对系统进行可行性分析是相当重要的。
3.2.1 环境可行性分析
搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的一个有效工具”。高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品/服务的销售,而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值。所以搜索引擎是利国利民的,在环境上,可行。
共分享92篇相关文档