Tag Archives: synchronize
yahoo、taobao云计算利器之“云”端的小飞象—Hadoop
“云”端的小飞象—Hadoop 孙 牧 Hadoop简史 在搜索技术界,也许有人不熟悉Doug Cutting,但很少有人不知道Lucene这个著名的全文检索引擎。事实上,Lucene应该是Doug Cutting的成名作,它被广泛地应用在各种规模的网站和系统中,甚至Eclipse中的搜索功能也是Lucene来实现的。 但Doug Cutting并没有满足Lucene取得的成绩。2002年,他发起了一个基于Lucene的开源项目Nutch,其目标是构建出一个包括网络蜘蛛、文件存储等模块的网页搜索系统。经过2年的努力,Nutch虽然可以用4台机器支持1亿网页的抓取和检索,但系统的扩展性开始遇到瓶颈。恰在此时,Google发表了GFS、MapReduce的论文,这两个创新性的思路点燃了Nutch 2名开发人员的斗志,他们又花了2年的业余时间实现了DFS(分布式文件系统)和MapReduce机制,这次改造使Nutch可以在20台机器上支持几亿的数据规模,其编程和运维的简易性也得到了大幅提升,但系统的吞吐能力与一个真正的网页搜索系统仍有不小的差距。 2006年,开源社区如火如荼,当美国雅虎在思索构建一个高度利用硬件资源、维护和开发都非常简易的软件架构时,Doug Cutting和他的Nutch进入了他们的视野。一方具有超强的技术前瞻性和实战经验,另一方能提供世界上数一数二的数据、硬件和人力资源,双方一拍即合,同年1月Doug Cutting正式加入雅虎,2月Hadoop从Nutch中分离出来,正式成为Apache组织中一个专注于DFS和MapReduce的开源项目。
Java EE中各种打包文件
1.EJB-JAR包:后缀为.jar EJB模块,包含有Session Bean,Message Driver Bean,Entity Bean;管理这些Bean业务的为EntityManager,而EntityManager由EntityManagerFactory产生。通过配置persistence.xml配置这些Bean。 2.WAR包:后缀为.war web模块,包括开发java web的所有文件如:JSP,Servlet,JSF,javascrpit,web.xml,图片,音乐,flash资源等等;如果需要在war中应用EntityBean,可以配置一下persistence.xml然后将EntityBean打包进war包中。。war描述文件web.xml放在WEB-INF文件下。 3.EAR包:后缀为.ear 实际上就是j2ee应用中的各种文档或模块,包括:EJB模块,WEB模块,RAR模块,CAR模块等。可以说它是开发项目的最终包,其他开发过程的模块最终会以.ear的包形式来实施应用。ear包中一个非常重要的描述文件为application.xml,它放在META-INF文件下。 4.CAR包:后缀为.jar 应用客户端模块,包含在客户端独立运行的类和访问的JDBC,JMS,JAXP,JAAS,以及 EJB客户端需要的类等。 5.RAR包:后缀为.rar 这个包应该比较好理解,它是资源适配器模块,包括java连接器,帮助库函数,以及其他一些相关资源。
SEARCH
Update
- 54chen Twitter memo 2012-05-20
- rose手册第三章四节:controller层:自定义http参数支持
- rose手册第三章三节:controller层:ErrorHandler支持
- 54chen Twitter memo 2012-05-13
- 54chen Twitter memo 2012-05-06
- rose手册第三章二节:controller层:拦截器支持
- 54chen Twitter memo 2012-04-29
- rose手册第三章一节:controller层:url对照规则与返回结果规则
- 54chen Twitter memo 2012-04-22
- 54chen Twitter memo 2012-04-15
- rose手册第二章:配置与使用
- 54chen Twitter memo 2012-04-08
- 54chen Twitter memo 2012-04-01
- rose手册第一章:入门指引
- 54chen Twitter memo 2012-03-25
