坚信科学,分享技术

2018全新版本,未来在blog.54chen.com更新博客!

>>>尝试更加利于阅读的2014版科学院,以后都在新版上写。

Yearly Archives: 2010

54chen Twitter memo 2010-08-15

54chen Twitter memo 2010-08-08 http://goo.gl/fb/HcNlK # 接连4天没有上班,感觉许多东西要理顺一下才能继续工作。 # 用人之长,凡事顺之。 # RT @Qieqie:三重门、两道沟、一句话:语法 syntax、语义 Semitics、语用 Pragmatics;两道沟:经历 Experience、感悟 Taste..//哲学帝 # @MingxingZhang comment what? in reply to MingxingZhang # @MingxingZhang BS in reply to MingxingZhang # 求一本,历史+经济相关的好书。 # @MingxingZhang 不靠谱托夫斯基 in reply to …

Continue reading

Posted in 生活备份 | Tagged | 5 Comments

rose pipe–一次对http技术的伟大革新实现(54chen乱弹版)

网站速度一直是互联网公司所关注的核心目标之一,作为SNS网站更是这样。来自世界第一大的打不开的SNS网站facebook的工程师日志中提到,BigPipe: Pipelining web pages for high performance。 原文在墙外,豆瓣有存根,地址为http://9.douban.com/site/entry/139173635/。 来自infoq的一篇资料报道:http://www.infoq.com/cn/news/2010/08/bigpipe-facebook-optimize 它本意是充分利用http,将用户感受到的延迟时间降低一半,是如何做到的呢,下面由54chen流水记账一篇解释实现原理。院内曾经由人人网架构师王志亮大侠发表过一篇文章,地址是http://www.54chen.com/architecture/rose-open-source-portal-framework.html,本文将以此例中的项目举例。 HTTP协议 HTTP是一个客户端和服务器端请求和应答的标准,尽管TCP/IP协议是互联网上最流行的应用,HTTP协议并没有规定必须使用它和(基于)它支持的层。 事实上,HTTP可以在任何其他互联网协议上,或者在其他网络上实现。HTTP只假定(其下层协议提供)可靠的传输,任何能够提供这种保证的协议都可以被其使用。 在这里重新解释HTTP是为了后面做铺垫,一次http访问的过程如下: 1.打开一个连接后,客户机把请求消息送到服务器的停留端口上,完成提出请求动作; 2.服务器在处理完客户的请求之后,要向客户机发送响应消息; 3.客

Continue reading

Posted in 架构研究 | Tagged , , | 9 Comments

54chen Twitter memo 2010-08-08

54chen Twitter memo 2010-08-01 http://goo.gl/fb/HrggT # RT @162cm: 蛋蛋定 再搞两年技术管理 两年产品管理,我才能熟得跟路口卖得西瓜似的 这时创业才靠谱 @awguo @162cm 徐总把女儿照顾顺利了也早日出来创业吧,你是一个属于创业的人啊! //郭总这头像相当年轻啊,有校内上照片相比不WS多了,差点没认出来 # RT 黄晶 : 能力的提升,事业的意义,职业的发展,现实的回报,在工作的任何阶段,都不要搞错这几件事的顺序,才能走的更顺更远——今天和某同学聊后的感想 //好像发过一回,再发一回做备份 # 使用maven的profiles自动设置log4j线上环境和测试环境区别 http://goo.gl/fb/m8G0n # 使用maven的profiles自动设置log4j线上环境和测试环境区别 http://goo.gl/fb/el7ti #

Continue reading

Posted in 生活备份 | Tagged | 2 Comments

使用maven的profiles自动设置log4j线上环境和测试环境区别

前言 Maven是基于项目对象模型(POM),可以通过一小段描述信息来管理项目的构建,报告和文档的软件项目管理工具.   如果你已经有十次输入同样的Ant targets来编译你的代码、jar或者war、生成javadocs,你一定会自问,是否有一个重复性更少却能同样完成该工作的方法。Maven便提 供了这样一种选择,将你的注意力从作业层转移到项目管理层。Maven项目已经能够知道如何构建和捆绑代码,运行测试,生成文档并宿主项目网页. 项目的主页地址为:http://maven.apache.org/ 深入 Profiles是maven的一个很关键的术语:profile是用来定义一些在build lifecycle中使用的environmental variations,profile可以设置成在不同的环境下激活不同的profile(例如:不同的OS激活不同的profile,不同的JVM激活不同的profile,不同的dabase激活不同的profile等等)。 实例 测试机环境,搞一个文件,比如说/data/test。 线上环境,不搞这个文件。 然后pom在project下如下写法: <profiles> <profile> <id>produce</id> <activation> <activeByDefault>false</activeByDefault> <file> <missing>/data/test</missing> </fi

Continue reading

Posted in 生活备份 | 4 Comments

54chen Twitter memo 2010-08-01

54chen Twitter memo 2010-07-25 http://goo.gl/fb/HIrSu # 关掉所有的im 只留下twitter 如何? # 不断加大的长江洪涝,犹如不断增长的业务访问量,偷工减料弄出来的各种工程,直接导致了一次又一次的重购,永远没有办法一劳永逸。 # @Fenng 后台服务怎么用js写呢 求真相 in reply to Fenng # RT 徐瑜骏: 问:如果腾讯抄袭你的产品,你怎么和他竞争?答:骂他狗日的---胡强童鞋 # ubuntu下的chrome真的不怎么样,随时断线 # @wolfdeng 好像在看哪里看到是chrome ubuntu版本的bug 不知是不是我的错 in reply to wolfdeng # http://news.csdn.net/a/20100726/277273.html 人人网feed系统技术经理讲解实现原理 @xmpp这次活动非常成功!很棒 # 人人网新鲜事系统探秘:Feed系统架构分析 …

Continue reading

Posted in 生活备份 | Tagged | 2 Comments

sphinx安装配置手记(中文分词54chen支持版)

介绍 Sphinx[英] [sfɪŋks] [美] [sfɪŋks] 出自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Coreseek是一款基于Sphinx的开源检索引擎,支持Tb级的全文数据索引,专门为中文用户提供免费开源的中文全文检索系统。 下载 wget http://www.coreseek.cn/uploads/csft/3.2/csft-3.2.12.tar.gz wget http://www.coreseek.cn/uploads/csft/3.2/mmseg-3.2.12.tar.gz 解压 tar -zxvf mmseg-3.2.12.tar.gz tar -zxvf csft-3.2.12.tar.gz 中文依赖下载和安装 wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.13.tar.gz tar zxvf libiconv-1.13.tar.gz cd libiconv-1.13/ ./configure --with-libiconv-prefix make make install 建立系统动态链接 在/etc/ld.so.conf中加一行/usr/local/lib,运行ldconfig。 ld.so.conf和ldconfig是维护系统动态链接库的。真不明白为什么iconv库安装时不把这一步也做了 安装mmseg分词 cd mmseg-3.2.12 yum -y in

Continue reading

Posted in 架构研究 | Tagged , | 5 Comments

54chen Twitter memo 2010-07-25

54chen Twitter memo 2010-07-18 http://goo.gl/fb/UQbwr # 由php的call_user_func传reference引发的思考 http://goo.gl/fb/2YN7U # 中国的互联网是人为割裂的。它既存在于精英的Think笔记本上,也存在于草根的MTK山寨机中。from 北风 # 长焦拍不认识的,定焦拍认识的 # http://house.baidu.com/ # 今天的糯米网10000张电影票,一开始上班就over了,北京看电影的人这么多。。。 # @162cm 哥看到凤姐了? in reply to 162cm # 在eclipse下老是用不了fcitx,原来是eclipse的contrl+space和fcitx冲突了,还以为是老早以前的jdk的中文bug。。。干掉eclipse的热键后,灰常好用 # 明天下班出发去山东济宁,看房、交钱。顺便离开京城逛一圈。 # 老大讲座,气场灰场足,主题是,网聚人的智慧,SNS发展及互联网人口。这里现场不完全间断直播。#renren# # 直播开始:人人网技术产品总监黄晶从SNS历史开始介绍#renren # facebook每月活跃用户5亿#renren # sns将成为互联网下一代入口#renren # 传说google内部有一秘密sns产品#renren # @Missiu …

Continue reading

Posted in 生活备份 | Tagged | Leave a comment

由php的call_user_func传reference引发的思考

问题的提出 网友bercmisir在院内留言,针对php手册中的call_user_func函数的文档一事,大致如下: http://php.net/manual/en/function.call-user-func.php 其中parameter下有这样一句话: Note: Note that the parameters for call_user_func() are not passed by reference. 简单地翻译一下,是说这个函数的参数是不能依靠引用来传递的。 还有一个例子: 输出是: 0 1 而网友bercmisir的问题在于: call_user_func('increment', $a);输出是0,而call_user_func('increment', &$a);却输出是1,明明说不能依靠引用来传递。 寻根溯源 然后再进一步寻根溯源,这个Note的信息其实是http://bugs.php.net/bug.php?id=24931这个bug中最后处理的结果。 并且在call_user_func('increment', &$a);虽然输出了1的结果,但一般情况下,会有一个警告信息:Deprecated: Call-time pass-by-reference has been deprecated。 这是什么原因呢? 先看一个例子: 结果为2,并且没有类似expected to be a …

Continue reading

Posted in php | Tagged , | 7 Comments

54chen Twitter memo 2010-07-18

54chen Twitter memo 2010-07-11 http://goo.gl/fb/mUvUc # 西班牙的年轻人活得很轻松,一般年轻人用自己三至四年的收入就可以买一套房子,没有什么供房压力,而且,房价持续下跌,现在已经跌至2005年的水平。所有省会城市的房价都有所下降,其中19个城市房价下跌幅度超过5%,跌幅最大的是首都马德里,每平方米房价为3375欧元。 # @Fenng 看上去是从wiki里拷出来的? in reply to Fenng # http://fmn.xnimg.cn/fmn044/20100704/2325/p_large_PxmC_5b3900016b3f2d0c.jpg 长颈鹿是寂寞专家,很有爱的图 # 工信部网站升级这事,技术难度和折腾系数,都堪比校内网到人人网的转变 # RT刘启荣 : 唐僧一觉醒来 发现悟空跪在自己床前痛哭流涕 问道:“空儿你怎么了?”悟空抹了一把泪 说:“师傅 咱下次睡觉说梦话 不念紧箍咒 好么?” # 开个会回来,看到QQ弹出的新闻,京沪杭房价突破2万每平,很奇怪,不是很久就突破了吗? # hadron海量搜索平台,两条主线,一条以sphinx为代表的c路线,一条以kata为代表的java路线 # QQ微博的logo被一兄弟形象比喻为受精卵,很形象,很生动 # 7月9日晚11时开始,搜狐微博服务暂停。12日凌晨1时许恢复,但其微博禁外链转发.此后,新浪、网易、搜狐、凤凰等各门户网站的微博,甚至包括人民网微博LOGO边上都醒目地标出了“测试版”或“Beta”字样。13 日网易微博也开始维护,目前无法访问,

Continue reading

Posted in 生活备份 | Tagged | 1 Comment

用sphinx轻松搞定方便管理的多节点过亿级数据搜索

概述 来自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级),实测千万级数据在0.0X秒和0.00X秒占大多数。 Sphinx创建索引的速度为:创建100万条记录的索引只需3~4分钟,实测30W线上复杂的blog数据需要5分钟,创建1000万条记录的索引可以在50分钟内完成,实测时间比这个更长得多,而只包含最新10万条记录的增量索引,重建一次只需几十秒,实测十万条在一分钟不到的时间。 Sphinx 是一个基于 GPL 2 协议颁发的免费开源的全文搜索引擎.它是专门为更好的整合脚本语言和SQL数据库而设计的.当前内置的数据源支持直接从连接到的 MySQL 或 PostgreSQL 获取数据, 或者你可以使用 XML 通道结构(XML pipe mechanism , 一种基于 Sphinx 可识别的特殊xml格式的索引通道) 。 sphinx安装 安装见 用Sphinx快速搭建站内搜索功能 配置多节点协同工作 第一点,原理 在sphinx.conf中可以配置index段落里的local和agent两个参数,local = blog_1表示使用本地索引名为blog_1的索引,agent = 10.1.1.1:3312:blog_2表示使用10.1.1.1这个机器的3312端口上服务的blog_2索引。这两个参数均可在此段落中重复出现。 利用这两个参数,可进行节点与节点间的配置。如图1所示,一个searchd服务在接到请求时两种使用索引的示意图。 图1 一个searchd服务在接到请求时两种使用索引的示意图

Continue reading

Posted in linux, 架构研究 | Tagged , | 11 Comments
Page 5 of 13« First...3456710...Last »