Warning: curl_exec() has been disabled for security reasons in /pub/host/sunboyu/sunboyu/www/wp-includes/http.php on line 1022
2008 九月 一个程序猿 孙小一,孙小二,PHP,MYSQL,LINUX,APACHE,原创技术,扯淡

做公司,一定要做对社会有意义的事情

作者 : admin 于 2008年09月29日, 21:41:16
2008
09-29

前些日子,在sohu大厦里听了一次讲座,大概是一个VC讲一些投资方面的事情.经营管理没多听,期间他说了重要的一点,我记忆尤深:”做公司,一定要做对社会有意义的事情”.

仔细一想,但凡有所发展的企业,他的盈利一定是建立在了服务社会,服务大众,有利于社会发展的事情之上.不管金融,科技还是生产加工企业,无一例外.

而一些投机倒把,危害人民利益的企业,势必会垮台.就如最近的三鹿事件(我家旁边的企业,很痛心),不管哪个环节出的问题,现在整个经济链条都崩溃了,老家的人们都开始喝五毛一斤的鲜奶了,而粮食饲料等没有降价,受损的何止厂商.

在IT方面,比较成功的企业,腾讯算一.腾讯的主产品IM,完全推动了社会的进步,改变了人们的生活方式,从电话到email,手机,im,这些功能完全推动了人们的生活,降低了人们的通讯效率和成本,完全符合社会发展的趋势,因此,这是一个对社会有意义的产品,腾讯成为了一个有意义的企业,他得以了发展和状态.(注:只针对IM系列的产品,本人对其网游等持反对态度)

而一些利润很好的企业,未必做了对社会有意义的事情.比如盛大,我一直很痛恨的公司.这种公司如果不转型,终究有一天,就像三鹿一样爆发.

Linux提交命令至后台运行

作者 : admin 于 2008年09月27日, 23:01:42
2008
09-27

我经常在putty里工作,有时候如果一个命令执行太长,不得已,我得开两个窗口,如果事情再多,可能开四个五个,不过有的ssh登陆工具可以开多个窗口,但难免会出点乱子.那么我们可以把命令隐藏再后台执行,使用linux下命令  “&”  这个倒霉的符号.

比如我们要执行一个命令,(暂时没想到执行时间N长的命令,假设一个shell) test.sh , 现在提交并隐藏在后台

$./test.sh >> test.log &

意思是,执行test.sh 反馈的结构输送至 test.log , &表示这个命令提交至后台执行.

执行后,返回一个进程号,可以用ps来查看.

这样,我们可以连续在同一个终端窗口上运行多个持续的命令.

然后,问题又来.我们运行这些命令至后台后,如果想退出终端窗口,那么后台的命令也随之中断.我们得想办法让进程持续运行.这里得使用此命令 nohup

重新执行上边的操作,那么我们应该这样执行

$nohup ./test.sh >> test.log

然后敲logout,放心,再登陆试试ps,进程依然存在!

逃离海内

作者 : admin 于 2008年09月26日, 22:21:00
2008
09-26

突然发现海内今天改版了,我依然玩我的挣车位和好友买卖.看着我那一排轿车,其中还有一台宝马S600,突然有种失落:多日的努力其实只换来一种虚无缥缈的虚荣.虽然同事们都在开心网上玩得不亦乐乎,校内也有大量webgame,我依然坚守在海内.不是因为海内有多优秀,因为曾经我的简历连个简单的邮件回复都没有.最终我想知道这家公司究竟有着怎样的前途.海内终究没有留住我,因为没有什么理由能让我再留恋.汽车就先摆着,我开始上鲜果网,习惯了RSS,这是我上海内唯一的收获了.

我不知道国内sns都有什么样的前景,但我努力留恋的网站始终没有留住我.也许这是国内做服务的网站们始终在研究的一个问题.

由三鹿的三聚氢胺事件想到的

作者 : admin 于 2008年09月25日, 21:02:27
2008
09-25

三鹿元气大伤,短期内难以恢复,结论不好下,我感觉这个牌子是保不住了,结果只有申请破产,或直接被其他品牌收购,给其做代工.最难堪的不是三鹿,而是中国的整个乳品业,犹如多米诺骨牌一样,一个接一个得被拉下水.中国乳品业的动荡不亚于金融危机的来势.

每天我骑车,都经过学院路上北航对门的一个捷安特自行车店,跟其他行业一样,所有的捷安特自行车,不管是哪里卖出去的,只要是此品牌,皆可免费服务,而且小伙子对所有顾客一视同仁,而最让我钦佩的是,其他品牌的自行车到这里,也享受着跟本品牌一样的服务.后我又发现,阿米尼,美利达的服务也是如此.

他们的品牌能持续的发展,在于他们都在培养一个共同的市场,这些品牌在发展市场,并不是靠排挤或降价,而是靠优质的服务来培养了他们的客户,而客户的口碑效应又为他们带来更大的市场.有了一个良好的市场,他们才能得以生存.

而今,我们的互联网环境依然如此,同样的服务,每家都想制定标准,抢占市场.而大量的资金在抢夺资源的时候,是不是考虑,如果共同来培养中国的互联网用户,效果是不是会更好.

值得深思.

网站站内搜索解决方案集锦

作者 : admin 于 2008年09月24日, 09:40:45
2008
09-24

1、小型网站:小的不能再小的,就是数据量很小的,使用select足矣。小网站流量不大,用户不多,数据库搜索是最简洁方便的模式。

2、中型网站:中型网站数据量不小,数据库规模在百万~千万级别,select显然不能应付,如果用数据库搜索,模糊检索是万万不能使用的,效率会很差。标签检索是个不错的方式,但这种方式需要编辑手工得添加标签,工作量巨大,非常浪费人工。使用一个小型的数据库爬虫进行分词检索是正道。推荐分词工具:lucene,ICTCLAS

3、大型网站:把大于千万数据级别的网站统归大型网站。这种网站必须提供非常好的分词与模糊查找机制,在速度,检索的准确度和相关度上都要有可使用性。在处理数据库信息上,使用数据库爬虫依然是不错的办法,而对于大量的文件,文件爬虫也相当重要。在这个级别的网站,推荐使用比较专业的商业软件,比如海量分词,或者一些专业的搜索解决方案。

Nutch配置指南

作者 : admin 于 2008年09月22日, 17:56:36
2008
09-22

//fuck这个破鼠标,写了半天,还没报错,页面就被跳没了!!
重写:
首先,下载相关软件
tomcat http://archive.apache.org/dist/tomcat/tomcat-4/v4.1.37/bin/apache-tomcat-4.1.37.tar.gz
nutch http://apache.mirror.phpchina.com/lucene/nutch/nutch-0.7.2.tar.gz
jdk的配置,看这篇文章 http://www.sunboyu.cn/2008/09/20/centos5%E4%B8%8B%E9%85%8D%E7%BD%AEjdk%E7%8E%AF%E5%A2%83.shtml
顺便写了个脚本

  1. # author:sunboyu@gmail.com
  2. # qq:176300676 msn:sunboyu@gmail.com
  3. # http://www.sunboyu.cn
  4.  
  5. #!/bin/sh
  6. export JAVA_HOME=/opt/jdk1.6.0
  7. export CLASSPATH=.:/opt/jdk1.6.0/lib/tools.jar:/opt/jdk1.6.0/lib/dt.jar:/opt/jdk1.6.0
  8. export PATH=$PATH:/opt/jdk1.6.0/bin
  9. export JRE_HOME=/opt/jdk1.6.0
  10.  
  11. export CATALINA_BASE=/opt/tomcat
  12. export CATALINA_HOME=/opt/tomcat
  13. export CATALINA_TMPDIR=/opt/tomcat/temp

把nutch目录下的nutch-0.7.2.war配置为tomcat下的默认站点
修改tomcat下webapps/ROOT/WEB-INF/classes/nutch-site.xml
增加以下配置

  1. <property>
  2.       <name>searcher.dir</name>
  3.       <value>/local/nutch/crawl</value>
  4.    </property>

启动tomcat!
运行以下nutch命令
bin/nutch crawl urls -dir /test -depth 5 -topN 1000 -threads 5
则可以在/test目录中创建抓取的索引。
然后在tomcat服务中测试下搜索效果!

Nutch开源爬虫+Lucene开源分词工具

作者 : admin 于 2008年09月21日, 19:25:08
2008
09-21

Lucene是一个java写的开源分词工具,官方主页 http://lucene.apache.org/ 是apache下边的一个项目。

Lucene主要应用为分词并创建索引,提供高速的搜索服务,能讲海量的数据进行分词整理并生成轻量的数据包进行索引存储。

Lucene不是一个搜索引擎,但Lucene项目下有个子项目,Nutch爬虫。Nutch同样是基于Java的一个开源的爬虫,配合Lucene的分词索引功能,构建一个强大的开源搜索引擎。

官方Lucene已经更新到2.3.2版本http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_3_2/CHANGES.txt,Nutch已经更新到了0.9版本http://www.apache.org/dist/lucene/nutch/CHANGES-0.9.txt。

在测试中,我使用了Nutch0.7.2 http://apache.mirror.phpchina.com/lucene/nutch/nutch-0.7.2.tar.gz,比较稳定,而且对中文分词的效果也不错,能达到使用的水平,因为没有服务,只在本机做了简单测试,没有对效率进行评估,若哪位达人有闲置服务器,可借老朽一用。

CentOS5下配置JDK环境

作者 : admin 于 2008年09月20日, 15:25:07
2008
09-20

下载jdk安装包 http://www.java.net/download/jdk6/6u10/promoted/b32/binaries/jdk-6u10-rc2-bin-b32-linux-i586-12_sep_2008.bin

编辑/etc/profile

export JAVA_HOME=/opt/jdk1.6.0
export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin
export JRE_HOME=$JAVA_HOME/jre

保存加载配置 : source /etc/profile

然后终端用echo $PATH 监测是否成功。

最后监测 java -version

如果回显出现

java version “1.6.0_10-rc2″
Java(TM) SE Runtime Environment (build 1.6.0_10-rc2-b32)
Java HotSpot(TM) Client VM (build 11.0-b15, mixed mode, sharing)
则证明安装成功

LAMP进阶计划

作者 : admin 于 2008年09月16日, 23:35:35
2008
09-16

lamp进阶计划

1、Linux,Apache,Mysql,PHP最新集成安装脚本,新增优化项

eAccelerator缓冲集成

PHP的SESSION由文件切入内存

DSO模式编译php至Apache

2、PHP代码优化

OOP核心类库完善

通用功能模块的开发

科硕K-5253,中秋中关村淘得

作者 : admin 于 2008年09月16日, 13:12:18
2008
09-16

科硕K-5253移动光驱盒,人民币120元,兼容性据说不错,本人用此盒配先锋DVD刻录,运行正常,但未测试,又购得5片先锋DVD刻录待测试。

 Page 1 of 3  1  2  3 »