`
文章列表
最近写一个小爬虫, 用的htmlparser来解析HTML, 不过, 在解析Object标签时有些不方便,不能准确地拿到子标签对应的理想对象。    下面这样的一段HTML,    <object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0" height="4 ...
         在传统的Web服务器中(如Tomcat或Apache), 当一个请求到来时,服务器会用一个专门的线程来处理这个请求。 这是因为对请求的处理会有IO的阻塞,如果让服务器的主线程来处理的话,它会由于阻塞而不能再接受新请求的处理。         当然,传统的Web服务器用单独线程处理请求也是有缺点的, 当请求数过多时,相应的线程也会多起来,这时线程的管理会是一个很大的开销。        这时,现在NodeJS出现了。按我现在的记忆(也就是从NodeJs的宣传材料那直接抄来的),它相比于传统Web服务器的最大优势是它不再需要单独的线程来处理单个的请求。    ...
            内存溢出与数据库锁表的问题,可以说是开发人员的噩梦,一般的程序异常,总是可以知道在什么时候或是在什么操作步骤上出现了异常,而且根据堆栈信息也很容易定位到程序中是某处出现了问题。内存溢出与锁表则不然,一般现象是操作一般时间后系统越来越慢,直到死机,但并不能明确是在什么操作上出现的,发生的时间点也没有规律,查看日志或查看数据库也不能定位出问题的代码。         更严重的是内存溢出与数据库锁表在系统开发和单元测试阶段并不容易被发现,当系统正式上线一般时间后,操作的并发量上来了,数据也积累了一些,系统就容易出现内存溢出或是锁表的现象,而此时系统又不能随意停机或重启 ...
        很久没用过Java正则表达式了, 今天一个突发任务需要, 磕磕绊绊地用正则表达式完成了。现在趁热打铁地分析下这个正则表达式的写法, 并以此串起正则表达式的一些基本知识点。        问题是这样的, 需要扫 ...
现在公司的CDN节点是这样搞的,        1, LVS作为四层的负载均衡。 2, Nginx作为七层的负载均衡。3, Squid作缓存服务器。 4, 最下面的是实际的业务服务器, Apache集群组。 现在想在客户访问页面时加速处理, 我知道Apache里有pagespeed模块可以对HTML资源进行进行如合并和压缩这样的加速处理。 请问在上图的Nginx这一层能否配置合并或压缩这样的加速处理? 或者说是否还有必要配置?
这段时间在研究怎么能有效地提高Web资源的加载速度, 今天发现Google提价的这个服务, 于是用iteye首页测试了下。            这个是测试结果的链接: http://www.webpagetest.org/result/110815_XT_a590ce7ff3a71fa6a30d78b49ba64b98/     请大家也提提关于这个pageSpeed与Web加速方面的经验。      
实验用例子的总体结构是这样的:           .         |-- ./build.xml         |-- ./lib         |   |-- ./lib/commons-logging-1.1.1.jar         |   `-- ./lib/log4j-1.2.13.jar         `-- ./src             |-- ./src/com             |   `-- ./src/com/sinoi             |       `-- ./src/com/sinoi/dataIO     ...
  运行时, 目录结构如下:        .     |-- ./build     |   `-- ./build/TestAntLoadFile.class     |-- ./build.xml     |-- ./dist     |   |-- ./dist/icpFinder.jar     |   `-- ./dist/icp-finder.properties     |-- ./icp-finder_bak.properties     `-- ./src         `-- ./src/TestAntLoadFile.java    可运如何 ...
  假定任务是这样的: 对于给定字符串,如“threadTest”, 给它再续上个“@”, 最后返回结果。 这些单条任务间没有任何的依赖关系。   假定这样的字符串很多, 如1000个, 而可以创建的线程数不能多于35个。   于是, 就有了线程创建后, 分配任务的问题, 怎么能在代码上优雅地把给定任务组,分配到线程池中, 然后再去收集这些线程处理后的结果?   想用java.util.concurrency中的Future, 可这个好像不能支持批量结果的收集吧?    于是, 用线程很原始地写了个粗暴分配任务与收集结果的代码, 这个很丑陋的。 大家说怎么改进,设计?   ...
    一个signature的demo, 它演示了如何生成一对公私钥,并用私钥对一个字符串签名操作,最后再用公钥来验证的过程。     具体代码见附件。     说明: 1, 这是个用ant的运行的例子,所以得装上ant。 2, 直接运行“ant run”命令,就会看到结果。     感谢http://blog.csdn.net/sunyujia/archive/2008/01/01/2008480.aspx,我把他里面的代码整理了下,并加了个ant脚本。
最近公司某个要卖钱的产品上要用cache的,在选择时两个cache实现进入了视线,OSCache和Ehcache。 那么这两个中选哪一个更好呢?我这里列出几个方面的参考角度, 如下:     1,  活跃程度:      OSCache最新版本是: OSCache最新版本是2.4.1, 最后一次更新日期2007/07/0707, 来源:http://www.opensymphony.com/oscache/download.action    Ehcache方面的开发情况: 最后一次更新日期2010/12/23, 来源:http://sourceforge.net/projects/ehca ...
公司现在做的产品跟Amazon S3相似,对这个Amazon S3不了解,想去体验下, 于是注册了个Amazon S3号, 短信通知我信用卡里被扣了一美元, 这是怎么回事呢?它后面还会不会再扣我钱啦? 把这个账号给注销掉?   呵呵, 这可是我第一笔国际生意啊, 虽说这一美元花的不清不楚的。     
      关注并学习云计算, 在这里记录对云计算的思考,碎得。        从“http://subject.csdn.net/hadoop/”主题中,记录下来如下一些关键词。       “大数据”的价值---以Hadoop为核心。 这个大数据是Hadoop的产生的必要性?是什么导致了Hadoop的产生?它的前世是啥?      “NoHadoop”?----新一代海量数据架构分析。 这篇文章持跟Hadoop相对的观点? 从反面(也就是Hadoop不是什么或它不能做什么)来理解Hadoop可能会有不小的帮助。      “Hadoop已经成为中移动重要数据挖掘工具”, 大 ...
家里电脑装了个Ubuntu系统,相比于Windows系统来说,使用起来真是不方便。   具体罪证如下:    1, 不能与Windows系统视频聊天。因为这个事,被lp给数落了,毕竟耽误了老婆大人跟家人视频。    2, 支付宝没钱了,但不能从建行卡里转钱过来,建行转钱时只支持Windows的安全控件,无语了。    3, 一个普通的MP3文件试了N多解码器,还是播放不了,     4, 自己的MP3插上USB后,系统不能识别,害得老婆连听力也练不成。    应该说,如果上面的这几项能很好地解决后,自己还是很喜欢这个ubuntu系统的, 整体感觉它很瓷实。 
    问题起因:            抛了异常:nested exception is org.hibernate.PropertyNotFoundException: Could not find setter for YEARMONTH on class。            对应的Model里确实没有属性YEARMONTH。 不过名为yearMonth的属性。          对应的查询sql: "        select  a.month_id  as  yearMonth, "          用这样的方式设置了ResultTr ...
Global site tag (gtag.js) - Google Analytics