WebCollector内核解析—如何设计一个爬虫
本文利用 WebCollector内核的解析,来描述如何设计一个网络爬虫。我们先来看看两个非常优秀爬虫的设计。 NutchNutch由apache开源组织提供,主页:http://nutch.apache.org/ Nutch是目前最好的网络爬虫之一,Nutch分为内核和插件两个模块组成,内核控制整个爬取的逻辑,插件负责完成每个细节(与流程无关的细节)的实现。具体分工如下:内核:控制爬虫按照...
View Article创业公司失败的20大原因 没市场需求排第一
小编按:2014年是中国创业爆发的一年,其中90后创业者更是异军突起,在想法、精力、目标和自由度上都不同于老一辈的人群,小小年纪担任起各种CEO、CFO的角色。当然,我们认识的大多算是成功的案例,事实上,创业失败者也数不胜数,只是不声不响地淹没在人潮中。接下来我们一起来了解下创业公司失败的原因,未来尽可能去避免。美国科技市场研究公司CB...
View ArticleiOS 8 太耗電 ? 11 個小技巧保護你的電池
iOS 8 挾帶著大量的功能更新,鼓勵 iOS 的使用者們將手機或平板升級到最新版本,根據蘋果的開發部門資料顯示,目前已經有將近五成的用戶將系統升級到 iOS 8 版本,如果你是 iPhone 4s 的用戶或是 iPad 2 的使用者,或許會在更新完 iOS 8 之後感覺到電池的電量似乎有點不敷使用,這時候可以試試看以下幾種小技巧,讓你的電池使用時間延長。 確認應用程式耗電情況iOS 8...
View Articlemysql负载,查询优化,索引和锁等
mysql引擎有多种,每种实现的索引方式也不尽相同: 有hash索引,b树索引,b+树索引 我这边接触最大的是innodb引擎: 支持外键和事务:b+树索引的类型“1:InnoDB的主键索引(Primary Key)是Cluster形式的(聚簇索引)。: 按主键值生产b+树,叶子节点放的列的数据 2:InnoDB的非主键索引(Secondary Index)是普通的B-Tree索引。...
View Article转载:Alpha、Beta、RC、GA版本的区别
原文地址:http://www.blogjava.net/RomulusW/archive/2008/05/04/197985.html 引用Alpha:是内部测试版,一般不向外部发布,会有很多Bug.一般只有测试人员使用。 Beta:也是测试版,这个阶段的版本会一直加入新的功能。在Alpha版之后推出。 RC:(Release Candidate) 顾名思义么 !...
View ArticleRoboBinding 0.8.8 发布,Android数据绑定框架
RoboBinding目前是最受欢迎的Android native MVVM框架。其他的有Android Binding,Bindroid等。 RoboBinding是一个实现了数据绑定 Presentation Model( MVVM) 模式的Android开源框架。请看框架介绍与最简单的...
View Articlejavascript的预编译和执行顺序 - LPMJC
最近在复习javascript的事件处理时发现了一个问题,然后也是我来写javascript的预编译和执行顺序的问题 代码:代码一 <html> <head> <title>事件处理</title> <meta http-equiv="content-type" content="text/html;charset=utf-8"/>...
View Article邮件服务器垃圾邮件防范术
从互联网诞生之日起,垃圾邮件就相伴相随,尤其是随着网购的普及,垃圾邮件更呈“遍地开花” 蔓延之势,防不胜防的垃圾邮件轻则令人占用邮箱容量浪费用户时间,重则造成财产损失,因此对垃圾邮件的“严防死守”一直是邮件系统服务商的头等大事之一, 也是衡量一款邮件服务器是否足够优秀的指标之一。我国素来是垃圾邮件的“重灾区”,但近年来这种状况却有所改善,据新华社报道:中国互联网协...
View Article前苹果副总裁:如果你做的事情毫不费力,就是在浪费时间
注:本文作者Heidi Roizen系DFJ Venture合伙人,曾任苹果公司主管开发者关系的高级副总裁,女性 创业者。 Heidi Roizen女士一度是硅谷人人争相学习的典范。她曾创办自己的公司并管理了 14 年之久。后来,她担任苹果公司主管开发者关系的高级副总裁。现在,她是 DFJ Venture...
View Article微信“企业号”构建移动端的B2B平台
近日,微信公众号已经对外公测,“万能的微信”扬言要做企业软件不是一天两天的事了,上周终于在千呼万唤中露出真面目。企业号是微信为企业客户提供的移动应用入口。可以帮助企业建立员工、上下游供应链与企业IT 系统间的连接。利用企业号,企业或第三方合作伙伴可以帮助企业快速、低成本的实现高质量的移动轻应用,实现生产、管理、协作、运营的移动化。...
View Article向左走向右走: InnoDB or MyISAM
欢迎访问个人原创网址 : http://www.phpthinking.com/archives/456 MyISAM 是MySQL中默认的存储引擎,一般来说不是有太多人关心这个东西。决定使用什么样的存储引擎是一个很tricky的事情,但是还是值我们去研究一下,这里的文章只考虑 MyISAM 和InnoDB这两个,因为这两个是最常见的。 下面先让我们回答一些问题: 你的数据库有外键吗?...
View ArticleDelete删除表数据时对性能的影响分析
上一篇博客中提到,当我们用delete删除数据时,因为无法降低高水位,对表做全表扫描时会带来数据库性能问题,而truncate可以大大改善这一状况,下面来看测试SQL> conn zlm/zlmConnected.--创建表之前先记录下剩余表空间大小SQL> select * from dba_free_space where tablespace_name='ZLM';...
View Article利用SpringMVC拦截器控制Controller返回值
背景:需求是在Controller中方法没有实现时,返回模拟结果。主要用于项目初期前台跟后台的交互,Web项目就是在前台发出请求然后后台响应并返回结果。本示例利用拦截器和注解实现跳过执行方法直接返回定义结构的功能。...
View Article[原]内部OA
内部OA 我发现OA正在不断瓦解,一块块模块正在拆分独立,越做越专 当然,现在仍然有许多小公司需要一个什么都有但都很薄的在线SaaS租用 而且各块都在APP化、微信公众账号接入。我把这些列出来的目的是:供大家寻找思路,单独做专。一、公告1、HR、财务、IT 2、各业务部门报喜 3、分享学习会公告 二、会议1、会议室预定、通知/提醒 2、会议汇报文档、会议纪要 3、分享学习会、文档、现场照片、评论交流...
View Articlehadoop中的一次集群任务执行超时问题查找过程
问题背景 本次进行一个项目的重构,在某些活动数据量比较大的情况下,会偶尔出现1200s超时的情况,如下: AttemptID:attempt_1410771599055_11709_m_000033_0 Timed out after 1200 secs 而hadoop会不断启动备份任务进行重试,重试也许成功,但失败的概率还是比较大:...
View Articlejetty和tomcat比较(转)
jetty和tomcat比较两点,性能极佳,配置简单方便。 主要是设计思想的不同。Tomcat 主要是作为 JSP/Servlet 最新规范的参考实现而设计,属于学院派,但是显得庞大而杂乱。Tomcat 的性能很差,一般是作为 Http Server(如 Apache)的插件来用。Jetty 主要是作为企业级产品的嵌入式组件来设计的,可以非常方便地嵌入到其它产品中。而且 Jetty 是作为单独的...
View Article社区O2O最全数据调查报告
社区O2O最全数据调查报告 2014-09-27 亿邦动力网 独家电商新闻,亿邦微信首发 【研究结论】 1. 只有24%的用户认为自己在生活中是个“勤快人”,有69%的用户明确表示,自己的社区没有相关的O2O服务——社区里的懒人经济还大有可为。 2.传统的社区服务通常由中小型的服务个体及物业来完成。其中可能存在效率低下、服务标准不统一等问题。如何解决服务标准化的问题,是社区O2O创业者的第一要义;...
View ArticleP2P融资的监管规则终于来了:必须实名制,只是信息中介平台
针对P2P网贷行业明确的监管原则终于来了。9月27日,中国银监会创新监管部主任王岩岫在“2014中国互联网金融创新与发展论坛”上做了主题演讲,明确说明了银监会对P2P进行监管的十个大原则,其中包括投资人和融资人必须实名登记、P2P机构不能建立资金池、明确P2P平台不是信用中介而是信息中介,以及对P2P行业的几条准入门槛做了圈定,等等。这意味着,作为互联网金融的一个重要模式,接下来P2P将会被纳入到银...
View ArticleAndroid中数据库升级onUpgrade方法说明
Andoird的SQLiteOpenHelper类中有一个onUpgrade方法。帮助文档中只是说当 数据库升级时该方法被触发。经过实践,解决了我一连串的疑问: 1. 帮助文档里说的“数据库升级”是指什么? 你开发了一个程序,当前是1.0版本。该程序用到了数据库。到1.1版本时,你在数据库的某个表中增加了一个字段。那么软件1.0版本用的数据库在软件1.1版本就要被升级了。 2....
View Article