天气一天天热了起来。由于工作比较饱和,觉得这一个月很漫长,但却也是一转眼就过去了。春天有点困,做起事来稍显倦怠。总想写一些东西,但思绪太碎片化了,没法成文,就都拖延到了月底,把碎碎念塞到了这一篇里。 -------------------------------------- ... »
清明假期回了趟家。 和友人一同逛了逛三好街,说起来已经有两年没来逛逛这里了。 对这里最早的记忆,是非常小的时候,我爸带着我来这里找人修理电脑。 再后来,是经常和同学在周末到这里扫货,买些杂志什么的,顺便看看数码产品。 印象中的三好街,总是人声鼎沸,非常热闹。但这次,感觉不 ... »
在爬虫爬网页的时候,需要避免重复抓同一个网页,来提高爬取效率,避免不必要的开销,这就需要使用一些判重的方法。 数据库 一种比较常见的方法是用数据库。这也是实现分布式爬虫去重的一个比较简单的方案。简单来说就是多个爬虫可以共享同一个数据库,把爬过的url写进去,在爬url前从数据库 ... »
这一篇主要是因为在饭否上看到一条消息: > @量子小熊: 每个声称自己会Scala的,我都让他写尾递归的List反转,目前还没有一个写出来的,知道啥是尾递归的都是稀有动物。 吓得我赶快复习了一下尾递归(可惜并不会Scala)。怎么说也是SICP从入门到放弃的人,不懂这 ... »
就像你可能不知道 现充 其实是 现实生活很充实的人生赢家 的缩写一样,我们经常看到Github上的码农们在code review时,把乱七八糟的缩写写得到处都是——娴熟的司机们都会使用缩写来达到提高逼格的效果——我们第一次看到时还是会出现一脸懵逼的状况,这里整理一下这些缩写都是什 ... »