极客猴 - 不日进则日退

计算机网络

发表于2018-10-162025-10-08 高并发

上篇文章讲了一些高并发相关的知识，相信大家对高并发有些简单的认识。说到高并发，往往离不开分布式系统。人们经常将两者拿来一起讨论，因为高并发（High Concurrency）是互联网分布式系统架构设计中必须考虑的因素之一。可以这么说，目前应用商城上很多社交应用，网络游戏的后台服务都是分布式服务。那具体什么催生出今天的分布式系统呢？文章的主要内容是讲讲大型网站的服务架构演变。 1.初始阶段的网站架构在互联网展露出萌芽的网络时代，网站基本都是小型网站。网站的访客也不是很多，通常会将应用程序、数据库、文件等所有资源都在一台服务器上。这里为 Java Web 服务为例。网站开发者可以使用 Tomcat 等 Web 容器直接运行 JSP 程序，然后将数据存储到数据库，文件直接存放到服务器的磁盘中。就像这样子： 2.应用服务和数据服务分离随着网站业务的发展和用户量的增加，一台服务器就无法再满足需求了。大量用户访问导致访问速度越来越慢，而逐渐增加的数据也会导致存储空间不足。这时需要将 Web 应用和数据分离，分别将存放到不同的服务器：应用服务器、文件服务器和数据库服务器。这样 ...

计算机网络

未读

高并发的那些事

发表于2018-10-052025-10-08 热门高并发

“高并发”对后台开发同学来说，既熟悉又陌生。熟悉是因为面试和工作经常会提及它。陌生的原由是服务器因高并发导致出现各位问题的情况少之又少。同时，想收获这方面的经验也是”摸着石头过河”，需要大量学习理论知识，再去探索。如果是客户端开发的同学，字典中是没有“高并发”这个名词。这验证一句老话，”隔行如隔山”。客户端开发，特别是手机应用开发，更多地是考虑如何优化应用的性能，降低 App 的卡顿率等。本文是一篇科普文，分享自己近来学到的知识。 1.什么是高并发？由于分布式系统的问世，高并发（High Concurrency）通常是指通过设计保证系统能够同时并行处理很多请求。通俗来讲，高并发是指在同一个时间点，有很多用户同时的访问同一 API 接口或者 Url 地址。它经常会发生在有大活跃用户量，用户高聚集的业务场景中。其实，高并发也离我们的生活并不遥远。例如大学学校的选课系统，一到选课的时候，一大批学生同时选课，导致系统出现“不良反应”；再如淘宝的 618 和双 11 的购物活动；遇到节假日，12306 上演的“抢票大战”。另外，DDos 攻击也能算高并发的场景。 ...

苔痕絮语

未读

中秋佳节，不妨读一本好书

发表于2018-09-192025-10-08 絮语阅读

时光荏苒，又值中秋佳节。因为中秋节是我国重要的传统节日，又是非常古老的节日。所以它包括许多民俗文化活动。例如：祭祀月亮以怀念嫦娥, 合家团聚吃月饼，赏月等。我的故乡——潮汕还是能很好传承古代的文化。这得益于两方面：一方面，潮汕人的祖先是北方的大家族，他们为了躲避常年的战乱而来这里栖息；另一方面，潮汕地区的地理位置三面环山，南面朝海，交通不发达。韩愈被贬潮州，曾总结过：“潮之州，大海在其南，群山拥其北”。因此，我们会在这中秋月圆之夜，吃月饼，赏月等，当然还有重要的节日：听老一辈的讲古。我母亲年轻时喜欢读书，加上平时也喜欢听电台的文学节目。所以我母亲经常是主讲人。她会给我们讲成语典故、唐宋时期的民间故事、明朝的史学等。在其中，最让我难忘的还是红楼梦的为人处事之道。因为这两句诗世事洞明皆学问，人情练达即文章。教会我很多。现在我已经毕业工作，深深体会到会做人做事的重要性。这真的能事半功倍。所以，我到现在还是会去阅读这方面的书籍。在这里，我也分享几本好书。 1.《唐浩明评点曾国藩家书（上下册）》曾国藩是一个资质平平的人，然后通过自我意志的“刻意训练”，成就阔大的事业。 ...

Python爬虫入门

未读

带你了解代理 IP 那些事

发表于2018-09-102025-10-08 反爬虫 IP代理

因为 Python 语法简介以及强大的第三方库，所以我们使用它来制作网络爬虫程序。网络爬虫的用途是进行数据采集，也就是将互联网中的数据采集过来。在爬取某些网站时，我们经常会设置代理 IP 来避免爬虫程序被封。我们获取代理 IP 地址方式通常提取国内的知名 IP 代理商（如西刺代理，快代理，无忧代理等）的免费代理。这些代理商一般都会提供透明代理，匿名代理，高匿代理。那么这几种代理的区别是什么？我们该如何选择呢？本文的主要内容是讲解各种代理 IP 背后的原理。 1.代理类型代理类型一共能分为四种。除了前面提到的透明代理，匿名代理，高匿代理，还有混淆代理。从安全程度来说，这四种代理类型的排序是高匿 > 混淆 > 匿名 > 透明。 2.代理原理代理类型主要取决于代理服务器端的配置。不同配置会形成不同的代理类型。在配置中，这三个变量 REMOTE_ADDR，HTTP_VIA，HTTP_X_FORWARDED_FOR 是决定性因素。 2-1.REMOTE_ADDRREMOTE_ADDR 表示客户端的 IP，但是它的值不是由客户端提供的，而是服务器根据客户端的 I ...

Python编程

未读

Python 面试宝典

发表于2018-08-292025-10-08 Python

步入 9 月，徐徐的秋风给酷热的天气带来丝丝凉意。同时，也吹来一股招聘高潮。俗话说“金九银十”，每年的 9、10 月都是招聘高潮。有些小伙伴会参加秋招，有些小伙伴会选择跳槽。猴哥特意给大家送上一份 Python 面试的资料，资料都来源于 github。 1.interview_python该仓库提供的面试题目还是挺全面的，涉及到 Python 语言特性、操作系统、数据库、网络协议、场景面试算法题目。同时，该仓库收集的面试题目也是很有深度。举个栗子，在 Python 语言特性中，提到 Python 的闭包、迭代器和生成器、垃圾回收机制、面向切面编程 AOP 和装饰器等高级用法。如果有小伙伴的算法知识比较薄弱，可以通过做题方式来理解。 Github 仓库地址 2.Algorithm_Interview_Notes-Chinese近两年来，机器学习算是 IT 行业的热点。有热点就有人才需求。如果有小伙伴要面试机器学习的岗位。可以关注下这个仓库。这个仓库主要收集算法、NLP、深度学习、机器学习面试笔记。 Github 仓库地址 3.system-design-prim ...

Python爬虫入门

未读

盘点一些网站的反爬虫机制

发表于2018-08-212025-10-08 反爬虫

因为 Python 语法简介以及强大的第三方库，所以我们使用它来制作网络爬虫程序。网络爬虫的用途是进行数据采集，也就是将互联网中的数据采集过来。网络爬虫的难点其实并不在于爬虫本身。而是网站方为了避免数据被爬取，增加了各种各样的反爬虫措施。如果想要继续从网站爬取数据就必须绕过这些措施。因此，网络爬虫的难点在于反爬的攻克和处理。那么本文主要介绍一些网站的反爬虫措施。 1.妹子图这个网站的反爬虫机制比较简单。当我们使用网络请求库下载图片时，该网站会对检查每个 HTTP 请求的 headers 头部中 Referer 字段。它判断该字段是否为空，如果字段为空，那么不会返回正常显示的图片，而是返回一张带有“图片来自妹子网，请勿盗链”字样的图片。遇到这种机制，突破也是比较简单。对每个 HTTP 请求，将页面的 url 地址填充到 Referer 字段中。 2.豆瓣几乎所有的爬虫新手都会爬取豆瓣练练手。但是豆瓣还是保持开放的态度，反爬虫机制做得还是很人性化。它的反爬虫机制大概如下： 1、在没有携带 cookie 的情况下，如果某个 IP 短时间高并发请求网站，该 IP 会立马被 ...

苔痕絮语

未读

程序员该如何过七夕？

发表于2018-08-172025-10-08 絮语

说的七夕节，我们都会不由自主地想起牛郎织女的传说。这是一个美丽且千古流传的爱情故事。它也是我们四大民间爱情传说之一。传说是牛郎和织女之间情深意重，后来被王母娘娘强行拆散。所以牛郎和织女只等到每年农历七月初七，走上由成千上万的喜鹊组成的桥才得以相会。但不知从哪时起，七夕被人们普遍认为是情人节。但在中国历史上是没有这回事。中国的传统情人节是元宵节(也称为上元节)。在古代，平常女子特别是大家闺秀或小家碧玉，都是”三步不出闺门”。只有到了元宵节，才能走出家门，才有机会和男生幽会谈情。而七夕节又称乞巧节，即女子绣针线活的节日。目的是向织女乞求智慧和巧艺。另外，古代很多文人都是在七夕抒发哀怨之情。例如李清照的《行香子·草际鸣蛩》中写得: 星桥鹊驾，经年才见，想离情、别恨难穷。牵牛织女，莫是离中。甚霎儿晴，霎儿雨，霎儿风。又如白居易的《七夕·烟霄微月澹长空》: 烟霄微月澹长空银汉秋期万古同。几许欢情与离恨，年年并在此宵中。我们中国人向来很注重仪式感。既然七夕节是情人节这一说法已经深入人心。那我们也随着大流过，不然会显得跟别人格格不入。那么重点来了，七夕如何过呢？ ...

Python编程

未读

使用 Python 生成二维码

发表于2018-08-112025-10-08 Python 热门

新时代，人们有人信新的追求，自然而然会有新发明的诞生。去年，在“一带一路”国际合作高峰论坛举行期间，20 国青年投票选出中国的“新四大发明”：高铁、扫码支付、共享单车和网购。其中扫码支付指手机通过扫描二维码跳转到支付页面，再进行付款。这种新的支付方式，造就二维码满天飞的现象。那么让我们来扒一扒如何使用 Python 来生成二维码图片。 1.二维码二维码（2-dimensional bar code），是用某种特定的几何图形按一定规律在平面（二维方向上）分布的黑白相间的图形记录数据符号信息的。它能将数字、英文字母、汉字、日文字母、特殊符号(如空格，%，/ 等)、二进制等信息记录到一个正方形的图片中。因此，在转换的过程中，离不开编码压缩方式。在许多种类的二维条码中，常用的码制有：Data Matrix，Maxi Code，Aztec，QR Code，Vericode，PDF417，Ultracode，Code 49，Code 16K等。二维码在现实生活中的应用越来与普遍，归于功于 QR code 码制的流行。我们常说的二维码就是它。所以，二维码又被称为 QR code ...

苔痕絮语

未读

程序员应该懂点产品知识——竞品分析

发表于2018-08-082025-10-08 絮语

最近产品经理和程序员打架的事件闹得满城风雨。网传事情大概是这样: 一个产品经理给研发提出一个产品需求，要求 app 的主题颜色可以随着用户手机壳颜色改变而变化。然后，两人直接干架。出现这样的新闻，我们不能以看热闹的眼光来看待，应该积极思考背后的原由。众所周知，产品经理和程序员的矛盾一直很存在。既然矛盾一直存在，那我们程序员应如何优雅跟产品经理沟通？沟通的内容往往离不开这些问题:这个需求是否要做？如果做，有什么意义？如果不做，有什么损失？显然，我们要想一一回答这些问题，不能以技术的思维来回答。要懂一些产品知识，从产品的角度切入来解答问题。另外，产品经理有些时候提出这样的需求。竞争对手的产品最近新增某些功能或者接口，但自家产品没有，需要补齐。产品经理一定是将自己产品和竞品做对比之后才提出来的。如果这部分工作由我们来做，我们要如何做对比？从哪些方面做对比呢？针对竞品分析，我自己说下自己的心得。 1.为什么要做竞品分析？除了前面讲到的几点原因，还有一个重要原因。如果我们做了一个竞品分析报告，然后递交给自己团队的 Leader，甚至是 CTO 或者老板。可能会在一定 ...

Python编程

未读

Django 2.1 版本已经来袭

发表于2018-08-042025-10-08 Python Web开发

一个备受关注、很多人都在使用的软件，软件开发团队会定期发布新版本。其主要目的是修复之前一些 Bug 以及新增一些新特性。 Django 作为主流的 Python Web 开发框架，当然也不例外。在几天前，即 8 月 1 号，Django 官方团队发布 Django 2.1 版本。新版本发布，我们可以不用急于更新替换，但要关注新版本的发布内容。我看了下官方的发布公告，总结几个重要的点。 1.Python 版本支持Django 2.1 将不再支持 Python 3.4，最低要求 Python 版本是 3.5。这也意味着 Django 2.0 是最后一个支持 Python 3.4 的版本。 2.模型新增查看权限这个功能，很多开发者都期待了很久。盼星星盼月亮，终于盼来了。在以前的版本中，模型（Model）只有“增删改”权限。新版本增加查看（View）权限。这也意味着在 Model 的 Meta 配置选项中， default_permissions 属性默认值变为 ('add', 'change', 'delete', 'vi ...