3 月 8 号是国际劳动妇女节,漫威在这天 “搞事” 了。
上映《惊奇队长》,这部是漫威电影宇宙的第一部女性超级英雄电影,也算是给妇女节献礼。
身为漫威粉丝的我,当时不会错过这部电影,趁着周末去观影。
现如今,漫威电影成为一种潮流文化,各系列电影基本是很卖座,导演的作用是功不可没。
本文主要通过数据来分析,哪位导演是漫威电影的票房收割机。
1. 回首十年 2008 年,濒临破产的漫威,砸锅卖铁地向美林证券申请 5 亿美金的贷款,准备将重生希望寄托于电影事业。
漫威转型成为独立电影制片公司后,推出第一部电影《钢铁侠》。
虽然主演是三线污点演员的唐尼,不到 2 亿美金的制作成本,但却在全球狂揽 5.8 亿票房。
算是一部很成功的商业电影,这不仅为漫威续命,而且也为漫威 10 年计划打个响炮。
经过 10 年发展,漫威从一个小小的工作室逐渐发展为拥有多个超级 IP 的影视帝国。
让我们用一张图来回顾漫威近 10 年的上映的 20 部电影。
2. 数据收集电影的票房、导演、上映时间等信息都能在一些网站找到。
我通过豆瓣、谷歌、IMDb 等网站收集到漫威目前 20 部电影的信息,经过详细的整合匹对,整理 ...
上周末,我逛下 B 站,偶然发现 B 站打出 “在 B 站,用 vlog 记录不平凡” 的活动。
这引起我浓厚的兴趣,于是乎,就有了今天这篇思考文章。
1. 这两年来,短视频行业发展可谓是爆发增长。
这期间诞生很多成功的产品,例快手、抖音等。
快手诞生比较早,它凭借 9 年时间的运营积累,现成为用户量最多的短视频应用。
而风头正劲,非抖音莫属。
抖音利用视频结合背景音乐作为爆点,实现用户量指数增长。
这也逐渐形成 “北快手,南抖音” 的格局。
但是在 2018 年下半年,抖音虽然用户量在增长,但是增长速度变缓慢,有趋于稳定的趋势。
不过这也符合一款产品的发展趋势。
任何一个产品都有其生命周期,一款产品发展趋势大致划分为 4 个阶段。
第一阶段:启动期 —— 功能、内容不全,用户极其稀少;
第二阶段:扩展期 —— 内容和用户开始迅速增长;
第三阶段:稳定期 —— 内容生态规则基本完善,内容仍在增长,但内容消费频次降低,用户增长放缓;
第四阶段:衰退期 —— 内容和用户都开始减少。
另外,当产品处于稳定期时,如果产品还能找到新的增长点,还能迎来新的扩张期。
纵观全局,短视频行业市场、用户增长增速 ...
个人成长
未读去年 6 月份,一个被广大程序员戏称为 “全球最大同性交友网站” 的 Github 网站,被微软收购了。
在当时 IT 界,这算是轰动一时的大事件。
因为 Github 不仅仅是一个编程工具,一个仓库托管网站,更是开源社区的核心。
据微软称,GitHub 拥有 2800 万用户,8500 万个代码库。
现在,开发工程师越来越喜欢在 Github 上写作,仓库的主题也不限于代码,例如购房踩坑记录、科技资讯周报、面试指南、书籍博客资源翻译、个人网站等。
Github 可以是个知识宝库。
那本文主要内容是介绍如何上手 Github 网站。
1. 什么是 Github ?Github 网站上有很多开源项目,每个项目都是一个 Git 仓库,而 Github 就是一个托管 Git 仓库的网站。
毫不夸张地说,Github 迄今为止世界上公开的托管开源项目最多、代码最全、涵盖技术生态最全面、聚集牛人最多的平台。
2. 我们为什么需要 Github?Github 本质上是个分享社区。所以我们可以把它当做个写作平台,记录自己编写的代码、记录自己学习的总结等。
如果输出的内容很有价值,会引起别人的关注并 sta ...
月初,自己给公众号指定出新的目标。
在不影响技术文章的输出情况下,输出一些自己所思所想。
本文是第一篇自己思考的文章,可能写得不够好,请见谅,毕竟是新的尝试。
但这也算是自己的输出。在之前,我只是将重点以笔记的形式记录下来自己的思考。
第一篇文章,让我们来聊聊拖延症。
我在知乎看到过一个关于拖延的精彩回答,说得非常好,我就直接引用。
拖延,是心理上的一种逃避,当人们做的事情有困难,不经济,短期看不到反馈,那么人们就会想尽办法去拖延,知道 deadline 前的一段时间内,才匆匆忙忙地去完成整个任务,这件事情。
不可否认,人都有拖延行为,只不过程度的深浅。
比如:寒风刺骨的冬天,本该到了起床时间,自己跟自己说再睡 10 分钟就起床。
再如:周末,自己本来计划在家写篇工作报告,但被一部精彩的电视剧所吸引,自己一直跟自己说看完这集就去写报告,结果一拖再拖,周末就过去了,报告也没有写完。
拖延症其实慢性毒药。因为拖延症会慢慢腐蚀高效的状态。
举我自己亲身的例子。我每天到公司第一件事,就是把自己需要做的事情罗列出来,然后设定优先级,再开始工作。而我的工作模式是” 单线程” 模式,每次做完一 ...
在我的童年记忆中,电视台播放的动画片大多都是从日本、美国引进的。
很多动画片算是银幕上的经典,例如:《变形金刚》系列、《猛兽侠》、《蜘蛛侠》、《七龙珠》、《名侦探柯南》、《灌篮高手》、《数码宝贝》等。
但是国产的精品动画篇却寥寥无几,可能是当时我国动漫产业还处在起步阶段。
一晃几十年过去了,现在的国产动漫算是强势崛起,这也涌现出《斗破苍穹》、《秦时明月》、《天行九歌》等优秀的动画片。
2019 年 1 月 11 日,一部国产动画电影《白蛇:缘起》在全国热映,一经上映便是好评如潮。
这部电影凭借惊艳的花屏,出色的配音取得猫眼 9.4 分、豆瓣 8.0 分的高分成绩。
既然是难得一见的精品,那么我去猫眼上爬爬网友的短评,看看网友们的观点。
1. 分析页面估计很多人经常光顾猫眼电影网,猫眼的反爬机制越来越严格,手段也越来越多。
如果选择 “刚正面”,爬取 PC 端的页面,可能总体收益不高。
况且,PC 端的页面只有精彩短评,没有全部的网页评论数据。
因此,我选择转移战场,从手机页面入手,看看是否有收获。
将浏览器选择以手机模式浏览器,结果发现手机网页有全部的短评数据。点击 “查看全部讨论”,继续抓包分析 ...
数据分析
未读2019 年已悄然过去一个星期,不知你是否有新的收获?
而自己在新年的头一周,一方面忙于工作,试着挑战一些更高难度的工作;另一方面在积极 “充电”。
自然而然公众号就拖更了。不过值得庆幸的是,今天更新了。今天给大家分享的内容是如何准确选择图表类型。
虽然文字能很生动形象地描述出一件事或一个人,但是它在数据面前则显得有点吃力。
因为文字描述一些数据时,需要人们去理解,在大脑中做对比。
而图表具有集中、概括、便于分析和比较的特点,能给人一种直观、清晰的感觉;
因此,在数据表示方面,图表比文字更适合。
1. 图表类型微软公司在数据图表显示这方面可以算是行家。Excel 作为 Office 三剑客之一,它提供着一些丰富的图表类型。
常见的图表大概能分为 8 种,分别是柱形图、折线图、饼图、条形图、面积图、X Y(散点图)、曲面图、雷达图。
如果将上述图表进行细分,还是划分出很多子类型图表。如:
当然,万变不离其宗。不管子类型图表怎么演变,还是属于上述 8 种图表。大概变化规律有四点:1)二维图形变成三维图形。2)横纵坐标表示值发生改变,如从具体数值变成百分比。3)图形的叠加,如堆积柱形图、簇 ...
我的 2018 年总结。
流光容易把人抛,红了樱桃,绿了芭蕉。
2018 年已经落下帷幕。每当年末年初时,我都会对过去一年做下总结。
总结下自己在逝去的一年究竟收获什么。
这算是对过去一年的交代,也是对自己一个交代。
1.2018 的收获 1-1. 学习体系化我收获到第一个关键字是学习体系化。
说到学习,自己一直以 “不日进则日退” 激励自己。
因为自己内心一直很害怕失败,所以一直在学习,总是希望自己能做得再更好一点。
而我自己的知识来源途径有书籍、博客、公众号等。简单来说,自己遇到不懂的知识,就利用搜索引擎去了解和学习。
但是,这种知识是比较碎片化的。
通过这种方式,自己可能会对某个 “点” 的知识内容很清楚。
如果知识内容上升到 “线” 的层面,自己会很茫然。
这像一盘散乱的珠子。
你每一次只能拎出 “一个” 即止,而不是连续的 “一串”。
因此,体系化是学习的正道。
学到的东西只有纳入自己的知识体系中,才算是为自己所用。
不成体系的零碎知识是没有任何价值的。
现在自己接触到新的领域知识,会先画出该领域的思维导图,然后对每个细的分类进行学习。
1-2. 深度思考职场上有一句很流行的话「不要用战术上的勤奋 ...
QQ 承载着我们一代人的青春和记忆,一个账号和密码就能体验 QQ 各种功能。
而微信作为一款国民级应用,是每个人手机必安装的软件,同样也需要一个账号登陆才能使用。
纵观各种社交应用、网站,往往都是离不开账号体系。
账号体系中有个重要的功能是账号登录,账号登录涉及到身份认证方法。
我们在模拟登录网站去进行数据采集时,经常需要跟网站的身份认证 “斗智斗勇”。
因此,让我们来扒一扒其中的一些原理。
1. 基本身份验证我们写的爬虫都是采用 HTTP/HTTPS 协议。
HTTP 协议中有种名为 Basic Authentication(基本身份验证)的验证方式。
这种认证方式在 HTTP/1.0 就定义了。
它的原理是在请求的 Headers 中增加 Authorization 字段,该字段的值是将 “用户名:密码” 的经过 Base64 编码之后的字符串;然后将其发送给服务器端做校验。
我们进一步理解 HTTP 基本认证的过程:
客户端发送 Request 给服务端。
因为 Request 的 Headers 中没有包含 Authorization 字段,服务器会返回一个 4 ...
众所周知,程序的性能好坏影响着用户体验。
所以性能是留住用户很重要的一环。
Python 语言虽然能做很多事情,但是有一个不足之处,那就是执行效率和性能不够理想。
因此,更有必要进行一定的代码优化来提高 Python 程序的执行效率。
本文章主要是输出自己在 Python 程序优化的经验。
1. 尽量使用内置函数 Python 的标准库中有很多内置函数,它们的运行效率都很高。
因为很多标准库是使用 C 语言编写的。
Pyhton 的内置函数有:
原图比较大,排版原因可能导致字体看不清。
在公众号后台中,回复【内置函数】即可获取高清图片。
2. 拼接字符串运算符 “+“ 不仅能用于加法运算,还能做字符串连接。
但是这种效率不是很高。
在 Python 中,字符串变量在内存中是不可变的。
如果使用 “+“ 拼接字符串,内存会先创建一个新字符串,然后将两个旧字符串拼接,再复制到新字符串。
推荐使用以下方法:
2-1. 使用 “%” 运算符连接这种方式有点像 C 语言中 printf 函数的功能,使用 “% s“ 来表示字符串类型参数,再用 “%“ 连接一个字符串和一组变量。
1234fir = & ...
我们身在行业中,要不断地学习提高自己的能力。
有一种不错的方式来提高自己的技术实力。
那就是阅读别人优秀的代码。
那也许你会有疑问,为何要阅读别人优秀的代码?而不是拿到代码就进行阅读?
正如意大利作家伊塔洛・卡尔维诺的《为什么要读经典》中提到经典于对喜欢它的人构成一种宝贵的经验。
因此,阅读别人的优秀源代码有很多好处,收益也会非常大。
通过大量阅读别人的代码,我们可以采用更先进的方法、风格和架构模式,让自己的技术能力和知识不断的增长。
我收集一些优秀的 Python Web 相关的优秀项目,分享给大家参考学习。
1.flask-adminflask-admin 是基于 flask 框架开发的 admin 管理系统。
该库能基于现有的数据模型,快速创建管理界面。
易用性很高,简单配置参数就能运行。
运行结果如下:
另外,它还是微服务应用,提供很多 API。我们能从中学到微服务架构设计思路、数据 (model)- 视图 (view) 绑定设计等。
Github 仓库地址
2.FlaskBBFlaskBB 基于 Flask 框架做的论坛,轻量级的论坛应用。
虽然具备论坛帖子分类、成员 &#x ...