3 月 8 号是国际劳动妇女节,漫威在这天“搞事”了。
上映《惊奇队长》,这部是漫威电影宇宙的第一部女性超级英雄电影,也算是给妇女节献礼。
身为漫威粉丝的我,当时不会错过这部电影,趁着周末去观影。
现如今,漫威电影成为一种潮流文化,各系列电影基本是很卖座,导演的作用是功不可没。
本文主要通过数据来分析,哪位导演是漫威电影的票房收割机。
1.回首十年2008 年,濒临破产的漫威,砸锅卖铁地向美林证券申请 5 亿美金的贷款,准备将重生希望寄托于电影事业。
漫威转型成为独立电影制片公司后,推出第一部电影《钢铁侠》。
虽然主演是三线污点演员的唐尼,不到 2 亿美金的制作成本,但却在全球狂揽 5.8 亿票房。
算是一部很成功的商业电影,这不仅为漫威续命,而且也为漫威 10 年计划打个响炮。
经过 10 年发展,漫威从一个小小的工作室逐渐发展为拥有多个超级 IP 的影视帝国。
让我们用一张图来回顾漫威近 10 年的上映的 20 部电影。
2.数据收集电影的票房、导演、上映时间等信息都能在一些网站找到。
我通过豆瓣、谷歌、IMDb等网站收集到漫威目前 20 部电影的信息,经过详细的整合匹对,整理 ...
上周末,我逛下 B站,偶然发现 B 站打出“在 B 站,用 vlog 记录不平凡”的活动。
这引起我浓厚的兴趣,于是乎,就有了今天这篇思考文章。
1.这两年来,短视频行业发展可谓是爆发增长。
这期间诞生很多成功的产品,例快手、抖音等。
快手诞生比较早,它凭借 9 年时间的运营积累,现成为用户量最多的短视频应用。
而风头正劲, 非抖音莫属。
抖音利用视频结合背景音乐作为爆点,实现用户量指数增长。
这也逐渐形成“北快手,南抖音”的格局。
但是在 2018 年下半年,抖音虽然用户量在增长,但是增长速度变缓慢,有趋于稳定的趋势。
不过这也符合一款产品的发展趋势。
任何一个产品都有其生命周期,一款产品发展趋势大致划分为 4 个阶段。
第一阶段:启动期——功能、内容不全,用户极其稀少;
第二阶段:扩展期——内容和用户开始迅速增长;
第三阶段:稳定期——内容生态规则基本完善,内容仍在增长,但内容消费频次降低,用户增长放缓;
第四阶段:衰退期——内容和用户都开始减少。
另外,当产品处于稳定期时,如果产品还能找到新的增长点,还能迎来新的扩张期。
纵观全局,短视频行业市场、用户增长增速 ...
个人成长
未读去年 6 月份,一个被广大程序员戏称为“全球最大同性交友网站”的 Github 网站,被微软收购了。
在当时 IT 界,这算是轰动一时的大事件。
因为 Github 不仅仅是一个编程工具,一个仓库托管网站,更是开源社区的核心。
据微软称,GitHub 拥有 2800 万用户,8500 万个代码库。
现在,开发工程师越来越喜欢在 Github 上写作,仓库的主题也不限于代码,例如购房踩坑记录、科技资讯周报、面试指南、书籍博客资源翻译、个人网站等。
Github 可以是个知识宝库。
那本文主要内容是介绍如何上手 Github 网站。
1.什么是 Github ?Github 网站上有很多开源项目,每个项目都是一个 Git 仓库,而 Github 就是一个托管 Git 仓库的网站。
毫不夸张地说,Github 迄今为止世界上公开的托管开源项目最多、代码最全、涵盖技术生态最全面、聚集牛人最多的平台。
2.我们为什么需要 Github?Github 本质上是个分享社区。所以我们可以把它当做个写作平台,记录自己编写的代码、记录自己学习的总结等。
如果输出的内容很有价值,会引起别人的关注并 sta ...
月初,自己给公众号指定出新的目标。
在不影响技术文章的输出情况下,输出一些自己所思所想。
本文是第一篇自己思考的文章,可能写得不够好,请见谅,毕竟是新的尝试。
但这也算是自己的输出。在之前,我只是将重点以笔记的形式记录下来自己的思考。
第一篇文章,让我们来聊聊拖延症。
我在知乎看到过一个关于拖延的精彩回答,说得非常好,我就直接引用。
拖延,是心理上的一种逃避,当人们做的事情有困难,不经济,短期看不到反馈,那么人们就会想尽办法去拖延,知道 deadline 前的一段时间内,才匆匆忙忙地去完成整个任务,这件事情。
不可否认,人都有拖延行为,只不过程度的深浅。
比如: 寒风刺骨的冬天,本该到了起床时间,自己跟自己说再睡 10 分钟就起床。
再如: 周末,自己本来计划在家写篇工作报告,但被一部精彩的电视剧所吸引,自己一直跟自己说看完这集就去写报告,结果一拖再拖,周末就过去了,报告也没有写完。
拖延症其实慢性毒药。因为拖延症会慢慢腐蚀高效的状态。
举我自己亲身的例子。我每天到公司第一件事,就是把自己需要做的事情罗列出来,然后设定优先级,再开始工作。而我的工作模式是”单线程”模式,每次做完一 ...
Python爬虫实战
未读在我的童年记忆中,电视台播放的动画片大多都是从日本、美国引进的。
很多动画片算是银幕上的经典,例如:《变形金刚》系列、《猛兽侠》、《蜘蛛侠》、《七龙珠》、《名侦探柯南》、《灌篮高手》、《数码宝贝》等。
但是国产的精品动画篇却寥寥无几,可能是当时我国动漫产业还处在起步阶段。
一晃几十年过去了,现在的国产动漫算是强势崛起,这也涌现出《斗破苍穹》、《秦时明月》、《天行九歌》等优秀的动画片。
2019年1月11日,一部国产动画电影《白蛇:缘起》在全国热映,一经上映便是好评如潮。
这部电影凭借惊艳的花屏,出色的配音取得猫眼 9.4 分、豆瓣 8.0 分的高分成绩。
既然是难得一见的精品,那么我去猫眼上爬爬网友的短评,看看网友们的观点。
1.分析页面估计很多人经常光顾猫眼电影网,猫眼的反爬机制越来越严格,手段也越来越多。
如果选择“刚正面”,爬取 PC 端的页面,可能总体收益不高。
况且,PC 端的页面只有精彩短评,没有全部的网页评论数据。
因此,我选择转移战场,从手机页面入手,看看是否有收获。
将浏览器选择以手机模式浏览器,结果发现手机网页有全部的短评数据。点击“查看全部讨论”,继续抓包分析 ...
数据分析
未读2019 年已悄然过去一个星期,不知你是否有新的收获?
而自己在新年的头一周,一方面忙于工作,试着挑战一些更高难度的工作;另一方面在积极“充电”。
自然而然公众号就拖更了。不过值得庆幸的是,今天更新了。今天给大家分享的内容是如何准确选择图表类型。
虽然文字能很生动形象地描述出一件事或一个人,但是它在数据面前则显得有点吃力。
因为文字描述一些数据时,需要人们去理解,在大脑中做对比。
而图表具有集中、概括、便于分析和比较的特点,能给人一种直观、清晰的感觉;
因此,在数据表示方面,图表比文字更适合。
1.图表类型微软公司在数据图表显示这方面可以算是行家。Excel 作为 Office 三剑客之一,它提供着一些丰富的图表类型。
常见的图表大概能分为 8 种,分别是柱形图、折线图、饼图、条形图、面积图、X Y(散点图)、曲面图、雷达图。
如果将上述图表进行细分,还是划分出很多子类型图表。如:
当然,万变不离其宗。不管子类型图表怎么演变,还是属于上述 8 种图表。大概变化规律有四点:1)二维图形变成三维图形。2)横纵坐标表示值发生改变,如从具体数值变成百分比。3)图形的叠加,如堆积柱形图、簇 ...
苔痕絮语
未读我的 2018 年总结。
流光容易把人抛,红了樱桃,绿了芭蕉。
2018 年已经落下帷幕。每当年末年初时,我都会对过去一年做下总结。
总结下自己在逝去的一年究竟收获什么。
这算是对过去一年的交代,也是对自己一个交代。
1.2018 的收获1-1.学习体系化我收获到第一个关键字是学习体系化。
说到学习,自己一直以“不日进则日退”激励自己。
因为自己内心一直很害怕失败,所以一直在学习,总是希望自己能做得再更好一点。
而我自己的知识来源途径有书籍、博客、公众号等。简单来说,自己遇到不懂的知识,就利用搜索引擎去了解和学习。
但是,这种知识是比较碎片化的。
通过这种方式,自己可能会对某个“点”的知识内容很清楚。
如果知识内容上升到“线”的层面,自己会很茫然。
这像一盘散乱的珠子。
你每一次只能拎出“一个”即止,而不是连续的“一串”。
因此,体系化是学习的正道。
学到的东西只有纳入自己的知识体系中,才算是为自己所用。
不成体系的零碎知识是没有任何价值的。
现在自己接触到新的领域知识,会先画出该领域的思维导图,然后对每个细的分类进行学习。
1-2.深度思考职场上有一句很流行的话「不要用战术上的勤奋 ...
QQ 承载着我们一代人的青春和记忆,一个账号和密码就能体验 QQ 各种功能。
而微信作为一款国民级应用,是每个人手机必安装的软件,同样也需要一个账号登陆才能使用。
纵观各种社交应用、网站,往往都是离不开账号体系。
账号体系中有个重要的功能是账号登录,账号登录涉及到身份认证方法。
我们在模拟登录网站去进行数据采集时,经常需要跟网站的身份认证“斗智斗勇”。
因此,让我们来扒一扒其中的一些原理。
1.基本身份验证我们写的爬虫都是采用 HTTP/HTTPS 协议。
HTTP 协议中有种名为 Basic Authentication(基本身份验证)的验证方式。
这种认证方式在 HTTP/1.0 就定义了。
它的原理是在请求的 Headers 中增加 Authorization 字段,该字段的值是将“用户名:密码”的经过 Base64 编码之后的字符串;然后将其发送给服务器端做校验。
我们进一步理解 HTTP 基本认证的过程:
客户端发送 Request 给服务端。
因为 Request 的 Headers 中没有包含 Authorization 字段,服务器会返回一个 4 ...
Python编程
未读众所周知,程序的性能好坏影响着用户体验。
所以性能是留住用户很重要的一环。
Python 语言虽然能做很多事情,但是有一个不足之处,那就是执行效率和性能不够理想。
因此,更有必要进行一定的代码优化来提高 Python 程序的执行效率。
本文章主要是输出自己在 Python 程序优化的经验。
1.尽量使用内置函数Python 的标准库中有很多内置函数,它们的运行效率都很高。
因为很多标准库是使用 C 语言编写的。
Pyhton 的内置函数有:
原图比较大,排版原因可能导致字体看不清。
在公众号后台中,回复【内置函数】即可获取高清图片。
2.拼接字符串运算符 “+“ 不仅能用于加法运算,还能做字符串连接。
但是这种效率不是很高。
在 Python 中,字符串变量在内存中是不可变的。
如果使用 “+“ 拼接字符串,内存会先创建一个新字符串,然后将两个旧字符串拼接,再复制到新字符串。
推荐使用以下方法:
2-1.使用 “%” 运算符连接这种方式有点像 C 语言中 printf 函数的功能,使用 “%s“ 来表示字符串类型参数,再用 “%“ 连接一个字符串和一组变量。
1234fir = & ...
我们身在行业中,要不断地学习提高自己的能力。
有一种不错的方式来提高自己的技术实力。
那就是阅读别人优秀的代码。
那也许你会有疑问,为何要阅读别人优秀的代码?而不是拿到代码就进行阅读?
正如意大利作家伊塔洛·卡尔维诺的《为什么要读经典》中提到经典于对喜欢它的人构成一种宝贵的经验。
因此,阅读别人的优秀源代码有很多好处,收益也会非常大。
通过大量阅读别人的代码,我们可以采用更先进的方法、风格和架构模式,让自己的技术能力和知识不断的增长。
我收集一些优秀的 Python Web 相关的优秀项目,分享给大家参考学习。
1.flask-adminflask-admin 是基于 flask 框架开发的 admin 管理系统。
该库能基于现有的数据模型,快速创建管理界面。
易用性很高,简单配置参数就能运行。
运行结果如下:
另外,它还是微服务应用,提供很多 API。我们能从中学到微服务架构设计思路、数据(model)-视图(view) 绑定设计等。
Github 仓库地址
2.FlaskBBFlaskBB 基于 Flask 框架做的论坛,轻量级的论坛应用。
虽然具备论坛帖子分类、成员 ...