推荐几个免费数据源的网站(送书福利)
说到数据分析,我们会很容易联想到 Python。
因为我们可以拿 Python 对已有的数据做数据分析。
那什么是数据分析?
数据分析指用适当的统计分析方法对收集来的大量数据进行分析,提取有价值的信息。
在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
“啤酒与尿布”的故事就是最典型的数据分析案例。
“啤酒”和“尿布”这两个商品看上去没有关联性。
而沃尔玛将其摆放在一起进行销售、并获得了很好的销售收益。
原因在于沃尔玛对购物篮分析,研究出“啤酒与尿布”之间存在一定关联性。
这就是数据分析的意义。
再例如通过数据分析出北京的空气质量的走势;
分析近 10 年来 NBA 球队战绩和夺冠率之间的关系等等。
说到这里,你也许有疑问。
我没有数据,怎么做数据分析?
别急,我推荐几个免费的数据源网站。
1.awesome-public-datasets
这是一个 GitHub 仓库,其收集的数据所在领域比较广泛,收录政府、金融、计算机网络、软件、体育、气候天气等30个领域的数据。
这些数据集的质量都是比较高,大部分都是免费且能直接下载到的数据。
Github 仓库地址2.FiveThirtyEight
FiveThirtyEight,亦称作 538,是一个专注与民意调查分析,政治,经济与体育的博客。
FiveThirtyEight 维护一个名为 data 的 GitHub 仓库,专门存储数据。
这些数据都来源于 FiveThirtyEight 的官网 。
另外,FiveThirtyEight 被ESPN收购后 扩展了其覆盖的内容,增加了更多诸如政治,体育,科学,经济与流行文化的栏目。
所以我们看到的内容如下:
这些数据都保存在 CSV 文件,我们下载之后就能用来做数据分析。
Github 仓库地址本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 极客猴!