AI 革命下的内卷风暴

极客猴2023-04-192026-05-15

大家好，我是猴哥。

最近人工智能领域可谓是进展神速，变化是日新月异，每天都有新的东西涌现。

有种“人间一天，AI 一年”的感觉。

一、模型遍地开花

ChatGPT 的火热，点燃整个 AI 领域，继百度打响国内大模型第一枪后，4 月份国内的大厂纷纷推出自己家的大模型。

看到名字第一刻，我还以为是文艺复兴，这名字起的真就太文艺~

商汤的“日日新”大模型

阿里的“通义千问”大模型

腾讯的“混元”大模型

华为的“盘古”大模型

知乎“知海图AI”中文大模型

还有一些产商也跑步入场。

国内的产商开始内卷就算了，国外也开始内卷了。

Meta 公司的“LLaMA”模型源代码遭泄露，模型性能跟 GPT-3 不相上下。

后续斯坦福、UC伯克利等大学都基于“LLaMA”进行魔改。

斯坦福魔改的 stanford_alpaca 模型，仅用了52k数据，性能约等于GPT-3.5。关键是训练成本奇低，不到600美元。

自UC伯克利、卡内基梅隆大学、斯坦福大学和加州大学圣地亚哥分校的研究人员魔改的 Vicuna 模型，据说性能能跟 GPT-4 抗衡。

微软是全球最大的开源贡献者也坐不住了，开源 DeepSpeed，还提供模型训练的云服务功能。

这分明是神仙打架的节奏！

说完模型训练，聊聊跟普通人相关的基于模型的应用。

目前最火爆应该是 Auto-GPT，上周刚出来的时候，我就去 GitHub 看相关的内容。

今天写文章去看下 Star 数，好家伙，star 数直接干到 93.2k

这应用还是基于 ChatGPT 模型，但这应用厉害在于改变与 ChatGPT 交互方式。

之前是在聊天框跟 ChatGPT 进行对话。

Auto-GPT 一出来真就一切都是 auto 了，只要给它制定出一个任务，Auto-GPT 就 auto 起来。

前提是你有 ChatGPT 的 API key。

Claude+ 模型也对外开放注册试用，个人体验之后，Claude+ 更像文科生，GPT-4 是理科生。

借用 TK 教主的图片来做对标。

ChatGPT 和 Claude+ 模型对比

还有 Vercel 提供免费体验 ChatGPT 等模型的网站服务，支持模型还挺多的，还支持最新的 ChatGPT 4 模型。

没有体验过 ChatGPT PLUS 服务的小伙伴，可以去体验下。

虽然是免费，但是每天也是有限制使用次数。

免费体验 ChatGPT 等模型的网站服务

最后，如果你想免费体验上述文档 ChatGPT 服务，但不知道怎么操作。

可以添加猴哥个人微信，领取由猴哥自己整理的 ChatGPT 使用指南。