大家好,我是猴哥。

最近人工智能领域可谓是进展神速,变化是日新月异,每天都有新的东西涌现。

有种“人间一天,AI 一年”的感觉。

一、模型遍地开花

ChatGPT 的火热,点燃整个 AI 领域,继百度打响国内大模型第一枪后,4 月份国内的大厂纷纷推出自己家的大模型。

看到名字第一刻,我还以为是文艺复兴,这名字起的真就太文艺~

商汤的“日日新”大模型

阿里的“通义千问”大模型

腾讯的“混元”大模型

华为的“盘古”大模型

知乎“知海图AI”中文大模型

还有一些产商也跑步入场。

国内的产商开始内卷就算了,国外也开始内卷了。

Meta 公司的“LLaMA”模型源代码遭泄露,模型性能跟 GPT-3 不相上下。

后续斯坦福、UC伯克利等大学都基于“LLaMA”进行魔改。

斯坦福魔改的 stanford_alpaca 模型,仅用了52k数据,性能约等于GPT-3.5。关键是训练成本奇低,不到600美元。

自UC伯克利、卡内基梅隆大学、斯坦福大学和加州大学圣地亚哥分校的研究人员魔改的 Vicuna 模型,据说性能能跟 GPT-4 抗衡。

微软是全球最大的开源贡献者也坐不住了,开源 DeepSpeed,还提供模型训练的云服务功能。

这分明是神仙打架的节奏!

二、与普通人相关的应用

说完模型训练,聊聊跟普通人相关的基于模型的应用。

目前最火爆应该是 Auto-GPT,上周刚出来的时候,我就去 GitHub 看相关的内容。

今天写文章去看下 Star 数,好家伙,star 数直接干到 93.2k

这应用还是基于 ChatGPT 模型,但这应用厉害在于改变与 ChatGPT 交互方式。

之前是在聊天框跟 ChatGPT 进行对话。

Auto-GPT 一出来真就一切都是 auto 了,只要给它制定出一个任务,Auto-GPT 就 auto 起来。

前提是你有 ChatGPT 的 API key。

Claude+ 模型也对外开放注册试用,个人体验之后,Claude+ 更像文科生,GPT-4 是理科生。

借用 TK 教主的图片来做对标。

ChatGPT 和 Claude+ 模型对比

还有 Vercel 提供免费体验 ChatGPT 等模型的网站服务,支持模型还挺多的,还支持最新的 ChatGPT 4 模型。

没有体验过 ChatGPT PLUS 服务的小伙伴,可以去体验下。

虽然是免费,但是每天也是有限制使用次数。

免费体验 ChatGPT 等模型的网站服务

最后,如果你想免费体验上述文档 ChatGPT 服务,但不知道怎么操作。

可以添加猴哥个人微信,领取由猴哥自己整理的 ChatGPT 使用指南。