AI 革命下的内卷风暴
大家好,我是猴哥。
最近人工智能领域可谓是进展神速,变化是日新月异,每天都有新的东西涌现。
有种“人间一天,AI 一年”的感觉。
一、模型遍地开花
ChatGPT 的火热,点燃整个 AI 领域,继百度打响国内大模型第一枪后,4 月份国内的大厂纷纷推出自己家的大模型。
看到名字第一刻,我还以为是文艺复兴,这名字起的真就太文艺~
商汤的“日日新”大模型
阿里的“通义千问”大模型
腾讯的“混元”大模型
华为的“盘古”大模型
知乎“知海图AI”中文大模型
还有一些产商也跑步入场。
国内的产商开始内卷就算了,国外也开始内卷了。
Meta 公司的“LLaMA”模型源代码遭泄露,模型性能跟 GPT-3 不相上下。
后续斯坦福、UC伯克利等大学都基于“LLaMA”进行魔改。
斯坦福魔改的 stanford_alpaca 模型,仅用了52k数据,性能约等于GPT-3.5。关键是训练成本奇低,不到600美元。
自UC伯克利、卡内基梅隆大学、斯坦福大学和加州大学圣地亚哥分校的研究人员魔改的 Vicuna 模型,据说性能能跟 GPT-4 抗衡。
微软是全球最大的开源贡献者也坐不住了,开源 DeepSpeed,还提供模型训练的云服务功能。
这分明是神仙打架的节奏!
二、与普通人相关的应用
说完模型训练,聊聊跟普通人相关的基于模型的应用。
目前最火爆应该是 Auto-GPT,上周刚出来的时候,我就去 GitHub 看相关的内容。
今天写文章去看下 Star 数,好家伙,star 数直接干到 93.2k
这应用还是基于 ChatGPT 模型,但这应用厉害在于改变与 ChatGPT 交互方式。
之前是在聊天框跟 ChatGPT 进行对话。
Auto-GPT 一出来真就一切都是 auto 了,只要给它制定出一个任务,Auto-GPT 就 auto 起来。
前提是你有 ChatGPT 的 API key。
Claude+ 模型也对外开放注册试用,个人体验之后,Claude+ 更像文科生,GPT-4 是理科生。
借用 TK 教主的图片来做对标。
还有 Vercel 提供免费体验 ChatGPT 等模型的网站服务,支持模型还挺多的,还支持最新的 ChatGPT 4 模型。
没有体验过 ChatGPT PLUS 服务的小伙伴,可以去体验下。
虽然是免费,但是每天也是有限制使用次数。
最后,如果你想免费体验上述文档 ChatGPT 服务,但不知道怎么操作。
可以添加猴哥个人微信,领取由猴哥自己整理的 ChatGPT 使用指南。