OpenAI的ChatGPT发布已经半年多了,国内的AI大模型该亮相的已经差不多都亮相了。大致分为以下几类:

一、改头换面的

这类包括百度的文心千帆,科大讯飞的星火,阿里的通义千言。基本上就是大厂火速训练出来一个大模型,然后把过去各种AI的云服务,加上现在能做的AIGC的服务都搞成云服务,包装出来一个所谓的MaaS(模型即服务)。赚快钱的心,那是比谁都猴急。

二、剑走偏锋的

这类包括腾讯和字节。腾讯云的混元大模型还不知道啥时候能落地,先拉着几十个行业去搞垂直大模型,通用咱搞不出来,先搞个行业大模型商店再说,先把小B市场能吃都吃掉。

字节搞了一个「火山方舟」,有点像商业版的Huggingface,提供了一个大模型服务平台。管你啥大模型,我都可以让你在什么跑:什么百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等等等等。

三、借壳炒作的

这类厂商其实缺乏自己训练大模型的能力,但不妨碍找个大模型厂商,拿人家的基座大模型过来,加上自己行业数据,训练一个垂直行业大模型,美其名曰:自研的领先的国产大模型。例如某数字安全公司,其发布的大模型,其实就来在于清华大学唐杰教授团队的智谱AI。

四、有点内涵的

当然,不是所有的国产大模型都不靠谱,以下几家还是有点内涵的:

例如从商汤出来的团队训练的MiniMax,也是自研了好几年了,起步很早;

还有清华大学唐杰教授的智谱,其开源的版本ChatGLM仍然是国内最好的开源大模型;

此外彭博开发的开源AI大模型RWKV,在架构上也非常有创新,令人敬佩。

此外,商业大厂里面,华为盘古大模型看起来更实在一点,就是踏踏实实做传统的大B行业,结合华为的To B和To G市场的优势,还是有一席之地的。

本文来自微信公众号:CTO范凯,如有侵权请告知删除

推荐阅读