OpenAI的ChatGPT发布已经半年多了,国内的AI大模型该亮相的已经差不多都亮相了。大致分为以下几类:
一、改头换面的
这类包括百度的文心千帆,科大讯飞的星火,阿里的通义千言。基本上就是大厂火速训练出来一个大模型,然后把过去各种AI的云服务,加上现在能做的AIGC的服务都搞成云服务,包装出来一个所谓的MaaS(模型即服务)。赚快钱的心,那是比谁都猴急。
二、剑走偏锋的
这类包括腾讯和字节。腾讯云的混元大模型还不知道啥时候能落地,先拉着几十个行业去搞垂直大模型,通用咱搞不出来,先搞个行业大模型商店再说,先把小B市场能吃都吃掉。
字节搞了一个「火山方舟」,有点像商业版的Huggingface,提供了一个大模型服务平台。管你啥大模型,我都可以让你在什么跑:什么百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等等等等。
三、借壳炒作的
这类厂商其实缺乏自己训练大模型的能力,但不妨碍找个大模型厂商,拿人家的基座大模型过来,加上自己行业数据,训练一个垂直行业大模型,美其名曰:自研的领先的国产大模型。例如某数字安全公司,其发布的大模型,其实就来在于清华大学唐杰教授团队的智谱AI。
四、有点内涵的
当然,不是所有的国产大模型都不靠谱,以下几家还是有点内涵的:
例如从商汤出来的团队训练的MiniMax,也是自研了好几年了,起步很早;
还有清华大学唐杰教授的智谱,其开源的版本ChatGLM仍然是国内最好的开源大模型;
此外彭博开发的开源AI大模型RWKV,在架构上也非常有创新,令人敬佩。
此外,商业大厂里面,华为盘古大模型看起来更实在一点,就是踏踏实实做传统的大B行业,结合华为的To B和To G市场的优势,还是有一席之地的。
本文来自微信公众号:CTO范凯,如有侵权请告知删除
推荐阅读
| 产品体验|
以上的截图(模板)均来源于我们的AI助手: 知否AI问答,一个基于清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型 GLM-130B 开发的平台,它提供专业、高速、稳定的文案生成与问答功能。微信扫码一键登录,无需其他复杂验证,新用户可免费试用。
欢迎体验ChatGPT-知否AI问答,为您提供专业、高速、稳定的文案生成与问答服务!
产品网址:
产品支持60余个应用场景,包括论文助手、公司文案、营销文案、多语言翻译、行政公文、科研课题、招投标书、辅助编程、学习与教育、生活娱乐等各个领域。
评论