1.LLM模型是阿里的新秀,其中包括m6和plug。阿里计划在下半年云栖大会上公布进展,这个模型大概能达到GPT2.5的水平。
2.文心一言是基于Bert的模型,能够至少达到GPT-2.5的水平。专家认为他是目前国内第一应该争议不大,阿里大模型采用Transformer架构。
3.目前,阿里云在国内拥有最多的AI算力储备,拥有上万片A100。总体而言,阿里云能够达到10万片。相比之下,字节和百度的AI算力储备稍次,而腾讯则与阿里相差不远。
4.腾讯的大模型是继续迭代混元模型,大概有100人在进行GPT复现以及自我模型迭代。
5.阿里对于AI大模型的发展采取稳扎稳打的策略,注重技术的稳定性和可靠性。
6.如果采用ChatGPT进行推理任务,大概需要5张A100在2秒钟内完成一次推理。这种大规模应用的成本很高,冲击也很大。
$百度(BIDU)$ $阿里巴巴(BABA)$ $三六零(SH601360)$