大模型之三观
本期封面聚焦“大模型”。为什么要研究大模型?大模型是新一代人工智能技术发展的焦点,“人工智能”一直都是媒介杂志的常设议题,选题有价值,团队有积累,自然成立。那如何研究大模型?是谈技术还是聊产品?编辑部锁定“大模型如何应用落地”这个视角,顺着这个思路追踪行业发展,总结出中国大模型发展遵循产业实用主义的大胆结论。
如何理解中国大模型的“产业实用主义”?笔者认为,有三个方面,可以为其做注解。
一看演化逻辑。信息产业在数据化、平台化、智能化、融合化的驱动之下不断演进,通往新时代的大幕已经开启,虽然舞台情节不断变化,从数字人、元宇宙再到今天的大语言模型,但背后的两股力量始终存在。一是技术进步的必然;二是资本注入的推演。20年前,我们谈互联网技术出现为信息传播业带来的变革时提到无限生产、无限分发、无限消费,“三个无限”彻底颠覆了原有传播机制,引领了产业走向。当想象足够诱人形成风口,风险资本大举进入,并用“以未来倒逼现在”的惯用打法助推行业热潮,在资本的鼓动与激励之下,引发更多的产业资源进场,直至巅峰状态,然后回落。每当有新的技术出现,就会有一场相似的情节上演。
二看技术本质。本期的主题“大模型”,其所涵盖的技术发展内在逻辑与早先的技术产业演化在底层是相互连通的。互联网普及发展,数据喷涌而出,为大模型提供了足够的“食料”,辅之以宏大容量和超高速率运行的计算能力,经过模仿人脑结构的计算模型(深度神经网络)从数据中进行学习训练,不断涌现出强大的能力。大模型能力的关键就在数据、算力和算法。同时,数据规模激增且运行加速,进一步带来信息传播聚合的“乘数效应”,同时,也支撑着个体沟通分散破碎的“除数效应”。既有分散又有聚合,成为一个硬币的两面,生生不息,运动不止。大模型将遵循这样的基本运行规律持续不断的迭代演进。
三看产业落地。大模型自2022年11月OpenAI发布ChatGPT以来,两年不到的时间,行业已浮现了各代各类的大模型无数,分化出各式各样的发展路径,本期编辑部通过六个案例窥探大模型行业的众生相。事实上,单有模型这个技术果实,没有产业做根基滋养,实难持续。通用模型的能力足够惊人和全能了,但是缺乏专业数据的情况下,也只能写诗对话,所以才有垂直行业大模型。一场喧嚣之后,我们已经有了大模型这把“锤子”,也通过落地产业发现了一个个应用场景的“钉子”。未来大模型能否做事干活,深入产业场景解决复杂问题,是其持续发展的关键。中国大模型企业正是沿着这一思路在向前推进,六个案例中,有华为云用算力基座和行业大模型服务B端,并搭建生态;有百度云强调基建,发力AI原生应用,扩散到各行各业;蚂蚁集团基于支付宝的大数据积累,从金融行业大模型出发,持续衍生到更多领域……
一场轰轰烈烈的“大模型大产业大建设”已开启,舞台上的精彩故事还会继续上演,有高调聚光的巨头大厂,也会有中途落寞退场的小小玩家,更可能有高手一直在场,故事继续,但景移人非,正所谓花落又花开,皆有所期。
|