元宇宙网:“通义千问”来了,阿里将为白热化的AI大模型赛道带来什么

AI2年前 (2023)更新 admin
155,059 0

去年11月底ChatGPT一鸣惊,掀起了一股“AI技术革命”的浪潮。围绕人工智能改变世界、改变人类未来的讨论疯狂刷屏,而在热闹喧嚣的舆论外,国内各家大厂也在这场新一轮加速的AI竞赛加足马力、全力跟进。

元宇宙网:“通义千问”来了,阿里将为白热化的AI大模型赛道带来什么
3月16日,百度推出“文心一言”,标志着中国企业正式踏入这一AI新赛道,而这无疑只是一个开始。中国在这个全新的AI时代能做什么?还有多少潜力可以挖掘?我们能否赶上OpenAI创造新的可能?AI新时代震撼冲击下所有人中的疑问,也是中国业们亟需完成的答卷。

4月7日,阿里巴巴旗下的大语言模型——“通义千问”开启业邀测。负责人阿里云智能CTO周靖人的话说,它不是起点、也不是终点,而是阿里自主探索路上的“节点”。然而,“义千问”的体验仍足够令人眼前一亮。而它所依托的阿里,则要凭借自己的独优势在这条日趋拥挤的AI道上,回答外界的疑问、造新的可能。

1、“义千问”企业邀测开启:超出预期的体验

“AI时代开始了。”

这是比尔·盖茨去年9月体验过ChatGPT的惊人表现后得出的结论。2月10日,盖茨接受德国《商报》播客采访时,将当前的AI发展称为“最重要的创新”,而ChatGPT应用“将改变我们的世界”。随后他在3月21日发表博客文章,进一步阐释了ChatGPT为何是继用户界面后最重要的技术革命。

虽然未必严谨,但ChatGPT正在引爆新的技术革命,已经成为业内和公众某种程度上的共识,至少引发了类似的思考。从表面上看,作为聊天机器人,它互动、回答、创作的准确度在不少情况下可以媲甚至超过人类

而透过花样繁多的现象案例,在超强算力的给力支持下,经过充分的训练和深度学习,ChatGPT不仅强于历史上所有的AI,更大的悬念在于,如果它以强于普通人能力持续成长,“AI巨兽”未来可能实现的潜能界在哪里?

正是这样的特质、能力与潜力,GPT无疑正在改变人类社会生活的方方面面:小到一个个可能被取代的人类岗位,中到未来商业模式投融资方向,大到可能被冲击、重塑经济产业结构,甚至国与国之间的竞争,人类社会如何自处、如何与AI共处……变革正在发生,GPT所牵出的不确定性,恐怕要甚于它自带的能力。

变革与不确定性笼罩下,两种截然相反的动向竟然在同时同步地进:一方面,马斯克与上千名业内人士发出联名信,呼吁暂停训练比GPT-4更强大的AI系统意大利政府甚至禁止使用ChatGPT;另一方面,中国企业不敢懈怠,正在加速研发类似的AI大模型,争取进入领先道、参与头部竞争。

度用“一言”打响了第一枪,华为“盘古”大模型何时上线也牵动外界注意力。但大家的期待显然不止于此。作为互联网行业领先的巨头,早已开始默默准备的阿里何时做出反应?4月7日开启企业邀测的“通义千问”,可能是阿里答卷的开篇。

“千问,千万次的问,千万的问,能问出千问的一定是真,能回答千问的,也一定是真有学问,以及,AI和我们一样,都有千万次交互的热情。”作为大模型发者,阿里巴巴达摩院如此解释它的命名。是否经得起“千万次的问”,是所有邀测人士的共同关切。

相比于几前的天猫精灵大模型版的演示版本,据说这次邀测的是“完整版”阿里GPT。通义千问亮相之前,达摩院曾发世界首个突破10万亿AI大模型,还联中国计算机学会(CCF)开源委员,搭建了国内规模最大AI模型服务社区“魔搭”。通义千问的出现,早有伏笔

在测试实践体验中,用知名互联网消费互动媒体TechWeb的话说,“有惊喜也有惊讶”。

它的主界面简洁明了,明确介绍自己是“专门响应人类指令的大模”,给出了电影脚本写封邮件职场助理撰写短文等示例。值得注意的是,通义千问还有单独的“百宝袋”板块,演示并提供了九种特定话题场景文本体裁的内容输出

作为中国造,中文无疑是通义千问明显的“母语优势”。在各种对话实例中,它对中语义的理解能力(包括诸如“李四壮差点上上上上海”这类拗口语句)、逻辑推断能力、科技与知识理解分享文学理解与创作应用写作等方面,均表现出不逊于GPT3.5、与文心一言各有所长的特点。

当然,它在其它语言中的表现也并不差。

通义千问目前尚不能直接生成图片,专注于生成文本编写代码内容输出领域。它生成的答案看起来比ChatGPT和文心一言更偏向于理性、注重逻辑、严谨,似乎更擅长于科学类知识(或许是此前阿里基于业务需要的训练倾向所致)。

它不会混淆“苹果电脑”和“自苹果”,写出的小学生作文被在读学生认定为“小学年级平”,SWOT(强弱危机)分析颇具工作实用性,甚至敢写多场景切换的《流浪地球3》剧本……

常规问答逻辑正常,专门领域输出质量在线,功能宝库齐全,通义千问或许暂时不能比肩OpenAIGPT4技术,但它的“即战力”足以证明自己是AI赛道上的新晋实力派玩家,潜力和前景更值得期待。

至少在被ChatGPT搅动心绪、又担心亚洲账号封禁的当下,我们将拥有一个可以畅通无阻的自家代表。

2、久久为功、厚积薄发:AI赛道日益拥挤,阿里何以创造新的可能性?

大家都在抢做聊天机器人,OpenAI、百度与阿里的大模类型相似、性能对比有来有回,那么阿里加入竞赛的意义仅限于“不能落后”吗?随着AI新赛道日益拥挤,阿里有何独特优势,从而跳出“内卷”窠臼、创造新的可能?

这便要理解阿里对“通义千问”的定位:它不只是个聊天界面,而是大语言模型打造AI大模型门槛极高,但大模型的基础设施开放平台能开拓无尽的前沿边界,实现前所未有的潜能。这便是“通义千问”这个“中间节点”所折射出的阿里AI战略之路。

之所以说是“中间节点”,是因为阿里的大模型探索之路从2019年便已经开始,经过近几年的技术迭代,用周靖人的话说,大语言模型已开始能根据自然语言理解有效地提取人类大量的知识体系

为了做到这一点,大模型的研发动辄要超千亿参,其难度远远超出了单一的算法GPU芯片的简单堆砌。这是一个囊括底层算力网络存储大数据AI框架AI模型等复杂技术的系统性工程,需要的是AI云计算的全栈技术能力。更简单地说,当下的AI大模型竞争,本质上就是算力竞争。

阿里的提前准备,为自己建构了实力引领的先发优势。阿里达摩院在国内率先布局AI技术与大模型研发,2021年先后发布了国内首个超百亿参数的多模态大模型M6与及被称为“中文版GPT-3”的语言大模型PLUG,此后还训练实现了全球首个10万亿参数AI模型。2022年达摩院推出的通义大模型系列,更是在语言及多模态能力、超大模型、通用统一模型等多个技术维度上处于国内第一梯队。

在核心竞争力——力层面,阿里云是国际权威机构Gartner榜单中亚洲第一、全球第三云计算服务商。尤其在2021年底Gartner厂商整体能力评估中,阿里云IaaS基础设施能力拿下全球第一,在计算存储网络安全四项核心评比中均斩获最高分。

此外,阿里在去年8月底推出的“飞天平台”是国内最大规模智能算力中心,阿里云机器学习平台PAI更是以数倍的量级提升了AI训练和推理效率。多年的耐心准备与坚持探索,令阿里具备了强大的云计算基础设施能力、深厚的大模型技术积淀,这正是其加入本轮AI技术竞赛、持续竞逐“兵家必争之地”的核心优势。

透过阿里的优势与“先发制人”的势头,外界似乎窥见了这家头部大厂更宏大的战略布局:阿里要做的,并不只是可以媲GPT的同质模型。

围绕多模态大模型的早早布局,表明阿里早已注意到AI发的最新动向,把握不同的路线选择、提早在业内竞争中站身位。而魔搭社的成立,凸显出阿里还有超乎企业自身的更大愿景。

秉承“模型即服务”的理念,魔搭社把AI模型变为直接可用的务,用极低的门槛便可体验模型效果,实现模型推理、调优、定制。达摩院率先贡献家底,全面开源开放300多个经过检验的优质AI模型,并吸引了澜舟科技深势科技智谱AI启智社区哔哩哔哩IDEA研究院WeNet等十多家知名机构贡献模型。

目前魔搭社区已上线十亿参数以上的大模型超过30个,百亿参数大模型超过10个,包括自然语言理解和生成、对话文本生成图片文本生成视频、多模态表征等多个重要方向。这是对传统认知的颠覆:大模型研发不应以训练难度和成本的高门槛排斥多数机构,而要开放生态、降低门槛,方可凝聚力量,促成所有AI从业者积极探索自由使用研究突破、应用推广

唯有如此,大模型成为AI时代的基础设施,中国本土会有源源不断的创新土壤,通义千问所预示的潜能与前景方可充分实现。

周靖人曾经卖关子:通义千问只是阿里通义模型的一个成员,下一个已经在路上。4月11日召开的2023阿里云峰会,或许将见证更多来自中国本土的可能性。在日趋激烈的AI赛道上,以阿里为代表的中国力量也将注入新鲜活力。

 

 

来源同花顺财经凤凰网财经

http://stock.10jqka.com.cn/hks/20230410/c646289864.shtml

配图:通义千问-官网

© 版权声明

相关文章