【EV视界报道】12月20日,北京大学光华管理学院与腾讯云联合主办的“AI+出行”产业案例沙龙在北京成功举行。本次沙龙的主题为“AI驱动汽车新智能”,共有多为业内高层人士参与,共同探讨AI大模型未来的发展机遇。
腾讯智慧出行钟学丹:大模型落地实施有三大挑战
腾讯智慧出行副总裁钟学丹则介绍了AI大模型和汽车行业的发展趋势,以及两者结合带来的新机会和智能变革。
他表示,在广泛的应用场景中,大模型显示出巨大的潜力。然而,其实际应用面临诸多挑战,主要源于大模型落地实施的复杂性,以及其基础门槛较高。这些挑战可归纳为三个方面:模型挑战、数据挑战和算力挑战。
首先,通用大模型虽然在基础性能上表现良好,但针对行业特定需求,其解决问题的准确率和达标程度尚不能满足行业要求。同时,数据质量问题对模型性能产生影响。如何构建针对特定行业的模型,以及根据行业特性设计相应算法,成为应对挑战的关键。
其次,数据挑战涉及合规和安全问题。例如,在出行领域,数据使用受到国家法规和要求的限制。如何在保障用户隐私的前提下,充分利用数据资源,成为大模型应用需克服的难题。
最后,算力挑战主要体现在GPU购买困难、算力紧张以及大模型训练对算力需求高等方面。这在很大程度上限制了企业和行业的发展。
除技术因素外,如何找到最佳应用场景并实现良好用户体验也是关键挑战。目前,大模型在汽车行业的主要应用集中在座舱和自动驾驶领域。如何挖掘更多应用场景,成为亟待解决的问题。
针对模型评估问题,大模型并非完全确定性,存在诸多不完善之处。因此,建立行业模型评估体系,对通用大模型进行不断迭代优化,至关重要。
腾讯致力于推动新智能发展,提供混元通用大模型,助力行业构建个性化大模型。混元大模型具有超千亿参数规模,以及超过2万亿Tokens的预训练语料,具备多轮对话、知识增强、逻辑推理和内容创作等核心能力。基于此,腾讯云已接入超过200个应用,覆盖广告、营销、游戏和社交等场景。
为加速大模型在汽车行业的落地,腾讯开放MaaS平台,提供基础设施、模型底座及行业底座,助力便捷开发。此外,腾讯还针对汽车行业特点,构建了专有数据知识库。
综上,腾讯通过提供大模型及相应平台,助力行业应对挑战,实现智能技术的深度应用,以服务行业发展。
理想汽车勾晓菲:智能终端底层逻辑就是人机交互
理想汽车智能空间副总裁勾晓菲在会议上天分享了关于AI的人机交互。他指出,无论是过去的计算机、现在的手机,还是现在的智能汽车,它们都是智能终端。这些智能终端为人们提供服务、功能,其最底层的逻辑就是人机交互。
他回顾了人机交互的进化史。汽车和整个消费类电子的进化史高度匹配。最开始是基于Windows的鼠标键盘+界面,有了显示屏后可以显示图形界面,配合按钮、滚轮模拟鼠标键盘的输入。后来有了触控屏,现在汽车上采用触控技术,主流汽车都以触控作为主要交互方式。但这些交互是否适合汽车这个终端?他认为这是理想汽车一直在探索的问题,答案肯定是不适合。因为现在的触控技术存在一些问题。首先,过去的终端是一对一的交互,而汽车是一对多的服务,因为车内有多个乘客。其次,汽车是一个三维空间,而手机、电脑是二维的平面设备,交互体系不同。现在的汽车主要交互形式是触控,但触控有距离限制,后排乘客无法通过触控与车辆交互。此外,驾驶员在开车时很难与屏幕完成手眼配合的交互。整个行业一直在提最适合汽车的应该是对话式的交互,应该是语言。但多年来语言一直是辅助交互形式,主要是之前的AI或算法对语义理解不到位。
他还提到学丹总提到的过去更多的是命令式的、规则式的交互方式,无法理解语言中的复杂逻辑。而现在大模型的出现使语言的理解能力迈上了一个新的高度。对话的交互形式有机会从可用变为好用。他们录制的视频展示了最新功能,并在12月19号最新的OTA 5.0上全部上车了,供理想车主使用。
对于行业内很多朋友对他们的评价,他认为他们只会做冰箱、彩电、大沙发。他们堆砌了很多屏是因为现在的空间交互需要更多屏幕。例如,当车里只有一个屏时,驾驶员启动导航时,后排乘客会听到环绕式的音箱布局发出的声音。这种布局可以还原有向位感的声音。同时他们有很多麦克风阵列用于声源定位和识别每个乘客说的话,以及舱内摄像头用于识别乘客的肢体语言。这些硬件都是实现空间交互框架所必需的。
之后,他还举例表示,当希望调整屏幕亮度时,如果配合的是触控界面,他可能会被引导至显示屏设置,其中不仅包括亮度,还有开关和刷新率等众多选项。然而,他的明确需求只是调整亮度,他期望的是得到直接的满足,而不是被抛向一个类似的界面去寻找。这是下一阶段整个行业将面临的重大变革和挑战。未来的对话式交互和开放式输入将需要搭配开放式输出,也就是说所有的用户界面都将变成生成式的。这些用户界面的布局将根据语言逻辑自动生成,以高度匹配用户的语义。这将是行业面临的首要挑战。
第二个挑战是,在大模型的推动下,未来的对话交互将彻底改变所有的应用。以第三方应用为例,一个应用通常是根据其能力来创建的。这意味着每个应用都是孤立的。例如,如果今天是某人的结婚纪念日并希望去望京享受日本料理,他可能会打开小红书或美团来搜索附近的餐厅,然后使用腾讯地图来导航。这个出行需求被分割成了两个应用。
然而,通过对话交互,用户的需求将能得到完整的满足。有理由相信,未来的应用形态将转变为一个个的虚拟助手。以OTA 5.0为例,它提供了三个助手和一个老师。这些助手包括用车助手、出行助手和娱乐助手,它们将美食、旅游、景点介绍、订票等各项功能融合到出行助手中。
未来,与出行相关的一切问题都可以通过唤起理想同学并使用出行助手来解决。用车助手就如同一个智能客服,能够回答所有与用车相关的问题,它既是一个专业的产品专家,也是一个出色的售后服务专家。所有与用车相关的问题都可以通过它来解决。娱乐助手则可能包含长视频、短视频、音频、音乐和有声读物等所有内容,用户可以通过与这个助手的交互来实现各种需求。未来,整个应用生态可能会朝着这个方向发展。
梧桐车联王永亮:智能化才能够真正地定义汽车
梧桐车联科技有限公司副总经理、CTO 王永亮在此次会议上分享了行业大模型在智能座舱领域的应用和实践。
汽车行业正在从上半场的电动化走向下半场的智能化。虽然汽车行业有着近150年的历史,但我国的汽车行业通过电动化得以迅速发展,这是一项非常了不起的成就。汽车被誉为工业皇冠上的明珠,因此这个成就来之不易。然而,在智能化的发展过程中,竞争将变得更加激烈。
为了强调软件在汽车中的作用,现在有一种说法是软件能够定义汽车。但他认为,这只是一个手段,真正的目的是智能化。因此,智能化才能够真正地定义汽车。然而,智能化面临着许多问题,例如目标是什么?下一步如何发展?如何度量?梧桐公司很早就开始思考这些问题。
他们参与了中国工程汽车学会牵头的白皮书的创建,旨在构建理论-技术-产品的代际发展理念。他们的核心是参考智能驾驶分级的经验,因为智能驾驶之所以发展这么快并得到用户的认可,分级起到了很重要的作用。他们试图探索并建立一个类似的分级体系,尽管这个探索还处于摸索阶段,但他认为这个探索是非常有意义的。以前的功能车是L0级别,而现在的智能车在L1-L2级别之间,也就是智能座舱。
梧桐汽车在2020年就开始进行智能化的打造,他们称之为策略脑的打造。经过迭代,现在已经发展到策略脑3.0阶段。由于有大模型的加持或支持,他们认为自动化水平有了质的提升。
他简单介绍了策略脑的发展历程。策略脑1.0是简单规则的执行,相对比较简单。策略脑2.0实现了复杂场景的编排和多场景的联动,已经具备了智能感知、智能座舱的全量能力,正在往部分主动交互的水平推进。策略脑3.0因为引用了大模型,他们认为已经达到了L3的水准,但这还在开发完善当中。
尽管梧桐公司规模较小,但他们有一些优势。第一,腾讯为他们提供大模型理论的基座。第二,长安会为他们提供实践的机会。这是非常难得的,因为他们有腾讯大模型的支持和长安车的实践。他们很早就参与了腾讯大模型生态的构建,并同步发展探索大模型在汽车智能座舱行业的应用场景机会。他们也依托于长安的构想将汽车看作机器人并打造双商在线的智慧型产品。因此他们非常自信地认为具备了高阶智能座舱的典型能力。
他分享了梧桐在大模型方面的一些探索。他们的大模型是站在腾讯千亿级别参数的基础上再加上一些领域的支持现在是万亿级参数将来会更加强大。他们自研的语言大模型是以重构为切入点积累经验做一些探索。他们自研的模型能够实现连续的对话智能语音对话是大模型最重要的特点将来交互肯定会进行重新的整合。他们大模型的特点包括理论、整合和垂域等几个方面。为了实现他们的构想他们的大模型的一个主要特征是端云一体主要考量包括效率、稳定性和安全等方面。他们强调了安全和隐私的重要性特别是在大模型时代需要避免法律和道德风险并从用户视角出发不能给用户造成伤害。最后他提到了端侧的重要性为了保证基本的稳定服务在云端和车端都需要考虑软硬件设施、协作优势、灵活和稳定以及安全和隐私等方面的问题。
最后,他简单给大家介绍了他们在大模型应用的几个案例。首先第一个案例,最重要的就是大模型在语音交互方面的应用。在汽车这个空间内,因为它是半私密的,自然语音交互是特别合适的。他们行业大模型的应用,让他们真正可以实现综合意图的理解。他举了个例子,视频里也有,帮他打开门仓,这个模糊的语义,以前是特别难搞定的时候,它里面有指定词,多意图,手势理解,有了大模型之后就特别简单。晓菲总已经上市了,他们也可以上市,但他们作为一个传统车厂会比较保守一点,但明年肯定可以看到他们的产品在量产的车型上。
第二,他们利用大模型的图形识别和理解能力,实现真正的AI。行业内的人都知道AI最重要的就是不贴路、不贴车,微小的动作,调焦也搞不定。但是他们有了大模型的工具,一切都不是问题。
第三,他们大模型最重要的几个特点,拥有全世界几乎所有的知识,通用大模型99.99%的人都干不过它。但是他们在车上面,再加上车垂域数据的加入,所以肯定会比老司机更懂车。所以以后开车的过程中,不懂就问、问了就会,这是没问题的。出了事故,大模型也能够直接给你最好的建议,也不怕被坑。
第四,大模型在智能驾驶上能够实现真正的自动自适应车控。在雪地里,它会自动把雪地模式打开,建议你怎么开、开多快,它比老司机更好。
展望未来,他们认为未来策略脑4.0随着技术的成熟,特别是数据积累到一定程度,算法还在演进,算力也在不停地增强。他认为未来车一定会比你自己更懂你自己。
北京大学光华王铁民:面对全栈自研,需专业化分工和跨业整合
北京大学光华管理学院组织与战略管理系副教授、北京大学管理案例研究中心联席主任王铁民最后关于AI在行业中的应用做了小结。
她首先解释了AI连续举办三场线下沙龙的原因,并强调了AI带来的技术范式级别的创新的重要性。这种创新不仅涉及到技术本身,还涉及到科学进步、经济因素和制度变量等多个方面。
商学院教授接着讨论了技术范式带来的影响,特别是在商业化、经济增长方面的关注。然而,她也强调了技术范式带来的影响远不止于此,还包括对就业、生活质量、环境和生态的可持续发展等方面的影响。
在嘉宾分享的内容中,教授指出,虽然每个嘉宾的分享都有不同的侧重点,但总的来说,她们都在讨论车端为主的问题。她从商学院的角度观察到,AI作为技术范式在汽车产业的落地,反映了更广泛的智慧城市的影响。
在智慧出行子系统中,教授提到了多个元素,包括云、车、路、网、图等。这些元素在行业中相互影响,包括车企的工业链、制造、智慧营销、售后服务等方方面面。
教授强调了技术创新商业化的重要性,并指出一个新技术或创新的商业化进程和应用价值的体现,不仅取决于技术本身的新颖性和先进程度,还取决于许多可行性的考虑,包括商业化的商业模式、产业政策的导向和力度以及市场培育和市场用户的接受程度。
此外,教授指出重大的技术应用创新的落地会引发产业边界的重塑以及竞合关系的重构。这在汽车行业中尤为明显,科技类企业和整车制造行业之间的关系正在经历一种紧张的对话。
之后,她表示随着时间的推移,企业间从冲突走向某种融合,并且看到更多的跨界合作。在中国的汽车行业中,许多整车企业希望走全栈自研的道路。然而,全栈自研并不适用于所有企业,因为这取决于企业的规模、内部管理和制造成本以及外部交易成本。因此,对于非全栈自研的企业,专业化的分工和跨业整合是必要的。
接着,她以汽车行业为例,强调了合作的重要性。在传统燃油时代,汽车行业就有很多合作,因为汽车是一个复杂的产品。到了新四化重新定义行业边界的时代,合作变得更加必要。企业可以通过合作快速补齐新的能力,特别是在竞争强度和速度加快的情况下。
她还认为,此次会议还讨论了合作形式的多样性,包括股权型的联盟合作和不涉及股权的契约型合作,如联合营销、联合研发或战略供应商等。同时提到科技型企业如腾讯在赋能汽车行业时,也采取了多种合作形式,包括与长安、梧桐车联的紧密合作以及其他主机厂和整车制造企业的相对松散的联合研发和联合营销等模式。
值得一提的是,她强调了合作关系的重要性、复杂性以及动态演进的特点。在动态的环境中,企业的动态能力非常重要,而动态能力的内核包括协调整合、与时俱进的学习以及重构。以教学和研究案例为例,强调了合作关系管理需要相应的组织能力。
另外,她还表示称与学丹总的团队从2021年甚至更早的时候就开始了交流与合作,她正在研究的一个案例名为腾讯智慧出行。这个案例自2021年6月以来已有一年多的时间,她虽然还没有正式向学丹总报告,但感受颇深。腾讯智慧出行的许多特点让她印象深刻,其中有很多值得总结的地方。首先,腾讯专注于自身能力范围内的事务。对于初创企业而言,这并不是问题,但对于腾讯这样的巨型企业来说,能够集中精力做好自身能力范围内的事情是十分重要的。这也将为她们后续的案例研究提供更多的分享机会。
腾讯的第三次战略转型旨在立足于消费互联网,并拥抱产业互联网。CSIG的其中一个业务线就是腾讯智慧出行。过去的腾讯以社交入口为主,而现在最大的移动互联网社交入口则是微信。进入TO B业务领域对腾讯来说是一次新的挑战。在PC时代有QQ,而在移动互联网时代有微信。幸运女神是否会再次眷顾腾讯呢?她不知道,但她了解到学界已经对微信的成功进行了案例研究。这个结论被称为微创新、迭代与整合。
微信在推出每个新版本时,特别是在2012、2013年的时候,都会增加一些新功能,如摇一摇、二维码、支付功能等。这些创新并不巨大,但微信善于倾听用户的需求,了解合作伙伴的新进展,并将这些整合起来进行不断迭代。如今,微信已成为移动互联网中不可或缺的一个入口和助手。
在产业互联网阶段,她认为这种微创新几乎成了腾讯的基因能力。腾讯智慧出行在自动驾驶业务方面,早在2017年就已经建立了实验室。学丹总早期做的图和生态车联网也是在这个领域内很早就开始进行了。到了2019年,腾讯智慧出行正式成立为一个事业部后,她开始从车主的角度感受到微信上车的便利。这是否意味着腾讯擅长于此呢?这实际上体现了C2B的能力。在C端,腾讯沉淀了大量的微信用户;在智驾、云等领域还有许多其他的能力。腾讯以自己擅长的能力为支点,不断迭代并扩大与垂直行业的联系。如今,腾讯又增加了汽车的全产业链,包括制造、销售、智驾和智舱等各个方面。借助混元大模型的应用,腾讯的能力再次得到提升。
从腾讯的发展历程来看,有两点是值得注意的。首先是要经得住诱惑,做自己能力范围内的事情。但如果只做自己能力范围内的事情就可能变得固步自封、停滞不前。其次,不能仅守着自己的能力边界而不进步。还需要拓展自己的能力边界。为了实现这个目标,需要倾听用户和客户的需求并发挥集团的协同效应。混元大模型在这个过程中起到了关键作用,它是大模型基座并为许多业务线提供赋能。作为腾讯内部的一个事业部门,她们也应该做好集团内部的协同工作。此次与腾讯智慧出行学丹总的交流带来了新的启示:大模型在垂直行业中的应用、在出行行业中的应用以及在C端的应用都展现出了其重要性。
另一个值得关注的案例是雷诺日产30联盟的合作关系长达二十多年之久。这样的联盟很少见。在智能化的推动下,她们来讨论汽车新智能的合作模式。许多联盟和最近的科技企业与主机企业的合资都展现出了一些经验和教训。然而雷诺日产30联盟却能够持续合作二十多年并不断发展壮大。在这个过程中他们经历了多个阶段并不断进行调整以适应变化的环境。他们采取的联盟治理方式是分而治之并划分区域责任范围以便更好地发挥各自的优势并保持合作伙伴关系的持久性。这种合作方式的智慧可以为其他主机厂之间以及大量软硬件科技企业和整车企业的合作所效仿和学习。
写在最后
总之,AI大模型研究在我国得到了充分的重视和发展空间。在政策支持和市场竞争的双重驱动下,我国AI大模型产业有望实现跨越式发展,为我国科技创新、经济发展和社会进步贡献力量。然而,要想在全球竞争中脱颖而出,还需不断攻克技术难题,强化产业链协同,提升国际竞争力。展望未来,我国AI大模型研究将在全球科技舞台上绽放光彩。