5.17世界电信日|小米王斌:长期投入AI 加大与产业链深度融合
新华网北京5月17电(郑伟)随着AI向终端下沉,端侧AI让智能变得触手可及。怎样看待AI在终端的落地?端侧AI发展的趋势如何?端侧AI在“人人可享的AI”愿景中为何发挥着关键作用?小米集团AI实验室主任王斌表示,小米得益于对AI持续不断地投入,配合丰富的终端产品,直接推动小米人工智能实验室的多项算法快速实现软硬件结合,帮助小米在大模型研发应用中形成优势。
当前,人工智能被应用到国民经济的方方面面。其中,中国近10亿智能手机用户如何享受到AI发展的技术红利变得非常迫切。除了智能手机,每年出货量接近3亿台的PC市场,以及中国正在快速发展的智能汽车和XR终端市场也需要拥抱AI。
2023年度演讲时,小米集团创始人、董事长兼CEO雷军提出了“小米科技战略公式”: (软件×硬件)ᴬᴵ,随后,身后的幻灯片便出现了“小米全面拥抱大模型”。自此,小米各终端开启了大模型上马之路。
2023年4月,小米集团正式组建大模型团队,随后四个月,小米大模型团队迭代了13亿参数和60亿参数规模的语言模型,并同时开启了图像、声音、语音等各种单模态及多模态混合的大模型研发。小爱同学是国内最早一批发布的智能语音助手,从2017年至今,已经服务长达7年时间,拥有1.17亿月活跃用户,每天都要被唤醒高达2.08亿次。从去年4月开始,小爱同学全面接入语言大模型,实现了从语音助手到生成式AI智能助理的能力跃迁,且具备深度自然语义理解、多模态等能力。2024年年初,小米14 Ultra的影像模组正式接入视觉大模型,用户在拍摄时信号即经过了基于AIGC的AISP平台,通过全面整合CPU、GPU、NPU和ISP算力,该平台可实现60TOPS的计算能力,全面支持了相机人像、夜景、HDR等基础能力,以及“UltraZoom”、“超级抓拍”和“超级底片”等特色功能。
2024年4月,随着小米汽车SU7的正式发布,大模型的应用范围再次扩大,也让更多人看到了大模型全方位赋能终端的应用场景。小米SU7搭载了多个AI大模型,大模型赋能下的小米汽车带来了很多重要突破。王斌谈到:“第一,SU7在智能驾驶上应用了小米自研的端到端大模型,它能让智能驾驶具备更拟人的感知决策规划能力,做到响应速度快,对周围感知深,决策更精准、堪比老司机,目前该技术已量产应用于代客泊车功能;第二,SU7智能座舱内的语音交互通过搭载大语言模型的‘小爱同学’来承载,其交互体验很好,在车内使用‘小爱同学’感觉更加灵敏,能够快速理解用户的需求,包括驾驶习惯、娱乐等功能都能第一时间得到反馈。此外,小爱同学中还搭载了多模态大模型和图文大模型。总而言之,SU7中搭载的大模型不止一类,它们通过混合方式满足用户的需求并提高用户的体验。”
2024年至今,AI手机、AI PC和AI汽车都迎来新的机遇和挑战,相关企业都在持续发力。由于汽车的使用场景不同,AI赋能汽车与手机和PC之间存在明显不同,王斌表示,手机与PC更多体现在工作、娱乐、生活的需求,会通过AI大模型提升效率,解决文字、图像、音频、视频等需求。而汽车是面对社会的复杂场景工具,一方面要与用户进行沟通,同时还要通过AI对驾驶过程中的道路、行人、周边环境等进行实时监测,场景更加复杂,需要极强的安全性与稳定性。
王斌补充道,AI赋能汽车终端首先要考虑到行驶过程中的安全性,这一点至关重要,也有别于其他终端的赋能。提到汽车,王斌也指出,汽车工程作为交叉学科,在结构工艺、材料、制造等各个流程环节都有AI赋能的可能性。以小米的一体化大压铸为例,小米泰坦合金就出自小米人工智能实验室和汽车部的联合研发,其合金配方就是通过实验室提出的AI算法在千万种可能性中快速搜索得到的,搜索的目标要同时满足高强、高韧等要求。除此之外,最近多次亮相媒体的一体化大压铸件的高精度X光AI检测算法同样出自人工智能实验室。当然,还有很多AI算法赋能汽车以及各类终端产品的方方面面,包括设计研发、生产制造等环节。
在AI赋能终端的同时,端侧AI能力的赋能趋势也逐渐明晰起来。王斌表示,随着大模型技术的不断演进和发展,可以预期,未来较少参数量的模型,能达到当前更大参数量模型的至少某些方面的能力。这些能力使得更多任务具备在端侧落地的可能性。“首先,随着端侧芯片能力不断提升,可在终端直接进行AI演练的算力可能性也随之大大提升;其次,端侧用户对隐私要求越来越高,数据在端侧进行计算,也可以提高用户隐私安全性;最后,端侧大模型可以让用户随时享受其带来的便利性,不用在乎网络条件限制,大大提升端侧的便捷性。”王斌补充说。
对于端侧AI的赋能趋势,王斌说,在较长一段时间内端云结合应该都是AI赋能的方式,但是,随着技术的方法和对大模型能力的探索,未来更多的能力逐渐下沉到端侧将是不可逆转的趋势。
王斌也介绍了小米人工智能实验室的情况。2016年实验室正式成立,从最开始的计算机视觉,到后来声学、语音、自然语言处理、知识图谱,再到大模型,实验室基本覆盖了AI的不同研究方向。由于小米有大量的终端产品,可以直接推动实验室的多项研究得以落地,从而实现正向的技术迭代循环,而且小米的AI落地有软硬件结合的特点,对于端侧AI落地具有深刻的认识。另外,小米的AI大模型还可以获得不同设备大量的传感器数据,在严格保护用户隐私的前提下,这些数据可以帮助训练大模型,长此以往,训练出的大模型能理解更多更加复杂的场景。
长期以来,AI一直都是小米长期重点投入的赛道,同时也是小米相对擅长的领域。雷军曾谈到,从2016年小米提出All in AI到如今,小米依然坚持All in AI的态度。对于未来,小米给出的答案是加大投入并与产业链更深度的融合。