从副驾驶到智能体:AI生产力工具如何重塑软件开发与办公场景
从副驾驶到智能体:AI生产力工具如何重塑软件开发与办公场景五金“在未来的办公与开发世界里,AI不再只是一个辅助工具,而是像人类一样自主思考、规划和执行的伙伴。”这是商汤科技产品总监、小浣熊家族负责人贾安亚在2025年GDC全球开发者先锋大会上的一句开场白。
这不仅点燃了现场观众对AI生产力工具前景的想象,也为我们揭示了一个正在加速到来的现实:人工智能正从“副驾驶”角色迈向“智能体”,深刻改变着软件研发和日常办公的生态。
作为全球顶尖AI企业之一,商汤科技在今年的GDC大会上发布了代码小浣熊2.0和办公小浣熊2.0,并推出了开源的LazyLLM框架和万象平台。
这一连串动作不仅展示了商汤在AI技术上的最新突破,也为行业勾勒出未来生产力工具的发展趋势:多模态融合、更低的成本、更高的自主性,以及从个人效率提升到企业级全流程优化的跨越式进化。本文将基于商汤科技提供的最新资料,深入剖析这些工具的创新点,探讨其对行业的影响,并展望AI在生产力领域的未来。
商汤科技的核心技术突破源于其“日日新”融合大模型的原生多模态能力。2025年1月正式推出的这款融合大模型,在国内率先实现了模态融合训练的实质性进展,不仅在中文大模型基准测评(SuperCLUE)中以68.3分并列第一,还在OpenCompass多模态评测中大幅领先GPT-4o。这标志着行业传统上将大语言模型与多模态模型分立的格局被打破,为构建更通用、更智能的AI系统奠定了基础。
多模态融合意味着AI不再局限于单一的文本处理,而是能够同时理解和生成文本、图像、代码、数据表格等多种信息形式。这种能力在代码小浣熊2.0和办公小浣熊2.0中得到了淋漓尽致的体现。
实际上,代码小浣熊2.0能够通过联网检索知识、本地代码仓库融合以及跨文件多任务修改,为开发者提供个性化的编程支持;而办公小浣熊2.0则能基于图片、PDF等多类型文件进行数据分析,并生成可视化图表,甚至直接从前端页面截图生成可执行代码。
与此同时,“日日新”大模型在训练和推理成本上的优化进一步降低了AI落地的门槛。商汤科技大装置产品总监刘叶枫指出,随着推理成本下降,企业可以在相同硬件上部署更大规模的模型,这为中小型企业和开发者提供了触及尖端AI技术的机会。
数据显示,商汤的推理框架PPL.LLM通过KV缓存优化和量化技术将成本降低50%,推理性能领先业界50%。这不仅提升了AI的经济性,也加速了其在各行业的渗透。
未来,随着模型对非结构化数据的处理能力增强(如视频、语音),AI将进一步渗透到更复杂的创意和决策场景中,逐步接近“世界模型”的终极目标,多模态融合和低成本推理将成为AI生产力工具的标配。
AI在软件开发领域的应用已进入成熟期。商汤科技产品总监,小浣熊家族产品负责人贾安亚在演讲中提到,全球超过三分之二的开发者已使用AI编程工具,且普遍反馈“开发变得更开心”。这得益于AI从重复性任务中解放了开发者,让他们专注于高价值的创造性工作。商汤的代码小浣熊正是这一趋势的代表。
相比1.0版本仅提供代码补全和问答交互,2.0版本实现了度数据融合和跨文件多任务修改。例如,它可以同时修改多个文件中的代码逻辑,并结合企业内部代码仓库和外部知识库进行优化建议。更为重要的是,它还新增了代码资产管理功能,覆盖需求分析、测试迭代到后续优化,帮助企业提升代码质量和可维护性。
实际案例中,零跑汽车通过代码小浣熊一体机优化了智能车舱的软件研发流程,整体效率提升超30%;海通证券的“e海言道”智能研发助手则实现了40%的开发提效。这些数据表明,代码小浣熊已从个人生产力工具跃升为企业级端到端解决方案。
值得关注的是,AI编程工具正从“补全型副驾驶”向“规划型智能体”演进。未来,开发者可能只需描述需求,AI就能自主完成从架构设计到代码生成的全流程。这种转变将大幅缩短开发周期,并推动软件开发从“手工匠艺”向“自动化流水线”过渡。然而,这也对AI的上下文理解能力和安全性提出了更高要求,尤其是金融、汽车等对代码可靠性要求极高的行业。
如果说代码小浣熊代表了AI在软件开发中的“副驾驶”模式,那么办公小浣熊2.0则是智能体范式的先锋。它不仅能辅助用户完成任务,还能自主规划、分解和执行复杂工作流,从“有到优”升级为“无到有”。
比如在数据分析闭环方面,从数据清洗到可视化生成,再到趋势预测,办公小浣熊能够处理Excel、PDF等多类型文件,并通过自然语言交互生成通俗易懂的分析报告。例如,它可以自动识别销售数据中的异常值并预测未来趋势,为企业决策提供支持。
在多模态交互方面,用户上传一张图表样式图片,AI即可生成一致的可视化结果;上传前端页面截图,则可快速生成可执行代码。这种能力极大降低了专业技能门槛。
“最近《哪吒》很火,让小浣熊预测《哪吒》最终票房是什么,这是上周做的预测,用的是截至2月13日的票房数据。猫眼的票房没有办法导出excel,只能截图上传,这是上传的图片,图片里有票房的数据。小浣熊结合图片里的数据,利用多模态的能力,最后预测出来票房是148.75亿,可以等着看一下最终《哪吒2》的票房是多少,如果最终哪吒2的票房超过148.75亿,会在小浣熊的用户群里给大家发一些福利。”商汤科技产品总监,小浣熊家族产品负责人贾安亚在GDC全球开发者先锋大会现场这样说,在全场景协作方面,从任务规划到报告生成,办公小浣熊打通了数据分析的全流程。
未来,随着AI工具使用能力的增强(如调用外部API、操作复杂软件),它可能完全接管某些重复性工作,甚至在创意任务中扮演“灵感助手”的角色。办公智能体的崛起将推动“低代码”甚至“无代码”办公的普及。不过,这也伴随着数据隐私和伦理挑战,如何平衡自主性与人类控制将成为关键。
商汤在GDC 2025上发布的LazyLLM框架和万象平台,进一步体现了其推动AI普惠的决心。
LazyLLM以数据流为核心,支持开发者通过10行代码搭建RAG应用,或通过拖拉拽实现多模态客服机器人开发。万象平台则提供从模型管理到应用部署的全链路服务,内置500+高质量模型,并支持DeepSeek-V3等前沿开源模型。
“我们开源的工具名字叫LazyLLM,关于名字我们内部讨论了很久,后来我们想了一下,我们希望人用工具为了图方便,怎么显示我们的工具方便?我们给它起名字叫lazy,中文叫懒的意思,你不需要很聪明,很复杂,你越懒,它越能帮你解决问题。”商汤科技创新研发部高级总监张行程说。
据了解,LazyLLM的简洁设计和跨平台部署能力降低了开发门槛,让初级开发者也能快速上手,而资深开发者则可通过模块化扩展实现复杂应用。这种“积木式”开发模式不仅加速了AI应用的迭代,也弥补了国外工具在国内垂域场景中的不足。
“如果实现一个数学公式,LazyLLM大概七八行10行不到的代码就是我们lazy的部分。LangChain是下面大概15行代码,右边的这个就是LlamaIndex需要30多行代码。”张行程说。
目前,商汤已与300余家企业合作,覆盖金融、汽车、互联网等行业,日token数超100亿。合作伙伴如金山办公、联想通过集成商汤AI能力,显著提升了产品竞争力。这表明,AI生产力工具的未来在于生态共建,而非单一厂商的封闭式创新。
在商汤科技创新研发部高级总监张行程看来,开源将成为AI落地的催化剂,尤其是在国产化需求日益强烈的背景下。LazyLLM和万象平台的私有化部署能力,以及对国产芯片和数据库的适配,将推动更多企业拥抱AI,同时为开发者社区注入活力。然而,开源生态的繁荣也需解决标准化和安全性问题,以避免碎片化风险。
商汤科技的小浣熊家族和开源工具展示了AI生产力工具的三大趋势:多模态融合赋予其更广的应用场景,低成本推理加速其普及,智能体范式则让其从辅助走向自主。这些突破不仅提升了个人和企业的效率,也为行业树立了新标杆。
展望未来,随着AI对工具的掌握能力增强(如自主调用计算器、生成动态数据大屏),生产力工具将逐步渗透到教育、医疗、创意设计等更广泛领域。然而,这也伴随着挑战:如何确保AI的决策透明性?如何在效率与隐私间找到平衡?这些问题需要在技术迭代与社会治理同解决。
正如贾安亚所言,“AI想要改变世界,真正提高生产力,一定要具备优秀的代码能力”。从副驾驶到智能体,商汤正在用技术描绘一个更高效、更智能的工作未来。而这个未来,已在2025年的GDC大会上初露端倪。
扫一扫关注微信公众帐号