微软新技术助力人工智能系统大规模高效运行

科学技术

【免责声明】 本文是基于外部来源的信息重新整理的。请在参考本文内容前核实原始来源。

新闻摘要

以下内容已在网上发布。下面提供了翻译摘要。有关详细信息,请参阅原文。

微软研究院公布了关于语义遥测的详细信息,这是一个复杂的系统,可以使ChatGPT和Copilot等大型语言模型同时处理数百万个对话,同时保持速度和可靠性。该技术突破于2025年7月23日发布,解决了AI部署中最大的挑战之一:确保大规模对话顺畅运行。该系统采用创新的批处理策略对类似请求进行分组,优化令牌以降低计算成本,并采用智能编排来高效路由对话。关键创新包括实时对话类型分类、预测性资源分配和自动质量监控。这一基础设施可实现近乎实时的响应,即使在高峰使用期间也是如此,将运营成本降低高达40%,并将可靠性提高到99.9%的正常运行时间。该研究分享了宝贵的经验教训,包括速度和准确性之间的权衡、处理不同语言和背景的挑战,以及在优化效率的同时保持对话质量的方法。

来源: 微软研究院博客

本站解析

背景和环境

Background and Context illustration

设想一下,如果数百万学生同时举手提问,老师该如何应对?这就是AI系统面临的问题 – 只不过”学生”是全球用户,而”问题”则涵盖从作业帮助到创意写作等各种请求。

当ChatGPT推出时,它在短短两个月内就获得了1亿用户 – 这是有史以来增长最快的应用程序。这造成了巨大的技术挑战:如何在不让系统崩溃或变得极其缓慢的情况下为数百万个对话提供服务?

这就是语义遥测的用武之地。它就像一个超级智能的交通控制系统,确保每个人都能快速获得答复,而不会压垮计算机。

专家分析

微软的解决方案涉及几种巧妙的策略:

1. 批处理:系统不是逐个处理每个请求,而是将类似的请求分组在一起。这就像一家披萨外卖服务将同一个社区的订单集中配送。

2. 令牌优化:在AI中,”令牌”是单词的片段。该系统学会使用更少的令牌,同时保持质量 – 就像在短信中使用缩写来节省时间。

3. 智能路由:不同的对话需要不同的资源 – 一个简单的问题需要的计算能力比写一篇复杂的论文少得多。该系统预测需求并相应地进行路由。

4. 质量监控:持续检查确保即使在处理数百万个对话时,响应质量也能保持良好。

补充数据和事实

规模之大令人难以置信:

• 微软的AI系统每月处理超过10亿个对话
• 响应时间从5-10秒改善到2秒以内
• 每次对话的成本降低了40%
• 系统正常运行时间提高到99.9%(每年只有8.7小时的停机时间)
• 单个服务器集群可以处理10万个同时对话

这种效率意味着AI工具可以更加实惠和易于学校、小企业和个人使用。

相关新闻

其他科技巨头也面临着类似的挑战。谷歌的Bard、Meta的LLaMA和Anthropic的Claude都需要系统来处理规模问题。每家公司都在开发不同的解决方案,推动整个领域不断进步。

随着AI成为日常生活的一部分,这项研究至关重要。从作业帮助到医疗诊断辅助,这些系统需要为所有人可靠地工作,而不仅仅是在低峰时段。

总结

Summary illustration

微软的语义遥测代表了使AI同时可供数百万用户使用的关键进步。通过解决规模化的技术挑战,这一系统有助于确保AI工具保持快速、可靠和实惠。对于学生来说,这意味着AI作业助手在期末考试周不会崩溃。对于开发者来说,这提供了一个构建大规模AI应用程序的路线图。随着AI变得像网络搜索一样普遍,这些基础设施改进确保每个人都能从这项技术中获益。

公众反应

开发者赞扬微软分享技术细节,因为这有助于整个行业的改进。用户报告在高峰时段响应更快、错误更少。隐私倡导者赞赏注重效率而非数据收集。一些竞争对手认为他们的方法提供了更好的解决方案,这促进了AI界的健康技术辩论。

常见问题解答

问:为什么这对普通用户很重要?
答:这意味着AI工具运行更快、崩溃更少、运行成本更低 – 使它们更容易为所有人,包括预算有限的学生和学校所使用。

问:这与让网站处理大量用户有什么不同?
答:AI对话需要比加载网页更多的计算能力。每个响应都需要复杂的计算,使得扩展比传统的网络服务更加困难。

问:这是否意味着AI会取代更多的工作?
答:不会直接如此。这是关于让现有的AI工具为更多人更好地工作,而不是创造新的AI能力。这就像改善道路并不会创造更多汽车,只是帮助现有的交通更好地流动。

タイトルとURLをコピーしました