投影时代首页 > 软件视频会议 >> 行业新闻 > 正文

搜索新闻

Microsoft Azure 认知服务和NVIDIA AI提升Microsoft Teams实时字幕和转录功能

来源：投影时代　更新日期：2022-01-02 作者：佚名

年度评选盛典获奖揭晓 Infocomm China 深入报道年度商显市场最大的看点何在

Microsoft Teams借助AI生成的实时字幕和转录功能，帮助全球学生和职场人士顺利进行在线会议。用于训练的NVIDIA AI计算技术和用于推理语音识别模型的NVIDIA Triton推理服务器进一步提升了这两个功能。

Microsoft Teams 是全球沟通和协作的重要工具，每月有近2.5亿活跃用户。Microsoft Azure 认知服务为Teams提供28种语言的字幕和转录，并将很快能够在NVIDIA GPU上运行关键的计算密集型神经网络推理。

实时字幕功能帮助与会者实时跟踪对话，转录功能方便与会者在日后回顾当时的创意或回看未能参与的会议。

实时字幕对聋哑人、听力障碍者，或者异国与会者特别有用。

NVIDIA Triton开源推理服务软件能够帮助Teams使用认知服务优化语音识别模型。

使用Triton，认知服务能够支持高度先进的语言模型，以极低的延迟实时提供高度准确、个性化的语音转文本结果。同时，可以保证运行这些语音转文本模型的NVIDIA GPU充分发挥其潜力，在消耗更少计算资源的同时，为客户提供更高的吞吐量，进而降低成本。

底层语音识别技术作为认知服务中的一个API，开发人员可以使用它定制和运行自己的应用程序——客服电话转录、智能家居控制或为急救人员提供AI助手。

字字达意的AI

认知服务会生成Teams的转录和字幕，将语音转换为文本，并识别说话人。同时也能够识别专业术语、姓名和其他会议背景，提高字幕的准确性。

Microsoft Teams的通话、会议及设备首席项目经理Shalendra Chhabra表示：“这样的AI模型非常复杂，需要数千万个神经网络参数才能识别几十种不同的语言。但模型越大，就越难以经济高效地实时运行。”

NVIDIA GPU和Triton软件能够帮助微软在不牺牲低延迟的情况下，通过强大的神经网络，实现高准确性，确保语音-文本的实时转换。

当启用转录功能时，与会者可以在会议结束后轻松补上错过的内容。

Triton三大功能推动效率提升

NVIDIA Triton有助于简化AI模型部署，并解锁高性能推理。用户甚至可以为自己的应用开发自定义后端。软件的一些关键功能可将Microsoft Teams的字幕和转录功能扩展到更多会议和用户，包括：

流推理：新型流推理功能——通过跟踪语音上下语境，提高延迟、敏感性字幕的准确度，它助力NVIDIA和Azure认知服务合作定制语音转文本的应用程序。

动态合批：批大小指神经网络同时处理的输入样本数量。通过Triton的动态合批，单项推理请求被自动组合成一个批次，因此能够在不影响模型延迟的情况下更好地利用GPU资源。

并发模型执行：实时字幕和转录需要同时运行多个深度学习模型。Triton使开发人员能够在单个GPU上同时完成这些工作，包括使用不同深度学习框架的模型。

即刻启程，借助Azure 认知服务，在您的应用中使用语音转文本的功能，并进一步了解NVIDIA Triton 推理服务软件如何帮助团队大规模部署AI模型。

返回视频会议系统频道首页

推荐

年度大屏视听行业评选，花落谁家？

　标签：软件视频人工智能行业新闻

阅读本文的用户还阅读了

31会议闪耀第十九届国际会展文化节

维海德云视频会议渠道招募会郑州站

IFC：腾讯会议更沉浸与智能的会议体验

六大亮点 WitMeeting智会通重磅升级

31会议亮相2024香港数字科技高峰论坛

31会议获2023年度商旅MICE行业奇迹奖

NVIDIA推Omniverse实时物理数字孪生

NVIDIA Omniverse 助力颠覆工厂生产线

COMPUTEX 2024 NVIDIA 重磅发布一览

艾讯发表边缘运算AI系统AIE100-ONA

IFC：NVIDIA赋能影视制作流程全面升级

NVIDIA Omniverse迈向智慧零售新时代

文章分享

读完本文章，我来发表下看法

浏览本文的用户还喜欢

线上教研，也许比线上教学更伟大

返回频道首页

最新视频会议新闻资讯

会议监控精彩专题

推荐视频会议厂商