Please turn JavaScript on

微软亚洲研究院 Articles

Follow 微软亚洲研究院 Articles's news and updates in a matter of seconds! We will deliver any update via email, phone or you can read them from here on the site on your own news page.

You can even combine different feeds with the feed for 微软亚洲研究院 Articles.

Subscribing and unsubscribing is fast, easy and risk free.

The whole service is free of cost.

微软亚洲研究院 Articles: Your request has been blocked. This could be due to several reasons.

Is this your feed? Claim it!

Publisher:  Unclaimed!
Message frequency:  0.45 / day

Message History

近年来,图像生成模型的飞速发展令人瞩目。从早期的通用图像生成,到如今逐步迈向更具实用价值的视觉内容创作,这一领域正经历从“好看”到“好用”的关键跃迁。然而,在繁荣表象之下,一个核心挑战正日益凸显:现有主流评测基准仍以自然图像为主,缺乏面向商业设计场景的系统性评估,无法有效衡量模型在结构化和多重约束下的表现。

与通用图像相比,商业视觉文档往往包含高密度文本、复杂版式结构以及多种视觉元素的协同布局,其生成与评估的难度明显更高。这也使得“如何科学评估模型是否真正具备商业可用性”成为行业亟待回答的问题。

为了填补这一空白,微软亚洲研究院推出了 BizGenEval。这是首个面向商业视觉内容生成的系统性基准测试。该工作不仅为评估模型能力提供了全新的标...


Read full story

编者按:医疗AI在影像诊断与病历理解领域已展现出惊人的潜力,但一个更根本的挑战正浮出水面:模型能够读懂静态的”快照”,却难以捕捉生命的”动态流转”。现有方法多依赖规则采样与插值预处理来强行对齐数据,面临着信息失真、噪声引入、临床适应性差等局限,更引发深层质疑——若模型始终需要人工规整才能理解时间,那它是否真正“领悟”了生理演变的内在规律?

对此,微软亚洲研究院推出MIRA(Medical Irregular Time Series Foundation Model),实现了医疗时序感知的完全连续性。该研究不再依赖预处理阶段的粗暴对齐,而是在预训练阶段就教会模型”顺着时间的自然节奏去理解”,为医疗AI迈向”通用基座”时代奠定了基础。

在大模型(LLMs)与计算机视觉(CV)争相重塑医疗行业的今天,我们...


Read full story

语音识别技术在近年来取得了飞速发展,但在面对真实的复杂场景时,许多系统依然显得有些力不从心:漫长的会议、多人混杂的交谈、极具专业性的行业术语,或是中英夹杂的日常对话…… 传统的语音识别系统往往需要将长音频切分成一个个短小的片段,分别识别后再费力地“拼凑”起来。这种“化整为零”的方法不仅容易丢失上下文,还常常在谁说了什么、什么时候说的等问题上张冠李戴。

近日,微软亚洲研究院发布了一款通用的语音识别模型 VibeVoice ASR,单次转录可处理长达 60 分钟的连续音频,并能够可靠地生成丰富、结构化的输出,清晰地记录说话者是谁以及其说话时间。作为一种全新的语音识别范式,VibeVoice ASR...


Read full story

《AI Next》是微软亚洲研究院推出的一档利用 AI 技术制作的播客,内容聚焦 AI 前沿技术、科研趋势与社会影响。第一季主要围绕当今智能发展的核心议题,探索前沿趋势。

在第六期节目中,我们邀请到微软亚洲研究院首席研究员李东胜博士,一同探讨 AI 与大脑的深层关联。以人脑为灵感而诞生的神经网络,究竟与大脑是单纯的模仿与被模仿关系,还是存在更深度的联结?AI 该如何向历经亿万年进化的人脑学习高效的机制,人脑又能从快速发展的 AI 中获得哪些新的认知与启发?这场双向借鉴的探索,又将如何重塑智能的未来?


嘉宾介绍

李东胜博士

...


Read full story

大模型部署之后能力还可以持续提升吗?

如果去问AI开发者这个问题,在过去,答案大多是否定的。传统的大模型在出厂那一刻,其智力水平就几乎定型了。即便在实际应用中遇到了未见过的新问题,或者被用户反馈指出错误,模型也很难像人类一样,在下一次尝试时立刻吸取教训。这正是当前大语言模型面临的尴尬现状。

在现有的主流范式下,AI模型性能的提升高度依赖于离线训练,要么是昂贵的人工标注,要么是预先构建的模拟环境。一旦模型部署到真实世界,它与用户的真实环境之间的海量交互经验往往不会被直接使用。

为了解决这一问题,微软亚洲研究院提出了全新的在线经验学习(Online Experiential Learning, OEL)框架 。这一框架让AI模型具备了边做边学...


Read full story