微软亚洲研究院公布12项顶级研发成果(组图) , 微软,亚洲研究院,对联,tts,研发成果...

来源:百度文库 编辑:神马文学网 时间:2024/03/29 07:23:05
微软亚洲研究院公布12项顶级研发成果(组图)
2008.10.31       共有评论(97)条发表评论   收藏
“我们从不害怕失败。如果我们所做的一切都取得了成功,那说明我们没有去冒足够的风险;而如果不敢于承担风险,我们就无法在创新的路上走得更远。要做突破性的研究,就要有冒险精神,我们今天的成绩,正是以无数次成
日前,微软亚洲研究院正式公布了自己成立以来的12项重大研发成果,在这些研发成果中,不乏李开复(第一任微软中国研究院院长,现谷歌大中华区总裁)、沈向洋(第三任微软中国研究院院长)、张宏江(微软工程院院长)等高管的身影。微软亚洲研究院成立于1998年,前身为微软中国研究院,截至目前,已经有超过260项研发成果被应用为微软的各项产品中。按照计划, 研究院也将于11月初进行日活动,用以展示自己在过于两年中的最新成果。
我们从不害怕失败。如果我们所做的一切都取得了成功,那说明我们没有去冒足够的风险;而如果不敢于承担风险,我们就无法在创新的路上走得更远。要做突破性的研究,就要有冒险精神,我们今天的成绩,正是以无数次成功或不成功的尝试为基础的。
(1). 数字墨水
主要负责人:王坚
参与者:邹宇,魏子乐,张冬梅,韩石,常明


数字墨水让连接到PC机的写字板可以根据数字设置,模仿油墨落在纸张上的特征。它具有真实纸笔写字的所有优点,而避免了传统书写的弊端;用户可以写入普通文本、创建用圆点起头的列表、绘制图解或建立表格,而软件则能够识别它们之间的差异。在数字笔记中查找信息就比在真正的纸张上容易得多,用户也可以更快捷地撷取资讯。
(2). 语音识别与合成
主要负责人:宋謌平,张益肇,初敏
参与者:周健来,黄超,王庆,陈正,时宇,赵勇,彭瑚,钱瑶,陈一宁,王丽娟

语音识别可用于微软产品的电话或桌面语音识别(简体和繁体中文),包括Windows客户端无障碍环境、Office的中文听写以及语音等。这是语音识别领域的一次巨大飞跃。基本声学部件经过定制化设计,用于捕捉汉语普通话有调音节中独特的结构。开发小组开发了高度精确的音高跟踪算法,用于计算汉语普通话中语义语气特性。声学模型和语言模型经过训练,用于同时从声学和语言学这两个领域捕捉汉语普通话的内在属性。
研发小组研发了基于最适波形拼接技术的木兰双语文语转换系统(TTS)。其发展的文语转换(TTS)技术已用于Windows Vista及 Speech Server可以既清晰又自然的朗读输入文本,对于中英混合的文句也都应付自如。木兰系统已经随着Vista走进千家万户,并且由此孵化出一个TTS产品部门。进一步又开发出了最大似然度合成的HMM,成功应用于英,法,西,意语等多20多种 ,并应用于Speech Server等微软产品。
(3). 新一代中文和日文的输入法
主要负责人:周明,黄昌宁
参与者:高建锋,陈正,王益进,李沐,张宏江,李开复


中文和日文的连续语句电脑输入是一个长期困扰用户和技术界的问题。以往的系统存在着输入速度慢、正确率低、用户体验不好等诸多问题。这一项目利用最新的大规模语言模型技术成功地帮助微软产品部门改进了原有的中文和日文输入系统,大大提高了拼音序列转换为汉字序列以及日文假名序列转换为汉字序列的正确率和速度,显著提高了中日文用户的输入体验。本技术已经用于微软中文和日文的操作系统和办公处理系统中。
(4).微软对联
负责人:周明
参与者:陈伟柱 沈向洋 吴法洲 马艳军 陶李天 苏昊

你能够想象计算机来跟你对对联吗?“微软对联”是由微软亚洲研究院自然语言组研究开发的计算机自动对联系统,也是世界上第一套人工智能自动对联系统。
具体而言,用户给定上联,然后系统自动产生下联;或者用户也可通过交互手段优选字词来生成满意的下联。本项技术可以应用于在线数字游戏,以及服务于中小学以及外国人的智能汉语教学。
(5). 卡通开发工具包
主要负责人:徐迎庆
参与者:梁林,闻芳,田江森,邹欣,李愈胜,殷秋风,沈向洋
卡通开发工具包(Cartoon.sdk)是一项有趣的技术,让人们利用自己的照片自动生成个性化的生动面部漫画。这种很酷的开发工具成功地将几种微软产品集于一身,让用户能够创建用于社交网站的头像。微软已经向全球范围内的几家公司发放了这项卡通技术的许可证,而微软亚洲研究院也因此获得了最佳知识产权许可奖。
(6). 自动(网络多媒体组)
主要负责人:华先胜
参与者:芦烈,王益进,孙燕峰,张宏江

自动电影(Auto Movie)是Windows Movie Maker 的一个“五星级”功能。它是家庭录像编辑的“一键式”解决方案。自动电影从原始家庭录像中选择重要的和有代表性的片断,并将这些片断连成一段视频,而且使连成的视频与用户指定的伴奏音乐的节奏和节拍吻合。其中的关键技术是视频分割、视频摘要、音乐节拍和节奏检测,以及视频和音乐的匹配。自动电影能使对视频编缉知之甚少的用户能够快速编辑很吸引人的家庭录像。
(7). 复合TCP(传输控制协议)
主要负责人:谭焜
参与者:宋京民

传输层控制协议(TCP)是现在因特网上的标准传输层通讯协议。但是传统的TCP在超大带宽延迟积的网路上有很大的性能缺失。为此,研发小组提出了一种名为复合TCP(CTCP)的新型拥塞控制算法,可以极大地提高传输层协议的效能。与传统TCP不同,CTCP可以更加激进地提高传输速率,并同时检测窗口的大小,延迟的变化,以及丢包情况,从而控制拥塞的发生。CTCP的设计保证了新算法的引入不会造成已有的基于传统TCP的应用性能下降。CTCP现已包含在Windows Vista和Windows Server 2008中。CTCP已经提交到IETF,作为一个新实验RFC的候选方案。
(8). Halo图形
主要负责人:周昆
参与者:黄欣,胡志鹏,胡耀华,王希,刘新国,龚敏敏
Halo是微软公司为自主研制的Xbox游戏机开发的一款游戏。这一技术让游戏玩家们有机会真正地享受Halo III的奇幻世界——新开发的一些核心技术,可以让虚拟世界看起来更真实。现在,玩家可以借助UVatlas,更畅快地欣赏不断变化却又栩栩如生的战斗场面,这种技术让游戏程序得以映射三维场景纹理。保护你的眼睛不受阳光刺射,源自我们的真实感全局照明(光影贴图压缩)技术。观赏令人难以置信的真实涟漪,同时聆听你头朝下跳入水中时的一圈圈水花——它们都是利用令人目眩的水(河)建模和绘制仿真系统来开发的。玩家还可以利用快速绘制真实表层介质的技术来即刻感受一下当你躲避敌人时草叶扫过你脸颊的感觉。
(9). 实体提取
主要负责人:文继荣
参与者:聂再清,宋睿华,孙燕峰

在网页和网络数据库中存在着大量关于现实世界实体的结构化信息。开发小组开发出一种技术来从互联网中分类、抽取和集成这些实体信息。基于抽取出来的实体, 一种强大的实体级搜索引擎可以被构建,从而使用户可以直接得到他们需要的信息,而不用再浏览浩如烟海的网页。目前微软已经利用该技术购建了微软的商品搜索引擎Live Product Search 。这项技术可以帮助微软构建世界上最先进的的商品搜索引擎。
(10). 相关度验证
主要负责人:陈正
参与者:Tarek Najm,李颖,李力,王明雨,张本宇
用户通过搜索引擎来搜寻产品时,网站编辑竞相争夺那些能够把用户引导至他们网站的关键字。相关度验证程序能够比对网站内容,对编辑们希望争购的关键字进行查证,并返回相关或不相关的结果,让编辑知道他们争购的关键字是否与他们的网站相关,是否值得参与竞标。
(11). 交互式计算机视觉
主要负责人:孙剑
参与者:李寅,袁路,邓智强,沈向洋

许多计算机视觉应用需要高水平的可视化知识和专业技能,目前只能借助人工输入而实现。使用“懒人抓像”技术,即使普通用户也可以轻易地截取一张照片中感兴趣的对象(例如人脸),并创建一个带有不同背景的新场景;“形象合成”是一种用于填补照片中的缺失像素,或删除其中多余对象的工具。通过这种工具,用户能够直观且毫不费力地消除照片中需要去掉的人或物——只要在相片中画上几条曲线即可,还有什么方法比它更简单呢?
(12). 智能缩略图
主要负责人:华先胜
参与者:王扉,曹万勇,魏颢,史志隽,李世鹏

智能视频缩略图(包括静态缩略图和动态缩略图)是一种高度提升用户浏览视频效率和体验的视频呈现技术。它已经被广泛应用在微软视频搜索,Windows XP媒体中心,Windows Vista和MSN Video中。静态缩略图是一帧高视觉质量和有内容代表性的图像,使得用户通过一帧图像能大致知道视频的可能的主题。动态缩略图是一段视频摘要,由一组高质量和高代表性的视频片断组成。动态缩略图使得用户在很短的时间内能大致了解原始视频的主要内容。