专利显示,微软的智能眼镜可能使用特定版本的 Windows 系统,能够在非标准环境下准确追踪运动和位置。该设备通过惯性测量单元(IMU)收集运动学数据,然后利用机器学习模型估计当前和过去的运动速度,从而计算出物体的位置。这一技术可以提高眼镜在光线不足或物体密集环境(如室内)下的定位精度,不再过度依赖 GPS 或视觉数据。
第二项专利涉及一种新的相机系统,通过灯、透镜阵列和图像引擎提升图像分辨率。放置在图像传感器阵列上的透镜阵列将被摄物体的光线聚焦到传感器上,从而拍摄出高分辨率图像。微软的这一技术与 Meta 的 Ray-Ban 智能眼镜类似,但旨在获得更好的效果。
虽然专利并不意味着一定会推出新产品,但该公司最近申请的 AR 眼镜专利数量有所增加。去年,微软还申请了一项延长 AR 眼镜电池续航的内部存储系统专利,以及一款带有可拆卸耳机电池的设备专利。尽管微软有不错的想法,但目前尚不清楚其是否愿意投入资源开发新的硬件产品线。
微软与MIT携手,引领AI推理新时代:精炼6700万参数模型,挑战GPT-4顶尖地位
近日,在这个信息爆炸的时代,智能设备如何理解“因为下雨,所以要带伞”这类因果关系,实际上涉及到人工智能领域的一个重要分支——因果推理(Causal Inference)。
一群来自微软和麻省理工学院等知名学术机构的研究人员,共同开发了一种突破性的机器学习训练策略。这项策略不仅克服了大型机器学习模型在逻辑推理方面的不足,还通过以下步骤实现了显著的进步:
独特的训练方法:研究人员采用了一种新颖的训练方法,这可能与常规的机器学习训练技术有所区别。
逻辑推理的改进:他们的方法显著提升了大型模型的逻辑推理能力,解决了先前存在的挑战。
利用因果关系构建训练集:研究团队利用因果关系模型来构建训练数据集,这种模型能够揭示变量间的因果联系,有助于训练出能够理解数据背后因果逻辑的模型。
教授模型基础公理:他们直接向模型传授逻辑和数学中的基础前提,帮助模型更好地进行逻辑推理。
小型Transformer模型的惊人表现:尽管模型参数仅有6700万,但通过这种方法训练出的Transformer模型,在推理能力上竟能与GPT-4相媲美。
因果推理,听起来像是哲学家的专利,但其实它早已渗透到我们生活的方方面面。对于人工智能来说,掌握因果推理,就像是学会了用“因为...所以...”来解释世界。但AI不是天生就会这个的,它们需要学习,而这学习的过程,就是这篇论文要说的故事。
公理训练方法:
想象一下,你有一个非常聪明的学生,但它对世界的因果关系一无所知。你要怎么教它呢?研究人员就想出了一个办法——公理训练。这就像是给AI一本“因果关系手册”,让它通过这本手册,学会如何识别和应用因果规则。
研究人员用变换器模型做了实验,结果发现,这种训练方法真的有效!AI不仅学会了在小规模的图上识别因果关系,而且还能把这些知识应用到更大的图上,即使它以前没见过这么大的图。
这项研究的贡献在于,它提供了一种新的方法,让AI能够从被动数据中学习因果推理。这就像是给了AI一种新的“思考”方式,让它能够更好地理解和解释世界。
这项研究不仅让我们看到了AI学习因果推理的可能性,也为我们打开了一扇门,让我们看到了AI在未来可能的应用场景。也许在不久的将来,我们的智能助手不仅能回答问题,还能告诉我们为什么会这样。
微软推送Win11照片应用更新,修复组策略冲突引发的打开故障
7月18日消息,微软官方此前通过Microsoft Store推送了新版照片应用程序(版本号2024.11070.15005.0),此次更新专门解决了因组策略或CSP策略冲突而引发的应用无法启动的问题,确保了用户能够正常访问及使用该应用。
微软表示用户或管理员不需要交互,Windows 11 照片应用未来几周内会自动完成升级部署,修复这个问题。用户也可以手动检查更新、访问 Microsoft Store 页面,将 Windows 11 照片应用升级到最新版本。
此前报道,该问题影响 Windows 11 22H2 和 23H2 用户,用户无法打开照片(Photos)应用,会显示一个旋转的圆圈,之后可能会消失。
微软表示导致这个问题的原因可能是启用了“BlockNonAdminUserInstall”组策略导致的,不过使用 Windows 11 家庭版的用户大概率不会受到影响。
微软新专利预示未来:尖端摄像头加持,Windows AR眼镜前景可期
7月29日消息,尽管微软的Windows混合现实业务面临挑战,但该公司似乎并未放弃对智能眼镜项目的探索,特别是搭载了Copilot或集成AI技术、运行在Windows或Windows Holographic OS平台上的设备。近期披露的专利文件暗示,微软继续对这一前沿技术领域保有深厚兴趣,预示着未来可能见证到更多创新的智能眼镜产品问世。
微软获得了两项专利,分别名为“可穿戴计算设备的复合姿态估计”和“空间频域中的分辨率增强”,这两项专利分别于今年 2 月和 3 月由美国专利商标局(USPTO)公布。与 HoloLens 等全息设备不同,这些智能眼镜更面向普通消费者。
第一项专利于 2023 年 11 月申请,今年 2 月获批;第二项专利则于 2022 年 9 月申请,今年 3 月获批。此外,微软还在欧洲注册了这两项专利。
专利显示,微软的智能眼镜可能使用特定版本的 Windows 系统,能够在非标准环境下准确追踪运动和位置。该设备通过惯性测量单元(IMU)收集运动学数据,然后利用机器学习模型估计当前和过去的运动速度,从而计算出物体的位置。这一技术可以提高眼镜在光线不足或物体密集环境(如室内)下的定位精度,不再过度依赖 GPS 或视觉数据。
第二项专利涉及一种新的相机系统,通过灯、透镜阵列和图像引擎提升图像分辨率。放置在图像传感器阵列上的透镜阵列将被摄物体的光线聚焦到传感器上,从而拍摄出高分辨率图像。微软的这一技术与 Meta 的 Ray-Ban 智能眼镜类似,但旨在获得更好的效果。
虽然专利并不意味着一定会推出新产品,但该公司最近申请的 AR 眼镜专利数量有所增加。去年,微软还申请了一项延长 AR 眼镜电池续航的内部存储系统专利,以及一款带有可拆卸耳机电池的设备专利。尽管微软有不错的想法,但目前尚不清楚其是否愿意投入资源开发新的硬件产品线。
微软改进Chromium内核,视频未加载完全前自动暂停,提升浏览体验
近日消息,微软向Chromium开源项目贡献了重要代码更新,这一贡献预计将进一步优化Chrome、Edge以及其他基于Chromium的浏览器的媒体播放性能,为用户带来更流畅、高质量的观看体验。
注:网络应用程序或网站可以通过各种方式嵌入媒体内容,其中最常见的方法是使用 iframe,这样可以在网站加载时暂时隐藏媒体。
不过这种 iframe 嵌入方式也存在一个问题,就是视频没有加载或没有出现在网页的时候,媒体也已经开始播放了。
在这种情况下,用户会发现浏览器正在播放一些内容,音频也在播放,但在网页上却看不到任何内容。
微软贡献的最新代码中,希望引入新的策略来控制 iframe 媒体播放的工作方式,网页播放媒体资源之前,会先判断嵌入式视频是否已呈现。
如果嵌入视频处于未渲染状态下,基于 Chromium 的浏览器将不再播放,也可指示嵌入的媒体暂停 iframe 媒体播放。
与此同时,当 iframe 已呈现且用户能看到视频时,Chromium 将命令嵌入式媒体恢复 iframe 媒体播放。
附上微软贡献代码细节如下:
添加了“media-playback-while-not-rendered”权限策略,允许嵌入网站暂停未渲染(即其“display”属性设置为“none”)的嵌入式 iframe 的媒体播放。
这将让开发人员能够打造更友好的用户体验,并通过让浏览器处理用户不可见内容的播放来提高性能。
视频播放
30.38MB
商务办公
48.51MB
生活购物
0KB
网络通讯
27MB
生活购物
65.38MB
主题妆饰
50.15MB
其他
13.20MB
生活购物
116.10MB
生活购物
70.56MB
益智休闲
9.64MB
益智休闲
0KB
益智休闲
0KB
益智休闲
0KB
塔防谋略
190.57MB
益智休闲
43.26MB
益智休闲
43.91MB
角色扮演
14.90MB
益智休闲
45.95MB