特斯拉开发 Dojo 神经网络训练计算机;CMU 新实验改善机器人知觉

开发者社区行业周刊又和大家见面了,快来看看这周有哪些值得我们开发者关注的重要新闻吧。

  • 特斯拉开发 Dojo 神经网络训练计算机 后者是性能野兽

  • 高通骁龙芯片存在 400 多个漏洞,影响全球超 40% 机型

  • 战略合作:携程核心供应链接入京东

  • 英特尔 11 代酷睿实现 “跨代式”提升:低电压下可达更高频率

  • 英伟达收购Arm交易最快夏末完成 后者价值约 440 亿美元

  • 几行代码即可高效创建数据集,谷歌开源 TFRecorder

  • CMU 研究人员探索声音以帮助改善机器人知觉

  • 谷歌开源 chromeOS.dev,在 Chrome OS 上构建应用更轻松

  • ACL 2020 丨基于不同硬件搜索更好的Transformer结构

  • ECCV 2020 Spotlight 丨图像定位上的细粒化区域相似性自监督

  • ECCV2020丨显著改善分割预测,ETH 开源基于情景图储存网络的视频目标分割

行 业 要 闻

Industry   News

▲▲▲

8 月 16 日消息,特斯拉 CEO 马斯克日前在社交网络上表示,公司正在开发一种称为 Dojo 的神经网络训练计算机,以处理大量的视频数据。马斯克称,Dojo 就像是一头真正的性能野兽。在去年的自动驾驶开放日(“Autonomy Day”)上,马斯克曾表示,Dojo 目标是能够接收大量数据并在视频级别进行培训,并使用 Dojo 程序或 Dojo 计算机对大量视频进行无监督的大规模训练(unsupervised massive training)。

网络安全供应商 Check Point 表示,该公司在一项代号为“Achilles”研究中,对高通骁龙的数字信号处理( Digital Signal Processing,DSP)芯片进行了广泛的安全性评估。结果发现,该芯片中存在 400 多个易受攻击的代码段。 这意味着,全球市场上有超过 40% 的设备(涉及谷歌、三星、LG、小米、一加等安卓手机)将受到该漏洞影响,面临被黑客入侵的风险。DSP 芯片是手机中的一种辅助芯片,主要负责处理音频、视频和图像数据;出现在大多数现代手机中,并随高通的骁龙处理器一起提供。

8 月 16 日,京东集团、携程集团正式签署战略合作协议。根据合作协议,携程的核心产品供应链将接入京东平台,同时双方将在用户流量、渠道资源、跨界营销、商旅拓展、电商合作等方面开展全方位的合作。达成合作后,携程将为京东提供实时产品库存,以及极具市场竞争力的产品价格,京东则将接入携程的核心产品供应链,并将京东平台的用户流量开放给携程,在日常运营、精准营销方面为携程旅行产品供应链提供全方位的支持。

英特尔正式公布了 Tiger Lake SoC,采用了 Willow Cove 架构,官方称将提供超越代间 CPU 性能的提高。根据英特尔的官方文件, Willow Cove 架构下,处理器可在更低的电压下达到更高的频率。

知情人士称,英伟达和 Arm 双方已进入排他性谈判阶段,有望在夏末之前达成交易。外媒称,今年 4 月,Arm 首次被其母公司软银挂牌出售,当时美国投行高盛受聘物色潜在买家。高盛 4 月份曾联系苹果,但苹果并不打算参与竞购,因为 Arm 的授权业务与苹果软件和硬件结合的商业模式并不十分相符。并且,如果苹果收购这家为众多竞争对手供货的芯片技术授权商,还有可能引发监管方面的担忧。

 

 

谷歌近期开源了 TensorFlow Recorder(即 TFRecorder)项目,旨在简化 TFRecord 的创建流程。TFRecord是一种二进制文件格式,处理数据相对高效,但要将其他数据转为 TFRecord 较为麻烦,通常需要编写一个数据管道来解析结构化数据,从存储中加载图像,然后再将结果序列化为 TFRecord 格式。而此次开源的 TFRecorder 能够直接从 Pandas dataframe 或 CSV 等格式写入 TFRecords,无需再编写复杂的代码。 

卡内基梅隆大学的研究团队的一项新实验提出了使用 Rethink Robotics 的 Sawyer 在金属托盘中移动物体的方法,以使它们感觉到它们在周围滚动,滑动并撞向侧面时发出的声音。总共有 60 个对象-包括工具、木块、网球和一个苹果-记录和分类了 15,000 个「交互」。该团队将机器人命名为「Tilt-Bot」,能够识别物体,成功率高达 76%,甚至可以确定金属螺丝刀和扳手之间相对较小的材料差异。通过使用声音数据,该机器人通常能够正确确定对象的材料构成。

谷歌近日推出了 Chrome OS 开发者中心(chromeOS.dev),网站内包含许多技术资源、教程、代码示例和新鲜资讯等,其目的是“帮助开发者更大限度地利用平台上的功能”,了解 Chrome OS,并更轻松地构建 Chrome OS 应用程序。chromeOS.dev 的主要目标人群是 Web、Android 以及 Linux 开发者,也包括设计师、产品经理,还有业务负责人。目前该网站仅提供英文和西班牙语,之后会陆续支持更多语种。

学 术 前 沿

Academic News

▲▲▲

过去有大量针对 Transformer 结构进行简化的工作,但是它们都没有考虑到不同硬件对模型结构的影响。本文首次提出使用网络结构搜索(NAS)的方法,针对不同的硬件,搜索适合该硬件的最佳的 Transformer 结构。实验表明,在不同硬件下,得到的Transformer结构相比其他模型更小、更快,且不损效果。

*论文链接:https://arxiv.org/abs/2005.14187

本文介绍一篇发表于 ECCV 2020 的论文,该论文被收录为 spotlight presentation。针对大规模图像定位中的弱监督问题提出有效的解决方法,旨在通过自监督学习的方法充分挖掘表征学习中的难样本,并进一步将图像级监督细粒化为区域级监督,以更好地建模图像与区域间的复杂关系。利用该算法训练的模型具有较强的鲁棒性和泛化性,在多个图像定位数据集上进行了验证,[email protected] 准确度大幅超越最先进技术高达 5.7%,代码和模型均已公开。

*论文链接:https://arxiv.org/abs/2006.03926

本文着力于解决视频目标分割领域的一个基本问题:使分割模型有效适应特定视频以及在线目标的外观变化。提出了一种简洁快速的新图存储机制,显著改善了分割预测。此外,图存储网络产生的框架还可以推广到one-shot和zero-shot视频目标分割任务。

*论文链接:https://arxiv.org/pdf/2007.07020.pdf

*以上信息来源于网络,由“京东智联云开发者”公众号编辑整理,

不代表京东智联云立场*