你的位置:首页 > 财经 > 正文

马斯克还带来了另一款特斯拉新产品带宽为36 TB/s

作者:文辉 2021-08-21 16:14  来源:IT之家  
文章摘要
世界上最快的AI训练速度,王座,刚刚易手。 不是英伟达图形处理器,也不是谷歌TPU。. 马斯克领导下的特斯拉,自主研发的AI训练芯片D1...

世界上最快的AI训练速度,王座,刚刚易手。

不是英伟达图形处理器,也不是谷歌TPU。.

马斯克领导下的特斯拉,自主研发的AI训练芯片D1,自主研发的AI超级计算机Dojo ExaPod,以巅峰之作出道,以世界第一出道。

此外,马斯克还带来了另一款特斯拉新产品:

车载机器人搭载了特斯拉的包括芯片在内的软硬件系统,但与百度不同的是,它更像人而不是车。

这是马斯克在特斯拉一年一度的AI开放日上带来的一系列令人兴奋的进展。

特斯拉自研AI训练芯片D1发布

马斯克说:需要有一台超快的电脑来训练包括自动驾驶在内的整个自动驾驶系统。

DOJO诞生了。

Dojo,以日语中专门练武的DOJO命名,顾名思义,DOJO就是特斯拉AI的道场。

DOJO是通过网络结构连接的分布式计算架构它还有一个大的计算平面,极高的带宽和低延迟,以及一个由分区和映射组成的大网络

事实上,在CVPR 2021上,特斯拉已经展示了DOJO的相关表现。

当时终于达到了1.8EFLOPS,读写速度高达1.6TBps,一度被认为超越了世界第一超级计算机富越,创造了超级计算的新纪录。

当时,DOJO使用的是NVIDIA的A100 GPU,单卡计算能力为321TFLOPS,总共有5760张卡,720个节点。

现在,DOJO更进一步,自己开发了Heart芯片。

特斯拉首款AI训练芯片D1正式发布。

在7nm工艺中,FP32的计算力为22.6TOPs,BF16的计算力为362TOPs。

总之,比现在市面上的任何芯片都好。

特斯拉还称D1芯片为纯学习机。

此外,D1芯片不仅在单兵作战能力方面很强,而且在集团军作战能力方面也很强,可以无缝集成到一个非常大规模的计算阵列中。

能有多大。接下来,特斯拉公布了预热海报上的神秘物种:

训练模块有25个D1芯片!

这也是特斯拉的第一个训练模块,通过组装多个模块,可以形成一个计算能力更强的训练阵列:

至此,特斯拉自主研发的超算DOJO彻底亮相!

超过50万个训练节点每个模块的计算能力为9pb,带宽为36 TB/s

DOJO的可怕之处在于,与世界上其他超级计算机不同,它需要承担许多不同的任务DOJO唯一的使命就是AI训练,或者可以说是专注于自动驾驶算法的训练

因为专注,第一场秀就是巅峰。

自动驾驶,FSD和特斯拉的其他AI训练任务可以在DOJO中得到更高效的训练。

此外,特斯拉官方继续宠溺:这还不是终点,下一代DOJO将有10倍的性能提升!

所以它在这里去拿你的衣服

特斯拉D1支持的最后也是最强的终极杀手首次亮相:

ExaPOD集成了120个训练模块,包括3000个D1芯片和100多万个训练节点计算能力达到1.1EFLOP

而且单位能耗性能比当今最强的超级计算机高1.3倍,但碳排放只有1/5。

速度和性能都是业内最好的。

所以特斯拉明确表示,这是世界上最快的AI训练电脑。

有趣的是,2019年,美国能源部曾表示,将斥资6亿美元打造E级计算能力的超级计算,2023年问世.

没想到,这个目标最早是由汽车公司特斯拉实现的。

为谁建造的最强高炉。

所以问题是,自研的D1芯片有了,最强的AI训练超过了DOJO ready特斯拉接下来会怎样

特斯拉人工智能技术主管Andrej Karpathy上台介绍了D1芯片和DOJO主要服务对象是特斯拉在自动驾驶领域领先所有对手的魔弹:纯视觉解决方案

事故频发,纠纷不断甚至国内大部分玩家都转向了视觉激光雷达的综合方案,但特斯拉依然坚持

Karpathy详细介绍了特斯拉高纯度视觉方案的思路,目前8摄像头方案的特点,以及为什么可以工作。

特斯拉纯视觉方案,基本构建原则是把自动驾驶系统看成是有眼睛,有神经,有大脑的生物。

目前的方案有8个摄像头,背后是一个多任务学习神经网络,称为绣球花3354九头蛇网络。

Hydra网络可以处理目标检测,交通标志识别,车道预测等任务其关键在于各种数据的特征提取,包括不同种类数据的特征共享,不同任务的参数调整,参数缓存,从而加快参数调整

这也是实现FSD敏捷开发,半年内迭代2—3个版本的关键。

接下来,卡普西描述了纯视觉方案的历史以及该方案发展到今天的逻辑他展示了特斯拉处理其图像数据的视频

他说,虽然过去的消防处很好,但事实证明,这样的制度并不完善。每台摄像机都能探测到工程师期望的目标,但它背后的神经网络向量

空间是不够的。

于是,特斯拉如重新设计了神经网络,就是上面的九头蛇。

另外相机校准,缓存,队列和优化等等环节都做了最大程度简化。

特斯拉方面还比较了多摄像头方案和单摄像头方案的差别,相同的场景下,单摄像头方案识别率明显低于多摄像头方案。

特斯拉车辆上的 8 个摄像头获取原始输入后,系统会创建各种分辨率的图像,用于各种功能和目的。

这些不同的图像会被分别喂给处理不同任务的神经网络,作为整个自动驾驶系统的决策依据。

接着,Karpathy 介绍了特斯拉的终极建筑师,即车辆在行驶过程中可以实时对车道,环境建模。

车道线实时建模,其实就是特斯拉自己的高精地图能力。

中国自动驾驶玩家,强调高精度地图的不少,但特斯拉的思路,现成资源不是本质能力,本质能力应该是创造资源的能力。

最后,Karpathy 谈了 AI 公司常见的数据标注问题,他认为,把数据外包给第三方去做手工标注并不好,所以特斯拉选择自建团队来给数据打标,目前已经从 2D 图像标记升级到 4D 矢量空间的标记。

这也是特斯拉自动驾驶不断快速进化的核心所在。

依靠人工标注,显然无法应对量产车上路后的大规模数据,所以只有自动化标注,才能形成数据闭环。

开放日上,特斯拉也展示了如何从车道线,2D 图像 一点点跃迁至 4D 标注和建模的

行人,车辆,树木,建筑物 清清楚楚,而且还有意图识别

特斯拉方面也强调,基于类脑一样的感知系统,自动化标注能力,以及仿真,确保了特斯拉为什么可以基于纯视觉实现更高维度的自动驾驶。

仿真,简单讲就是利用现实数据,将真实世界的实时动态景象,在计算机系统实现重新构建和重现。

这套模拟程序,用特斯拉的话说,就是一个以自动驾驶为玩家的视频游戏。

在这套系统里,任何要素都可以被添加其中,包括奇葩的极端场景。

比如这里,人太多导致目标难以标注,车辆极多:

特斯拉这里还不忘补刀一下毫米波雷达 —— 纯视觉也能做很好,所谓的雷达冗余作用有限。

特斯拉方面还披露,现在标注和仿真系统,可以模拟数量高达 3.71 亿的数据及场景。

当然,自动驾驶最后还得解决从比特世界走向原子世界应用的问题。

这次特斯拉主要披露了控制和规划方面的进展。

特斯拉自动驾驶总监 Ashok Elluswamy,分享了特斯拉针对复杂场景的规划方案 ——混合规划系统。

主要思路和技术方法是基于蒙特卡洛树搜索,实现最佳路径规划。

最后,整个特斯拉自动驾驶从感知到决策规划,一图概括如下:

One more thing:特斯拉机器人

最后的最后,就在大家都以为发布会完全就是自动驾驶相关内容之际。

简短茶歇环节,竟然来了一段机器人热舞—— 宛如衣服 Model 一样的穿着,样子非常硅基。

这是特斯拉的行为艺术。

不不不,再次出乎意料。

马斯克再次登台,然后郑重其事发布:特斯拉机器人。

身高 5 英尺 8 英寸,约为 172cm,重量 125 磅,约为 56.7kg,承载能力为 45 磅,约为 20kg。

它的面部是一个显示屏,用来显示重要信息。

从外形上看,四肢和人类一样。

为了实现平衡性和敏捷性,四肢使用了 40 个机电推杆。

同时,特斯拉各项 AI 和芯片技术,都会应用其中。

比如使用 Autopilot 的摄像头充当感知系统,胸腔里内置特斯拉自研芯片 ——FSD 同款,还会加持多项特斯拉已开发出的技术,如多摄像头视频神经网络,规划能力,标记。

而且马斯克强调,这不是玩具周边,它会最终实现 —— 可能明年就会正式推出,这是特斯拉电动车的下一步。

硅谷钢铁侠还说,他会是一个非常有用的机器人,由人打造,为人服务,而且会确保一直对人友好,能把人从危险的,重复的,无聊的任务中解放出来。

甚至还能跟已经高度自动化的特斯拉车辆生产进一步结合协作但按照马斯克的意思,首要的应该是做家务

有意思的是,伴随着特斯拉这个机器人发布,太平洋两岸都把机器人作为了智能车变革的下一步。

中国这边,百度李彦宏刚刚推出了一款汽车机器人,不过更像汽车而不是人。

美国那头,马斯克的特斯拉机器人,更像人而不是汽车。

这种区别,也可能跟马斯克的那个江湖绰号有关。

伊隆马斯克,不就是现实版钢铁侠吗

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

分享到:
Copyright 2014-2020 免责声明 http://www.cshy5.cn 网站首页| 投诉与建议 | 网站地图 | |备案号: 闽ICP备2022005363号-4 认证