OpenVINO™ 整合TensorFlow实现推理加速 | 开发者实战
【慧聪教育网】技术的传播采用通常是由用户体验的飞跃引发的。例如,iPhone 促使智能手机和“应用商店”的快速普及。最近,TensorFlow 的易用性启动了人工智能的大规模增长,几乎触及了我们今天日常生活的方方面面。
OpenVINO™ 工具套件重新定义了采用英特尔技术设备上的 AI 推理能力,并获得了广大开发人员采用。如今,成千上万的开发人员使用 OpenVINO™ 工具套件来加速几乎所有可以想象到的 AI 推理应用场景,从人类视觉仿真,自动语音识别,自然语言处理,推荐系统等等。该工具包基于最新一代的人工神经网络,包括卷积神经网络 (CNN)、基于循环和注意力的网络,扩展计算机视觉和非视觉工作负载,可跨英特尔® 硬件(英特尔 CPU、英特尔集成显卡® 、英特尔® 神经计算棒 2 和英特尔® 视觉加速器设计与英特尔® Movidius™ VPU)从而最大限度地提高性能。它通过从边缘部署到云的高性能、AI 和深度学习推理来加速应用。
我们很荣幸能与客户/开发者合作,为他们的成功做出贡献。透过不断倾听和创新,以满足他们不断变化的需求,同时也致力于提供世界一流的用户体验。因此,根据客户反馈,在OpenVINO™ 工具套件的成功基础上,我们将OpenVINO™ 与TensorFlow* 集成。
有在涉略 AI 边缘运算的各位们对于 OpenVINO™ 应该都有基础的了解:不同框架(如 TensorFlow、PyTorch 等)训练完成的模型文件在经由 OpenVINO™ 转换后可以在不同边缘运算装置执行推理加速。
若笔者告诉各位,现不用经过模型转换可以直接在 TensorFlow 中推理时完成 OpenVINO™ 加速呢?
是的你没看错!英特尔在 2021 下半年推出的OpenVINO™ integration with TensorFlow(以下简称OVTF)能够实现在 TensorFlow 中介接 OpenVINO™ 执行推理加速。
OpenVINO™ x TensorFlow
幸福来得太突然
对 TensorFlow 开发人员的好处:不须转换, 只需加 2 行代码即可加速其 TensorFlow 模型的推理速度。
OpenVINO™ 与 TensorFlow* 的集成提供了增强 TensorFlow 兼容性所需的 OpenVINO™ 工具套件内联优化和 run time。它专为使用OpenVINO™ 工具包的开发人员而设计 - 帮助提高其推理应用程序的性能 - 只需最少的代码修改。它可以加速各种英特尔® 芯片上许多 AI 模型的推理,例如:
▪ 英特尔中央® 处理器
▪ 英特尔® 集成显卡
▪ 英特尔® Movidius™ 视觉处理单元 – 又称 VPU
▪ 采用 8 个英特尔® Movidius™ MyriadX VPC 的英特尔视觉加速器设计 - 称为 VAD-M 或 HDDL
利用此集成的开发人员可预期以下好处:
性能加速 - 与原本 TensorFlow 相比(取决于底层硬件配置)
精度 – 保持与原始模型几乎相同的精度。
简单性 – 继续使用 TensorFlow API 进行推理。无需重构代码。只需导入,启用和设置设备。
健壮性 – 旨在支持各种操作系统 / Python 环境中的各种 TensorFlow 模型和运算符。
无缝加速 - 内联模型转换 – 无需模型转换。
轻量级占用空间 – 所需的增量内存和磁盘占用空间极小。
支持广泛的英特尔产品 – CPU、iGPU、VPU (Myriad-X)。
注意:为获得最佳性能、效率、工具定制和硬件控制,我们建议采用本机 OpenVINO™ API 及其run time运行。
如何实现?
开发人员可通过将以下两行代码添加到他们的 Python 代码或 Jupyter Notebooks 中来大大加快 TensorFlow 模型的推理。
1 import openvino_tensorflow
2 openvino_tensorflow.set_backend
('<backend_name>')
支持的后端<backend_name>包括“CPU”,“GPU”,“MYRIAD”和“VAD-M”。参见图1。
上面第一行严格来说不算指令,只汇入了 OpenVINO™ 整合 TensorFlow 套件。而第二行呼叫了 openvino_tensorflow 设定后端运算硬件的指令,其中带入的参数可以设定为CPU(Intel 处理器)、GPU(Intel 处理器中的集成式显卡)、MYRIAD(AI加速芯片VPU)等。如此一来就已完成TensorFlow推理加速了。
示例代码
以下是OpenVINO™ 与 TensorFlow* 集成的示例:
图 1
它是如何达成的?
而其特别之处从架构图看来可以得知在原始 TenorFlow 与 OpenVINO™ toolkit 之间多增加了 Operator Capability Manager (OCM)、Graph Partitioner、 TensorFlow Importer 与 Backend Manager,让前述二者可以浑然天成的结合在一起。简单来说在执行推论时会对神经网络各个运算进行判读,是否能够透过 OpenVINO™ 进行加速,并让其对应到 OpenVINO™ 的相应的运算子,最后分配到指定的后端硬件进行运算,反之若是不行加速的运算则让其返回在 TensorFlow 中处理。
个别功能作用细节可从 github repo 与说明文件进行深入探究。若不了解这些技术细节也不要紧,参考模型支持文件可以得知各个TensorFlow模型(包含 TF-Slim Classification、Object Detecion、 TF- Hub 等众多来源)的支持程度,或是跟着我们接下来的步骤进行体验一番!
图2:OpenVINO™ integration with TensorFlow架構圖(https://github.com/openvinotoolkit/openvino_tensorflow/blob/master/docs/ARCHITECTURE.md)
OpenVINO™ 与 TensorFlow* 的集成通过将 TensorFlow 图有效地划分为多个子图来提供加速的 TensorFlow 性能,然后将这些子图调度到 TensorFlow 运行时或 OpenVINO™ 运行时以实现最佳加速推理。最终组合出最终的推理结果。
图 3:工作流的端到端概述
在边缘和云端部署
OpenVINO™ 与 TensorFlow 的集成适用于从云到边缘的各种环境,只要底层硬件是英特尔平台即可。适用于以下云平台:
▪ 面向边缘的英特尔® DevCloud
https://www.intel.com/content/www/us/en/developer/tools/devcloud/edge/build/ovtfoverview.html
▪ AWS Deep Learning AMI Ubuntu 18 和 Ubuntu 20 on EC2 C5 实例,针对推理进行优化
https://github.com/openvinotoolkit/openvino_tensorflow/blob/master/docs/cloud_instructions/AWS_instructions.md
▪ Azure ML
https://www.intel.com/content/www/us/en/developer/tools/devcloud/edge/build/ovtfoverview.html
▪ 谷歌实验室
https://github.com/openvinotoolkit/openvino_tensorflow/tree/master/examples/notebooks
支持任何基于 AI 的边缘设备。
示例在 gitrepo 的示例/ 目录中提供。
这与使用原生OpenVINO™
有何不同
OpenVINO™ 与 TensorFlow* 的集成使 TensorFlow 开发人员能够以非常快速简便的方式加速其 TensorFlow 模型推理 - 只需 2 行代码。OpenVINO™ 模型优化器可加速推理性能,以及丰富的集成开发人员工具和高级功能,但如前所述,为了获得最佳性能,效率,工具定制和硬件控制,我们建议使用本机 OpenVINO™ API 及 run time 运行。
案例
以下客户正在将 OpenVINO™ 集成用于 TensorFlow 用于各种用例。以下是一些示例
Extreme Vision(极视角):极视角 的 CV MART 等专用 AI 云 https://www.cvmart.net/
可帮助数十万开发人员提供丰富的服务、模型和框架目录,从而在各种英特尔平台(如 CPU 和 iGPU)上进一步优化其 AI 工作负载。与 AI 框架(如 OpenVINO™ 与 TensorFlow* 的集成)正确集成的易于使用的开发人员工具包可加速模型,从而提供两全其美的优势 - 提高推理速度以及以最小的更改重用已创建的 AI 推理代码的能力。Extreme Vision 团队正在测试OpenVINO™ 与TensorFlow* 的集成,目标是在 Extreme Vision 平台上为 TensorFlow 开发人员提供支持。
由博德研究所开发的基因组分析工具包(GATK)是世界上使用最广泛的变体调用开源工具包之一。Terra 是一个更安全,可扩展的开源平台,供生物医学研究人员访问数据,运行分析工具和协作。基于云的平台由麻省理工学院博德研究所与哈佛大学,微软和 Verily 共同开发。Terra 平台包括 GATK 工具和管道,供研究界运行其分析。CNNScoreVariants 是 GATK 中包含的深度学习工具之一,它应用卷积神经网络来过滤带注释的变体。在一篇博客中,Broad Institute 展示了如何使用 OpenVINO™ 与TensorFlow* 集成来进一步加速 CNNScoreVariants 的推理性能。