作者:Dwith Chenna
当您为在家放松的晚会准备时,您可以要求智能手机播放自己喜欢的歌曲或告诉家庭助理以使灯光变暗。这些任务很简单,因为它们由人工智能(AI)现在已整合到我们的日常工作中。这些平稳互动的核心是边缘AI直接在类似设备上运行的AI智能手机,,,,可穿戴设备, 和物联网一个 小工具,提供直接和直观的响应。
边缘AI是指部署AI算法直接在网络边缘的设备上,而不是依靠集中式云数据中心。这种方法利用了边缘设备的处理功能,例如笔记本电脑,智能手机,智能手表和家用电器以在当地做出决定。
Edge AI为隐私和安全性:通过最大程度地减少需要通过互联网,边缘AI降低了数据泄露。它还提高了数据处理和决策的速度,这对于实时应用程序至关重要卫生保健可穿戴设备,工业自动化,,,,增强现实和游戏。Edge AI甚至可以在间歇性连通性的环境中起作用,从而支持有限的维护和减少的自主权数据传输费用。
尽管AI现在已集成到许多设备中,但在日常设备中启用强大的AI功能在技术上具有挑战性。边缘设备在处理能力,内存和电池寿命的严格限制内,在适度的硬件规格中执行复杂的任务。
例如,要使智能手机执行精致面部识别,他们必须使用尖端优化算法来分析毫秒中的图像和匹配特征。实时翻译耳塞需要保持低能用途以确保电池寿命的延长。而基于云的同时AI模型可以依靠外部服务器凭借广泛的计算能力,Edge设备必须与手头上的功能一起做。向边缘处理的这种转变从根本上改变了AI模型的开发,优化和部署的方式。
能够在边缘设备上有效运行的AI模型需要大大降低并大大计算,同时保持相似的可靠结果。这个过程通常称为模型压缩,涉及高级算法,例如神经建筑搜索(NAS),转移学习,修剪和量化。
模型优化应首先选择或设计专门适用于设备硬件功能的模型体系结构,然后对其进行改进以在特定边缘设备上有效运行。NAS技术使用搜索算法探索许多可能的AI模型,并找到最适合边缘设备上特定任务的模型。转移学习技术使用已经训练的较大模型(老师)训练了一个较小的模型(学生)。修剪涉及消除不显着影响准确性的冗余参数,并且量化将模型转换为使用较低的精度算术来节省计算和内存使用情况。
当将最新的AI模型带到边缘设备时,只要专注于他们可以专门执行基本计算的效率,这很诱人。乘以造成的操作,或Mac。简而言之,MAC效率可以衡量芯片可以在AI的核心:乘以数字并添加它们的核心速度。模型开发人员可以获得MAC隧道视觉,专注于该指标并忽略其他重要因素。
一些最受欢迎的AI模型Mobilenet,,,,有效网络, 和变压器对于视觉应用,在这些计算中设计为非常有效。但是实际上,这些模型总是在AI芯片在我们的手机或智能手表内部。这是因为现实世界的性能不仅取决于数学速度,还取决于数据在设备内部可以移动的速度。如果模型不断需要从内存中获取数据,那么无论计算速度多快,它都可以减慢所有内容。
令人惊讶的是,较老,较大的模型重新连接有时在当今的设备上更好地工作。它们可能不是最新的或最精简的,但是内存和处理之间的来回非常适合AI处理器规格。在实际测试中,这些经典型号在边缘设备上的速度和准确性也更高,即使在修剪成合适之后。
教训?最好的AI模型总是具有最华丽的新设计或最高理论效率的模型。对于边缘设备,最重要的是模型与实际运行的硬件相适应。
该硬件也正在迅速发展。为了满足现代AI的需求,设备制造商已经开始,包括特殊的专用芯片AI加速器在智能手机,智能手表,可穿戴设备等中。这些加速器的构建是专门用于处理AI模型所需的计算和数据移动的种类。每年都会在建筑,制造和集成方面取得进步,以确保硬件与AI趋势保持同步。
生态系统的零散性质使在边缘设备上部署AI模型更加复杂。由于许多应用程序需要自定义模型和特定的硬件,因此缺乏标准化。需要有效的开发工具来简化机器学习边缘应用的生命周期。这样的工具应该使开发人员更容易优化现实世界的性能,功耗和延迟。
设备制造商与AI开发人员之间的协作正在缩小工程与用户互动之间的差距。新兴趋势集中在上下文意识和自适应学习上,使设备可以更自然地预测和响应用户需求。通过利用环境线索和观察用户习惯,Edge AI可以提供直观和个人化的响应。本地化和定制的情报旨在改变我们的技术和世界的经验。