Byte

NOTICIAS RECIENTES

Mar 07, 2023

Transistores electroquímicos verticales para wearables

Mar 09, 2023

Los nuevos transistores Skyrmion impulsan la investigación cuántica y de IA

Mar 11, 2023

Conoce a Forksheet: Imec's In

Mar 13, 2023

Científicos acaban de presentar el primer transistor eléctrico de madera del mundo : ScienceAlert

Mar 15, 2023

Imec revela sub

ENVÍE SU CONSULTA

ENTREGAR

Sep 26, 2023

Mientras que los algoritmos de inteligencia artificial (IA) se ejecutan en sistemas más grandes y potentes

Si bien los algoritmos de inteligencia artificial (IA) que se ejecutan en hardware más grande y potente a menudo atraen la atención, no se debe subestimar la importancia de la IA perimetral. Edge AI se refiere a la implementación de algoritmos de IA en dispositivos locales como teléfonos inteligentes, cámaras, sensores y otros dispositivos de Internet de las cosas, en lugar de depender únicamente de soluciones basadas en la nube. Este enfoque descentralizado ofrece numerosos beneficios y desbloquea una amplia gama de posibles aplicaciones.

Una de las principales ventajas de la IA perimetral es la latencia reducida. Al procesar los datos localmente en el propio dispositivo, Edge AI elimina la necesidad de viajes de ida y vuelta a la nube, lo que da como resultado tiempos de respuesta más rápidos. Esta capacidad en tiempo real es crucial en escenarios donde la toma de decisiones inmediata es vital, como con vehículos autónomos, automatización industrial y monitoreo de infraestructura crítica. Además, Edge AI mejora la privacidad y la seguridad, ya que los datos confidenciales permanecen en el dispositivo local, lo que reduce el riesgo de filtraciones de datos y garantiza la confidencialidad del usuario.

A pesar de las numerosas ventajas, la ejecución de algoritmos que consumen más recursos, como la detección de objetos complejos o modelos de aprendizaje profundo, en dispositivos perimetrales presenta un desafío importante. Los dispositivos informáticos perimetrales suelen tener una potencia informática, una memoria y unos recursos energéticos limitados en comparación con el hardware basado en la nube. Lograr un equilibrio entre la precisión del algoritmo y las limitaciones del dispositivo se vuelve crucial para garantizar un funcionamiento eficiente. Las optimizaciones como la compresión del modelo, la cuantificación y las técnicas de inferencia eficientes son necesarias para que estos algoritmos funcionen bien en los dispositivos periféricos.

Debido a que comprender y reconocer objetos en imágenes o videos es una tarea fundamental en la percepción visual, los algoritmos de detección de objetos son de especial importancia en diversas industrias y aplicaciones. Se han logrado grandes avances en la adaptación de los modelos de detección de objetos a dispositivos periféricos con recursos limitados, como el algoritmo FOMO de Edge Impulse, que se ejecuta hasta 30 veces más rápido que MobileNet SSD, pero requiere menos de 200 KB de memoria para muchos casos de uso. Pero para áreas de aplicación tan importantes y diversas, hay mucho espacio para realizar más avances.

El último participante en el campo es un equipo de investigadores del Centro de Aprendizaje Basado en Proyectos de ETH Zurich. Han desarrollado una red de detección de objetos altamente flexible, eficiente en memoria y ultraligera a la que llaman TinyissimoYOLO. Las optimizaciones aplicadas a este modelo lo hacen ideal para funcionar con microcontroladores de bajo consumo.

TinyissimoYOLO es una red neuronal convolucional (CNN) basada en la arquitectura del popular algoritmo YOLO. Se construyó con capas convolucionales cuantificadas con núcleos de 3 x 3 y una capa de salida totalmente conectada. Tanto las capas lineales convolucionales como las totalmente conectadas están fuertemente optimizadas en las cadenas de herramientas de hardware y software de los dispositivos modernos, lo que le da a TinyissimoYOLO un impulso en términos de velocidad y eficiencia. Es una red de detección de objetos generalizada que se puede aplicar a una amplia gama de tareas y no requiere más de 512 KB de memoria flash para almacenar los parámetros del modelo.

El modelo se puede implementar en prácticamente cualquier hardware que cumpla con sus requisitos muy modestos, incluidas las plataformas con procesadores Arm Cortex-M o aceleradores de hardware AI. Se probó una amplia gama de dispositivos con TinyissimoYOLO, incluidos Analog Devices MAX78000, Greenwaves GAP9, Sony Spresense y Syntiant TinyML.

Al evaluar sus métodos, el equipo descubrió que podían ejecutar la detección de objetos en una placa MAX78000 a la asombrosa velocidad de 180 fotogramas por segundo. Y este excelente rendimiento vino con un consumo de energía ultrabajo de solo 196 µJ por inferencia. Por supuesto nada de esto importa si el modelo no funciona bien. Pero sorprendentemente, este diminuto modelo también se desempeñó de manera comparable a los algoritmos de detección de objetos mucho más grandes.

Sin embargo, naturalmente, es necesario cortar algunas esquinas para lograr tal hazaña. El tamaño de entrada de la imagen, por ejemplo, está limitado a 88 x 88 píxeles. Esa es una resolución insuficiente para muchos usos. Además, debido a que el problema de detección de objetos multiclase se vuelve más difícil a medida que aumenta la cantidad de objetos, se admite un máximo de tres objetos por imagen.

A pesar de estas limitaciones, la versatilidad, la precisión y los requisitos mínimos de hardware de TinyissimoYOLO lo convierten en una opción atractiva para aquellos que buscan realizar una detección de objetos en el perímetro.

Microcontrolador minúsculo utiliza real

RISC

Noticias

Byte