Smart Engines представила GreenOCR 2.0: минус 20% энергопотребления и в десять раз меньше ошибок при распознавании текста

Российская Smart Engines объявила о выпуске GreenOCR 2.0 — второго поколения собственной платформы распознавания текста. Разработчикам удалось сократить энергопотребление алгоритма на 20% и одновременно уменьшить число ошибок в десять раз по сравнению с предыдущей версией, что повышает привлекательность решения для мобильных и встраиваемых устройств без дискретного графического ускорителя.

Smart Engines представила GreenOCR 2.0: минус 20% энергопотребления и в десять раз меньше ошибок при распознавании текста

Успех обеспечили сверхлёгкие 4,6-битные и усредняющие 8-битные нейросети. В первой группе весовые коэффициенты квантуются так, чтобы промежуточные данные укладывались в регистры CPU, во второй применяется древовидное усреднение скалярных произведений, позволяющее задействовать векторные инструкции ARM максимально эффективно. Отказ от вычислений с плавающей запятой устраняет необходимость в дата-центрах и соответствует принципам Green AI, снижая углеродный след.

GreenOCR 2.0 распознаёт печатный и рукописный текст на 103 языках, корректно обрабатывает символы, знаки препинания и их взаимное расположение. Модуль уже интегрирован в продукты Smart ID Engine, Smart Code Engine и Smart Document Engine, которые применяются в аэропортах Шереметьево, Внуково, Кольцово, а также в крупных банках и государственных структурах. Компании-заказчики получают не только более точное OCR-решение, но и экономию энергии на мобильных рабочих местах.

Программное обеспечение включено в Единый реестр российского ПО Минцифры и поставляется без привязки к зарубежным облачным сервисам, что важно для проектов импортозамещения. По расчётам Smart Engines, годовая совокупная эмиссия CO2 от работы GreenOCR 2.0 ниже, чем у одного типового уличного газового обогревателя, что задаёт новую планку энергоэффективности для индустрии оптического распознавания символов.

Тоже интересно