X

Intel представила ускоритель Heracles для вычислений над полностью зашифрованными данными

Intel представила специализированный ускоритель Heracles, рассчитанный на выполнение вычислений над полностью зашифрованными данными с использованием технологии полностью гомоморфного шифрования (FHE). В отличие от традиционного подхода, когда информация при обработке на CPU или GPU вынужденно расшифровывается и становится уязвимой, Heracles принимает, обрабатывает и возвращает данные в зашифрованном виде, снижая риск атак по побочным каналам, DMA-атак и вмешательства гипервизора.

Heracles не является процессором общего назначения и не запускает операционные системы или обычные приложения. Чип разработан строго под узкую задачу ускорения FHE-математики и решает ключевую проблему этой технологии — экстремальную ресурсоёмкость операций с гигантскими целыми числами и полиномиальными преобразованиями. По данным Intel, при частоте 1,2 ГГц ускоритель выполняет семь типовых FHE-операций в 1074–5547 раз быстрее, чем 24-ядерный Intel Xeon W7-3455 «Sapphire Rapids» на частоте 2,50–4,80 ГГц.

Архитектура Heracles радикально отличается от классических CPU и GPU. Ускоритель использует 8192-канальный SIMD-движок, организованный в 64 пары тайлов, образующих сетку 8×8, с 128 параллельными арифметическими линиями в каждой паре. Тайлы оптимизированы под модульное сложение, вычитание, умножение и «бабочковые» операции для прямого и обратного NTT, а также поддерживают автоморфизмы и бутстрэппинг для удаления криптографического шума и продления цепочек FHE-вычислений. Операции выполняются 32-битными арифметическими срезами для поддержания высокой точности и параллелизма.

Для питания такого параллелизма Heracles оснащён 48 ГБ памяти HBM3 (два стека) с пропускной способностью до терабайт в секунду и 64 МБ быстрой локальной scratchpad-памяти с крупными регистровыми файлами и выделенными буферами. Пиковая производительность достигает около 29,5 TOPS в «бабочковых» примитивах и примерно 9,8 TOPS в модульной арифметике, а пропускная способность преобразований измеряется терабитами в секунду. Ускоритель поддерживает основные FHE-схемы BGV, BFV и CKKS, что позволяет настраивать параметры под разные задачи и уровни безопасности.

Чип Heracles изготовлен по техпроцессу Intel 3, работает на частоте 1,2 ГГц, занимает площадь 197 мм² и укладывается в теплопакет 176 Вт. Устройство выполнено в форм-факторе PCIe-карты для установки в стандартные серверы и использует жидкостное охлаждение для удержания теплового режима под контролем. Разработка ведётся в рамках программы DARPA DPRIVE и демонстрирует практическую реализацию аппаратного ускорителя FHE, который должен сократить вычислительные издержки этой технологии примерно на пять порядков по сравнению с классическими процессорами и упростить внедрение конфиденциальных вычислений в облаках, медицине и финансовом секторе.