Восстановление Алгоритма Штрассена С Помощью Нейронных Сетей

Быстрое умножение матриц можно представить как поиск низкоранговых разложений тензора матричного умножения. Мы разработали нейронную архитектуру, названную \textsc{StrassenNet}, которая воспроизводит алгоритм Штрассена для умножения матриц размером $2\times 2$. В ходе многочисленных независимых запусков нейронная сеть всегда сходится к тензору ранга 7, тем самым численно восстанавливая оптимальный алгоритм Штрассена.

Восстановление алгоритма Штрассена

Далее мы обучили ту же архитектуру на умножении матриц размером $3\times 3$ с рангом $r$, принимающим значения от 19 до 23. Наши эксперименты выявили четкий численный порог: модели с $r=23$ достигают значительно более низкой ошибки валидации, чем модели с $r\le 22$. Это позволяет предположить, что $r=23$ может быть наименьшим эффективным рангом тензора матричного умножения $3\times 3$.

Расширение метода на пограничные разложения

Мы также наметили расширение метода на пограничные разложения с использованием $\varepsilon$-параметризации и представили предварительные результаты, соответствующие известным границам для пограничного ранга тензора матричного умножения $3\times 3$. Пограничные разложения представляют интерес, поскольку позволяют аппроксимировать тензор матричного умножения с использованием разложений, которые не являются строго низкоранговыми, но приближаются к ним по мере уменьшения $\varepsilon$. Полученные результаты подтверждают теоретические оценки и указывают на перспективность применения данного подхода для исследования и оптимизации алгоритмов умножения матриц.

Восстановление алгоритма Штрассена

Расширение метода на пограничные разложения

Похожие новости

Обобщение стохастического градиентного спуска в нейронных сетях

Neu-PiG: Быстрое восстановление 3D-объектов из облаков точек

Разработка программного обеспечения для подводных роботов и ещё 4 новости

Генерация изображений с Diffusers от Hugging Face и ещё 2 новости

Uniscale: Унифицированный Фреймворк Для 3D Реконструкции

Motif-2 победила GPT-5.1: 4 секрета обучения LLM