Публикация

DeepSeek DSpark: прорывной метод ускорения нейросетей с открытым кодом

DeepSeek совместно с Пекинским университетом представили DSpark — технологию спекулятивного декодирования, которая радикально увеличивает скорость работы моделей (инференса) без потери качества. ** Ключевые фишки: • Колоссальное ускорение: Пропускная способность DeepSeek V4 Flash и V4 Pro вырастает на 51–400% в зависимости от задачи. • Универсальность: Метод не ограничен экосистемой DeepSeek — он отлично работает с другими открытыми моделями, такими как Gemma и Qwen. • Эффективность: DSpark позволяет запускать тяжелые модели быстрее даже на потребительском железе (например, RTX 6000), превосходя существующие методы оптимизации. • Полная прозрачность: **Разработчики опубликовали научную статью, открыли исходный код и выложили готовые веса.

Это важное обновление для тех, кто развертывает LLM локально или в продакшене и хочет выжать максимум из доступных мощностей.

Исходный код

Модель на Hugging Face

Комментарии