Статьи о больших языковых моделях

LLM: архитектура, обучение, сравнение моделей GPT-4, Claude, Gemini, DeepSeek, Llama. Контекстные окна, файн-тюнинг, локальный запуск и RAG.

Search

Heli Verified

06.03.2026

LLM
Star 0,0
Views 120

Пять полезных декораторов python для оптимизации llm

Декораторы Python – это мощный инструмент для модификации и расширения функциональности функций или методов, не изменяя их непосредственно. В контексте приложений LLM (Large Language Models – большие языковые модели) они …

Heli Verified

03.03.2026

LLM
Star 0,0
Views 114

Новые исследования в области мультимодальных llm и инженерии данных

FewMMBench: Бенчмарк для мультимодального обучения в условиях малого количества данных

FewMMBench – это комплексный бенчмарк, разработанный для оценки возможностей мультимодальных больших языковых моделей (MLLM) при обучении с использованием небольшого количества …

Heli Verified

03.03.2026

LLM
Star 0,0
Views 92

dlт-corpus и medsyn: новые бенчмарки для llm

Представлен DLT-Corpus, крупнейший на сегодняшний день специализированный текстовый корпус для исследований в области технологии распределенного реестра (DLT), содержащий 2,98 миллиарда токенов из 22,12 миллиона документов, включающих научную литературу (37 440 …

Heli Verified

03.03.2026

LLM
Star 0,0
Views 81

chatgpt как терапевт: этические риски и опасные советы

Новое исследование выявило серьезные этические риски, связанные с использованием ChatGPT в качестве терапевта. Исследование, опубликованное в журнале «Journal of Medical Internet Research», показало, что ChatGPT склонен к предоставлению советов, которые …

Heli Verified

02.03.2026

LLM
Star 0,0
Views 94

scaling in, not up? testing thick citation context analysis with gpt-5

Scaling In, Not Up? Testing Thick Citation Context Analysis with GPT-5 and Fragile Prompts

25 февраля 2026 года была опубликована работа, которая тестирует, могут ли большие языковые модели (LLM) поддерживать …

Heli Verified

02.03.2026

LLM
Star 0,0
Views 89

Инженерия данных для больших языковых моделей (llm)

Инженерия данных для эпохи больших языковых моделей (LLM) претерпевает значительные изменения. Традиционные подходы к обработке данных, такие как ETL (извлечение, преобразование, загрузка), больше не всегда достаточны для работы с данными, …

Heli Verified

02.03.2026

LLM
Star 0,0
Views 117

recent advances in ai research: iha, ttt & squint

Interleaved Head Attention

Multi-Head Attention (MHA) является основной вычислительной операцией, лежащей в основе современных больших языковых моделей (LLM). Однако MHA страдает от фундаментального ограничения линейного масштабирования: $H$ attention heads производят …

Heli Verified

02.03.2026

LLM
Star 0,0
Views 80

VecGlypher: генерация векторных глифов из текстовых описаний

VecGlypher — это новая модель, объединяющая генерацию векторной графики и языковые модели. Она позволяет создавать глифы (визуальные представления символов) на основе текстовых описаний. Модель способна генерировать разнообразные стили глифов, используя …

Статьи о больших языковых моделях

Большие языковые модели (LLM) — основа современного ИИ. На этой странице собраны материалы об архитектуре трансформеров, принципах предобучения и дообучения, токенизации и управлении контекстным окном.

Разбираем, чем отличаются ведущие модели: GPT-4o, Claude 3.5, Gemini 1.5 Pro, DeepSeek V3, Llama 3, Qwen и другие. Какую выбрать для конкретной задачи, как учитывать стоимость вывода, скорость генерации и точность.

Отдельные разделы посвящены файн-тюнингу (LoRA, QLoRA, SFT), работе с векторными базами данных в связке с LLM, локальному запуску моделей через Ollama и LM Studio, а также безопасности: ограничениям RLHF, джейлбрейкам и alignment-проблемам.

Для разработчиков — материалы по интеграции LLM через API OpenAI, Anthropic, Google, по оценке качества ответов (evals), оптимизации промптов и снижению латентности. Для исследователей — обзоры ключевых статей и бенчмарков: MMLU, HumanEval, LMSYS Chatbot Arena.

Следите за публикациями, чтобы не пропустить выход новых моделей и результаты сравнительных тестов.