Перейти к содержанию

Навигация по ML-энциклопедии

~5 минут чтения

201 статья | 8 тематических разделов + мета


Порядок чтения

  1. Скорость прохождения -- быстрый прогон всех тем
  2. Математика -- математическая база
  3. Классический ML -- классический ML
  4. Глубокое обучение -- глубокое обучение
  5. LLM-инженерия -- LLM
  6. Системный дизайн -- ML System Design
  7. Шпаргалки -- шпаргалки перед интервью
  1. Скорость прохождения -- быстрый прогон всех тем
  2. Нужная секция подготовка-к-интервью.md -- глубокая подготовка
  3. Конкретная тема в подразделе -- если нужно разобрать детально
  4. Шпаргалки -- перед интервью

Структура разделов

01. Математика (9 файлов)

Файл Содержание
Подготовка к интервью Q&A по всей математике
Материалы Книги, курсы, ресурсы
Формулы: линал Определители, собственные значения, SVD
Формулы: матан Производные, интегралы, ряды
Формулы: теорвер Байес, распределения, ЦПТ
Формулы: статистика МНК, гипотезы, доверительные интервалы
Формулы: функции потерь MSE, cross-entropy, hinge, focal

02. Классический ML (10 файлов + 6 шпаргалок)

Файл Содержание
Подготовка к интервью Q&A по классическому ML
Материалы Книги, курсы, ресурсы
Шпаргалки:
Scikit-learn API, пайплайны, препроцессинг
Выбор модели Дерево выбора алгоритма
Гиперпараметры Grid/Random/Bayesian search
Метрики Precision, recall, F1, AUC, RMSE
Отладка Overfitting, data leakage, debugging
Интервью Быстрые ответы на типичные вопросы

:material-neural-network: 03. Глубокое обучение (7 файлов + 3 шпаргалки)

Файл Содержание
Подготовка к интервью Q&A по DL
Материалы Курсы, книги
NumPy Шпаргалка NumPy
Pandas Шпаргалка Pandas
PyTorch Шпаргалка PyTorch

04. LLM-инженерия (125 файлов) -- самый большой раздел

Подраздел Кол-во Ключевые темы
01. Архитектура 22 Attention, KV-кэш, RoPE, токенизация, SSM/Mamba, Vision
02. Инференс 14 Квантизация, спекулятивное декодирование, LoRA, деплой
03. Агенты 19 CoT, tool use, промпт-инженеринг, MCP, фреймворки
04. RAG 7 Hybrid search, чанкинг, Graph RAG, оценка
05. Безопасность 11 RLHF, red teaming, гардрейлы, OWASP
06. Бенчмарки 10 Оценка LLM, эмбеддинги, ML SD паттерны
07. Модели 6 Open-source LLM, MoE, диффузионные
08. LLMOps 6 Стоимость, маршрутизация, наблюдаемость
09. Спецтемы 9 NAS, синтетические данные, on-device ML
10. Ресурсы 7 Подготовка к интервью в компаниях
Синтез 10 Все шпаргалки

05. Системный дизайн (32 файла, 7 кейсов)

Кейс Полнота Файлы
Рекомендательная система Полный 6 файлов
Обнаружение мошенничества Полный 6 файлов
Ранжирование поиска Основной 4 файла
Ранжирование ленты Основной 3 файла
Предсказание кликов Основной 3 файла
Детекция спама Основной 3 файла
Модерация контента Основной 3 файла

06. MLOps и инфраструктура (6 файлов)

Файл Содержание
Подготовка MLOps Model Serving, CI/CD, Monitoring, Experiment Tracking
Материалы MLOps MLflow, W&B, Feature Stores, Cost Optimization
Подготовка Data Engineering Spark, Airflow, dbt, Lakehouse, Data Quality
Материалы Data Engineering Ресурсы по дата-инженерии
Подготовка AI агенты ReAct, Multi-Agent, Memory, Tool Use, MCP
Материалы AI агенты Ресурсы по AI-агентам

07. Python (5 файлов)

Файл Содержание
Подготовка к интервью GIL, generators, decorators, asyncio, memory
Особенности языка 13 Python-специфичных фич
Задачи лайвкодинг Задачи для лайвкодинга
Готчас и трики 19 gotchas и подводные камни
Источники Книги и ресурсы

08. Справочник (2 файла)

Файл Содержание
ML алгоритмы Regression, SVM, Trees, Boosting, KNN, K-Means, PCA, Metrics
Нейросети Activations, Loss, Backprop, Optimizers, CNN, RNN, Transformer

Мета (4 файла)

Файл Содержание
Скорость прохождения Быстрый прогон всех тем
Кросс-топик карта Связи между темами
Анализ пробелов Что ещё нужно дописать
Продакшен паттерны Паттерны из продакшена