Машинное обучение
Систематический анализ алгоритмов, позволяющих программам улучшать результат без явного перепрограммирования
Типология алгоритмов
Сравнительный анализ двух фундаментальных парадигм обучения
| Параметр | Обучение с учителем | Обучение без учителя |
|---|---|---|
| Входные данные | Размеченные (labeled) пары «вход—выход» | Неразмеченные массивы данных |
| Цель | Построение функции отображения X → Y | Обнаружение скрытых структур и паттернов |
| Типичные задачи | Классификация, регрессия, детекция | Кластеризация, снижение размерности, ассоциации |
| Алгоритмы | Линейная регрессия, SVM, Random Forest, нейросети | K-Means, DBSCAN, PCA, автоэнкодеры |
| Метрики качества | Accuracy, F1, RMSE, AUC-ROC | Silhouette score, DB-index, inertia |
| Стоимость разметки | Высокая — требуется экспертная аннотация | Минимальная — работа с сырыми данными |
| Пример из РК | Диагностика заболеваний по медснимкам (Алматы) | Сегментация потребителей энергоресурсов (Астана) |
Математика прогноза
Ключевые концепции регрессии и классификации
Лабораторный отчёт
Кейсы применения ML в медицине и экологии Казахстана
Тренды ML в 2026 году
Foundation Models
Фундаментальные модели — предобученные на гигантских корпусах данных архитектуры, адаптируемые к конкретным задачам через fine-tuning или prompt engineering. GPT-класс моделей продемонстрировал способность к zero-shot обобщению, ставя под вопрос традиционное деление на отдельные ML-задачи. Для Казахстана актуальна адаптация подобных моделей к казахскому и русскому языковым корпусам.
Federated Learning
Федеративное обучение позволяет тренировать модели на распределённых данных без их централизации. Каждый узел обучает локальную копию модели и передаёт серверу только обновления градиентов. Подход критически важен для медицинских и финансовых данных, где централизованное хранение нарушает законодательство о персональных данных РК (Закон №94-V от 2013 года).