Skip to content

Latest commit

 

History

History
27 lines (20 loc) · 2.17 KB

README.md

File metadata and controls

27 lines (20 loc) · 2.17 KB

Unsupervised_ML

Basic track on unsupervised ML in russian

Здесь лежит мини-курс про обучение без учителя.

Сейчас он состоит из 3 тетрадок:

  1. Понижение размерности и embedding-методы Перед прохождением нужно рассказать,
  • зачем нужно понижение размерности (предобработка перед обучением, визуализация, ужатие, etc.)
  • как работают линейные методы понидения размерности на пальцах [pca "ищет оси, вдоль которых данные меняются", TruncatedSVD "пытается ужать данные так, чтобы потом было можно разжать с минимальной ошибкой"].
  • что такое embedding и как он работает на примере MDS. Отличие tSNE от MDS "на пальцах" (пытается сохранить расстояние только до ближайших соседей)
  1. Базовая кластеризация и EM Перед прохождением нужно рассказать,
  • Что такое кластеризация и нафига она нужна
  • как работает Kmeans на пальцах (просто объяснить алгоритм).
  • Что такое правдоподобие и как работает EM на пальцах. (просьба упомянуть, что он может не только gaussian mixture)
  1. Лаба про анализ мозга "зеброрыбы" (Danio Rerio) Всё внутри. Задача - применить все полученные знания для кейса из биологии.

Расширения и дополнения

  • Какой-то скетч идей расширения есть тут #1
  • Если у вас есть идеи - милости просим в Issues
  • Если хотите законтрибутить - милости просим в Pull Requests