Машинско учење у пракси - курс 41.500 руб. из ИБС Тренинг центра, обука 24 сата, датум 26.11.2023.
мисцеланеа / / December 02, 2023
Курс је изграђен око неколико практичних случајева који садрже табеле са почетним подацима.
За сваки случај пролазимо кроз цео животни циклус пројекта машинског учења:
истраживање, чишћење и припрема података,
одабир методе обуке која одговара задатку (линеарна регресија за регресију, случајна шума за класификацију, К-средње вредности и ДБСЦАН за груписање),
обуку по изабраној методи,
евалуација резултата,
оптимизација модела,
представљање резултата купцу.
Током дискусионог дела курса, разматрамо практичне проблеме са којима се студенти суочавају, а који се могу решити коришћењем метода о којима се расправља.
Теме које се обрађују:
1. Преглед задатка (теорија – 1 сат)
Које проблеме машинско учење добро решава и које проблеме покушавају да реше?
Шта се дешава ако, уместо Дата Сциентист-а, унајмите не-специјалисту у тој области (само програмера/аналитичара/менаџера) са очекивањем да ће они научити у том процесу.
2. Припрема, чишћење, истраживање података (теорија – 1 сат, пракса – 1 сат)
Како разумети изворне пословне податке (и генерално открити било који ред у њима).
Редослед обраде.
Шта може и треба да се делегира аналитичарима домена, а шта најбоље уради сам Дата Сциентист.
Приоритети за решавање конкретног проблема.
3. Класификатори и регресори (теорија – 2 часа, пракса – 2 часа)
Практични део – добро формализовани задаци са припремљеним подацима.
Разлика између задатака (бинарна/небинарна/вероватна класификација, регресија), прерасподела задатака између класа.
Примери класификације практичних задатака.
4. Груписање (теорија – 1 сат, пракса – 2 сата)
Где и како извршити груписање: истраживање података, провера исказа проблема, провера резултата.
Који случајеви се могу свести на груписање.
5. Евалуација модела (теорија – 1 сат, пракса – 1 сат)
Пословна метрика и техничка метрика.
Метрика за проблеме класификације и регресије, матрица грешака.
Интерне и екстерне метрике квалитета кластерисања.
Унакрсна провера.
Процена преквалификације.
6. Оптимизација (теорија – 5 сати, пракса – 3 сата)
Шта чини један модел бољим од другог: параметри, карактеристике, ансамбли.
Управљање подешавањима.
Пракса избора карактеристика.
Преглед алата за проналажење најбољих параметара, карактеристика и метода.
7. Графикони, извештаји, рад са задацима уживо (теорија – 2 сата, пракса – 2 сата)
Како јасно објаснити шта се дешава: себи, тиму, клијенту.
Лепши одговори на бесмислена питања.
Како представити три терабајта резултата на једном слајду.
Полуаутоматски тестови, које су контролне тачке процеса заиста потребне.
Од задатака уживо до пуног процеса истраживања и развоја („Р&Д у пракси“) - анализа и анализа задатака из публике.