МЛОпс - стопа 80.000 руб. из Отуса, обука 5 месеци, датум 30.11.2023.
мисцеланеа / / November 30, 2023
Савладаћете све неопходне вештине машинског учења за стриминг података и дистрибуирана окружења. Програм обухвата неопходна знања из области Дата Сциенце и Дата Енгинееринг, која ће вам омогућити да обрађујете велике податке и пишете дистрибуиране алгоритме у Спарк-у.
Сваки модул ћете вежбати тако што ћете испунити домаћи задатак. На крају обуке имаћете завршни пројекат који ће вам омогућити да сумирате сва стечена знања и додате у свој портфолио. Може да се уради као део радних задатака на вашем скупу података или да буде пројекат учења заснован на подацима које обезбеђује ОТУС.
За кога је овај курс?
За стручњаке за машинско учење или софтверске инжењере који желе да науче како да раде са великим подацима. Типично, такви задаци постоје у великим ИТ компанијама са великим дигиталним производом.
За научнике који желе да ојачају своје вештине инжењерским вештинама. Захваљујући курсу моћи ћете да обрађујете податке и самостално приказујете резултате МЛ решења у производњи.
Да бисте научили, биће вам потребне основне вештине науке о подацима. Предлажемо да погледате Мапу курсева науке о подацима на ОТУС-у да бисте сазнали потребан ниво обуке.
Научићеш:
- Користите стандардне алате за МЛ пипелине у дистрибуираном окружењу;
- Развијте сопствене блокове за МЛ пипелинес;
- Прилагодите МЛ алгоритме дистрибуираним окружењима и алатима за велике податке;
- Користите Спарк, СпаркМЛ, Спарк Стреаминг;
- Развити алгоритме за припрему стриминг података за машинско учење;
- Обезбедити контролу квалитета у свим фазама покретања МЛ решења у индустријски рад.
Потражња за специјалистима
Вештине које ћете савладати су што је могуће више примењене и обећавајуће. На тржишту се појављује све више дигиталних производа, чији развој захтева рад са великим подацима и стреам обраду. Већ сада стручњаци са таквим вештинама и неким радним искуством могу да се квалификују за плату од 270 хиљада. рубља Други тренд - аутоматизација процеса обуке и валидације, напротив, на неки начин обезвређује рад класичног Дата Сциентист-а. Све се креће ка тачки где чак и неспецијалиста може да предвиди стање. Стога су они који имају барем површне инжењерске вештине већ на врхунцу.
Карактеристике курса
Пуно праксе у раду са подацима
Широк спектар вештина од дистрибуираног МЛ и стреам обраде података до производног излаза
Актуелни алати и технологије: Сцала, Спарк, Питхон, Доцкер
Комуникација уживо са стручњацима путем вебинара и Слацк ћаскања
4
наравноАнгажован у развоју тима за науку података који обезбеђује функционалност засновану на машинском учењу за производе и услуге компаније. Као Дата Сциентист, учествовао је у развоју Касперски МЛАД и МДР АИ Аналист. У...
Ангажован у развоју тима за науку података који обезбеђује функционалност засновану на машинском учењу за производе и услуге компаније. Као Дата Сциентист, учествовао је у развоју Касперски МЛАД и МДР АИ Аналист. Као Ц++ програмер, учествовао је у креирању МакПатрол СИЕМ-а.Већ годинама предаје рачунарство. научних дисциплина на МСТУ ГА Аутор серије извештаја о МЛ, Ц++, ДС управљању и развоју пројеката тимовима. Члан ПЦ конференције Ц++ Русија. Програм менаџер
8
курсеви20+ година искуства у прилагођеним развојним пројектима у ИТ. Десетине успешних пројеката, укључујући и оне под државним уговорима. Искуство у развоју и имплементацији ЕРП система, опен-соурце решења, подршка апликацијама са великим оптерећењем. Предавач курсева о...
20+ година искуства у прилагођеним развојним пројектима у ИТ. Десетине успешних пројеката, укључујући и оне под државним уговорима. Искуство у развоју и имплементацији ЕРП система, опен-соурце решења, подршка апликацијама са великим оптерећењем. Предавач курсева Линук, Кубер, МЛОпс, ДатаОпс, СолутионАрцхитецт, ИаЦ, СРЕ, као и ментор ХигхЛоад курса
1
доброСпецијалиста за рад са великим подацима и машинско учење. 8 година је радио у Одноклассники.ру. Управљао тимом ОК Дата Лаб (лабораторија за истраживаче у области великих података и машина...
Специјалиста за рад са великим подацима и машинско учење. 8 година је радио у Одноклассники.ру. Управљао тимом ОК Дата Лаб (лабораторија за истраживаче у области великих података и машинског учења). Анализа великих података у Одноклассники је постала јединствена шанса за комбиновање теоријске обуке и научне основе са развојем стварних, тражених производа. Од 2019. године ради у Сбербанци као генерални директор. Делује као лидер кластера за развој платформе за системе препорука у дивизији масовне персонализације. Дипломирао је на Државном универзитету у Санкт Петербургу 2004. године, где је одбранио докторат из формално-логичких метода 2007. године. Радио сам у оутсоурцингу скоро 9 година не губећи контакт са универзитетом и научним окружењем.
Основни увод у почетак курса
-Тема 1.Градијентни спуст и линеарни модели
-Тема 2.Преглед основних метода машинског учења и метрике
-Тема 3.Еволуција приступа раду са подацима
-Тема 4.Основе програмирања у Сцали
Технолошке основе дистрибуиране обраде података
-Тема 5. Дистрибуирани системи датотека
-Тема 6. Менаџери ресурса у дистрибуираним системима
-Тема 7. Еволуција масивно паралелних и дистрибуираних рачунарских оквира
-Тема 8. Основе Апацхе Спарк 1
-Тема 9. Основе Апацхе Спарк 2
Дистрибутед МЛ Басицс
-Тема 10. Пренос МЛ алгоритама у дистрибуирано окружење
-Тема 11.МЛ у Апацхе Спарк
-Тема 12.Развијање сопствених блокова за СпаркМЛ
-Тема 13.Оптимизација хиперпараметара и АутоМЛ
Стреам обрада
-Тема 14. Обрада података тока
-Тема 15. Библиотеке треће стране за коришћење са Спарк-ом
-Тема 16. Спарк Стреаминг
-Тема 17. Структурирано и континуирано стримовање у Спарку
-Тема 18.Алтернативни стреаминг оквири
Постављање циљева и анализа резултата
-Тема 19. Одређивање циља МЛ пројекта и прелиминарне анализе
-Тема 20. Дугорочни МЛ циљеви на примеру задатка смањења одлива
-Тема 21.А/Б тестирање
-Тема 22.Додатне теме
Излаз МЛ резултата у производњу
-Тема 23. Приступи увођењу МЛ решења у производњу
-Тема 24. Версионирање, репродуктивност и праћење
-Тема 25.Онлајн сервирање модела
-Тема 26. Обрасци за асинхрони стриминг МЛ и ЕТЛ
-Тема 27. Ако вам треба Питхон
МЛ у Питхон-у у производњи
-Тема 28.Производни код у Пајтону. Кодекс организације и паковања
-Тема 29. РЕСТ архитектура: Фласк АПИ
-Тема 30.Доцкер: Структура, примена, имплементација
-Тема 31.Кубернетес, оркестрација контејнера
-Тема 32.МЛОПС алати за Кубернетес: КубеФлов, Селдон Цоре. Особине рада хетерогених система у индустрији.
-Тема 33.Амазон Сагемакер
-Тема 34.АВС МЛ Сервице
Напредне теме
-Тема 35. Неуронске мреже
-Тема 36. Дистрибуирано учење и закључивање неуронских мрежа
-Тема 37.Појачавање градијента на дрвећу
-Тема 38. Учење са поткрепљењем
Пројектни рад
-Тема 39. Избор теме и организација рада на пројекту
-Тема 40. Консултације о пројектима и домаћим задацима
-Тема 41.Заштита пројектантских радова