Курс „Аналитичар података“ - курс 96.000 руб. из Иандек радионице, обука 7 месеци, датум 7. децембар 2023.
мисцеланеа / / December 02, 2023
Аналитичар података извлачи значење из бројева и вредности: он види трендове, предвиђа догађаје и помаже компанији да разуме купце, оптимизује процесе и расте.
Тржишту су потребни стручњаци који могу корисно да користе податке. Студија кадровске компаније Анцор за септембар 2022. године показала је да 45% руских компанија тражи аналитичаре да се придруже њиховом тиму.
Вештине које ћете научити на курсу
Звање
Аналитичар, аналитичар података, аналитичар података
Могућности за развој: Аналитичар производа, аналитичар маркетинга, БИ аналитичар, специјалиста за науку о подацима
Ево технологија и алата које ћете користити:
Питхон
Јупитер Нотебоок
СКЛ
ПостгреСКЛ
Таблеау
А/Б тестови
Почните да зарађујете анализирајући
Почећете са јуниорске позиције, а онда само напред. Попећете се на лествици каријере и расти у вредности. И једног дана за тебе неће бити цене.
Завршите програм курса за аналитику података
Редовно га ажурирамо како бисмо осигурали да испуњава потребе индустрије и послодаваца.
Другим речима, научите само оно што ће вам свакако користити у раду.
Бесплатан део - 1 недеља
Бесплатан увод: Основе Питхон-а и анализе података
Научите основне концепте анализе података и разумете шта раде аналитичари података и научници података.
• Мосцов Цатнамицс. Приказ података на екрану. ЦСВ датотеке. Рад са табелама. Топлотне карте. Множење колоне целим бројем.
• Грешке у коду. Синтаксне грешке. Грешке у именовању. Грешке приликом дељења са нулом. Грешке при увозу модула.
• Променљиве и типови података. Променљиве. Типови података. Аритметичке операције са бројевима и низовима.
• Како поставити хипотезе. Хипотезе. ХАДИ циклуси. Аналитичко размишљање. Читање графикона.
• Шта раде научници података. Задаци аналитичара. Појашњење задатака. Декомпозиција. Фазе пројекта.
• Провера конверзија. Конверзија. Истраживање података. Формирање закључака.
• Повраћај рекламних кампања. Колона графикон. Разлика елемената. Индексирање у колонама.
• Машинско учење и наука о подацима. Обука у машинском учењу. Проналажење јединствених вредности у колонама. Логичко индексирање. Груписање вредности у табели. Грешке предвиђања.
• Коначни пројекат. Сегментација корисника.
ПитхонПандасЕррорсСеаборнХипотхесесЦонверсионВариаблесТипови податакаХеатмапс
1 спринт 3 недеље
Основни Питхон
Зароните дубље у програмски језик Питхон и Пандас библиотеку.
• Променљиве и типови података. Питхон језик. Променљиве. Приказ података на екрану. Приказивање објеката на екрану. Руковање грешком, покушајте...осим оператора. Типови података. Конверзије типа података.
• Линије. Индекси у редовима. Линијски резови. Операције на низовима. Стринг методе. Форматирање стрингова, формат() метода, ф-стрингови.
• Листе. Индекси у листама. Наведите кришке. Додавање ставки на листу. Уклањање ставки листе. Сабирање и множење листа. • Листе за сортирање. Потражите ставке на листи. Раздвајање стринга у листу стрингова, спајање листе стрингова у стринг.
• За петљу. Циклуси. Набрајање елемената. Итерација преко индекса елемената. Обрада елемената листе помоћу петљи: проналажење збира и производа елемената.
• Угнежђене листе. Петља кроз угнежђене листе са вредностима за бројање. Додавање елемената у угнежђене листе. Сортирање угнежђених листа.
• Условни оператор. Док петља. Боолеан тип података. Булове вредности. Логички изрази. Сложени логички изрази. Условни исказ иф...елиф...елсе. Гранање. Филтрирање листа коришћењем условног оператора. Док петља.
• Функције. Додела функција. Параметри и аргументи. Параметри са подразумеваним вредностима. Позициони и именовани аргументи. Враћање резултата из функције.
• Речници. Кључеви и вредности. Тражење вредности по кључу. Додавање ставки у речник. Списак речника. Предиван излаз речника.
• Панда библиотека. Читање цсв датотека. Оквир података. Конструктор оквира података. Штампање првог и последњег реда оквира података. Индексирање у оквирима података. Индексирање на колонама серије.
• Предобрада података. ГИГО принцип. Преименовање колона оквира података. Руковање недостајућим вредностима. Руковање експлицитним и имплицитним дупликатима.
• Анализа података и презентација резултата. Груписање података. Сортирање података. Основе дескриптивне статистике.
• Јупитер Нотебоок - свеска у ћелији. Интерфејс Јупитер Нотебоок-а. Пречице за Јупитер Нотебоок.
ПетљеПитхонПандасСтрингсЛистсФунцтионсРечнициДатаФрамеВариаблесДатаТипесЦондитионал Статемент
Пројекат
Упоредите податке корисника Иандек Мусиц по граду и дану у недељи.
2 спринта 2 недеље
Предобрада података
Научите да очистите податке од одступања, изостављања и дупликата, као и да конвертујете различите формате података.
• Рад са пропусницама. Конверзија. Колачићи. Категоричке и квантитативне варијабле. Руковање празнинама у категоричким варијаблама. Руковање празнинама у квантитативним варијаблама. Руковање празнинама у квантитативним варијаблама по категоријама.
• Промена типова података. Читање Екцел датотека. Претворите серију у нумерички тип. Број модула, абс() метода. Рад са датумом и временом. Руковање грешком, покушајте...осим оператора. Спајање оквира података, метод мерге(). Пивот табле.
• Потражите дупликате. Потражите дупликате, разликују велика и мала слова.
• Категоризација података. Декомпозиција табела. Категоризација по нумеричким опсезима. Категоризуј на основу више вредности по реду.
• Систематично и критичко мишљење у раду аналитичара. Системско размишљање. Узроци грешака у подацима. Критичко мишљење.
ПитхонПандасГап руковање Обрада података Дупликат обрадаКатегоризација података
Пројекат
Анализирати податке о клијентима банке и утврдити удео кредитно способних.
3 спринта 2 недеље
Истраживачка анализа података
Научите основе вероватноће и статистике. Користите их да истражите основна својства података, тражећи обрасце, дистрибуције и аномалије. Упознајте библиотеку Матплотлиб. Цртајте дијаграме и вежбајте анализу графикона.
• Први графикони и закључци. Коришћење заокретних табела. Дијаграм. Дистрибуције. Дијаграм домета.
• Проучавање пресека података. Метода куери(). Рад са датумом и временом. Исцртавање графикона коришћењем методе плот(). Окамова бритва.
• Рад са више извора података. Исечак података заснован на спољним објектима. Додавање нових колона у оквир података. Додавање података из других оквира података. Преименовање колона. Комбиновање табела коришћењем метода мерге() и јоин().
• Односи података. Дијаграм расејања. Корелација варијабли. Матрица дијаграма расејања.
• Валидација резултата. Консолидација група. Подела података у групе.
ПитхонПандасМатплотлибХистограми Исечци података Анализа података Расипана дијаграма Диплома распршености Визуелизација података Описна статистика
Пројекат
Истражите архиву огласа за продају некретнина у Санкт Петербургу и Лењинградској области.
4 спринта 3 недеље
Статистичка анализа података
Научите да анализирате односе у подацима користећи статистичке методе. Научите шта су статистички значај и хипотезе.
• Комбинаторика. Комбинације. Правило множења. Преуређења. Број пермутација. Плацементс. Број пласмана. Комбинације. Број комбинација.
• Теорија вероватноће. Експеримент. Простор вероватноће. Догађаји. Вероватноћа. Догађаји који се укрштају и међусобно се искључују. Ојлер-Венов дијаграм. Закон великих бројева.
• Дескриптивна статистика. Категоричке и квантитативне варијабле. Мод и медијана. Просечна вредност. Дисперзија. Стандардна девијација. Квартили и перцентили. Дијаграм домета. Колона графикон. Густина фреквенције. Дијаграм.
• Случајне променљиве. Дискретна случајна променљива. Дистрибуција вероватноће за дискретну случајну променљиву. Кумулативна функција (функција дистрибуције) дискретне случајне променљиве. Математичко очекивање дискретне случајне променљиве. Дисперзија дискретне случајне променљиве.
• Дистрибуције. Бернулијев експеримент. Биномни експеримент. Биномна дистрибуција. Континуирана равномерна дистрибуција. Нормална расподела. Стандардна нормална дистрибуција. ЦДФ и ППФ за нормалну дистрибуцију. Поиссонова дистрибуција. Апроксимација једне дистрибуције другом.
• Тестирање хипотеза. Општа популација. Узорак. Дистрибуција узорковања. Централна гранична теорема. Једностране и двостране хипотезе. П-вредност. Тестирање једностраних и двостраних хипотеза за један узорак. Тестирање хипотезе о једнакости средњих вредности две опште популације. Тестирање хипотезе једнакости средњих вредности за зависне узорке.
СципиНумпиПитхонПандасМатплотлибЦомбинаторицсДистрибутионс Тестирање хипотеза Теорија вероватноће
Пројекат
Тестирајте хипотезе о услугама изнајмљивања скутера да бисте помогли у развоју вашег пословања.
Ектра Спринт
Теорија вероватноће
Запамтите или препознајте основне појмове у теорији вероватноће: независни, супротни, неспојиви догађаји итд. Користећи једноставне примере и забавне задатке, вежбаћете рад са бројевима и изградњу логике решења.
Ово је опциони спринт. То значи да сваки ученик сам бира једну од опција:
• Савладајте додатни спринт од 10 кратких лекција, обновите теорију и решите проблеме.
• Отворите само блок са задацима интервјуа, присетите се праксе без теорије.
• Прескочите курс у потпуности или се вратите на њега када буде времена и потребе.
ПитхонЕвентсПробабилитиБаиес-ова теорема Случајне варијабле Теорија вероватноће Статистичка анализа података
5 спринта 1 недеља
Завршни пројекат првог модула
Научите како да спроведете прелиминарна истраживања података и да формулишете и тестирате хипотезе.
СципиНумпиПитхонПандасМатплотлиб Анализа података Тестирање хипотезе Обрада података
Пројекат
Пронађите обрасце у подацима о продаји игара.
6 спринт 2 недеље
Басиц СКЛ
Научите основе структурираног језика упита СКЛ и релационе алгебре за рад са базама података. Упознајте се са карактеристикама рада у ПостгреСКЛ-у, популарном систему за управљање базама података (ДБМС). Научите да пишете упите различитог нивоа сложености и преведете пословне проблеме у СКЛ. Радићете са базом података онлајн продавнице која је специјализована за филмове и музику.
• Увод у базе података. Системи за управљање базама података (ДБМС). СКЛ језик. СКЛ упити. Форматирање СКЛ упита.
• Исечци података у СКЛ-у. Типови података у ПостгреСКЛ-у. Конверзија типа података. Где клаузула. Логички оператори. Исечци података. Оператори У, КАО, ИЗМЕЂУ. Рад са датумом и временом. Руковање недостајућим вредностима. Условна конструкција ЦАСЕ.
• Функције агрегације. Груписање и сортирање података. Математичке операције. Функције агрегације. Груписање података. Сортирање података. Филтрирање према збирним подацима, ХАВИНГ оператор.
• Односи између табела. Врсте спојева табела. ЕР дијаграми. Преименовање поља и табела. Алиасес. Спајање табела. Врсте спојева: УНУТРАШЊИ СПОЈ, ЛЕВИ СПОЈ, ДЕСНИ ПРИКЉУЧАК, ПУНИ СПОЉНИ СПОЈ. Алтернативни типови синдиката УНИОН и УНИОН АЛЛ.
• Потупити и уобичајени табеларни изрази. Подупити. Потупити у ФРОМ. Потупити у ВХЕРЕ. Комбинација спајања и подупита. Заједнички табеларни изрази (ЦТЕ). Варијабилност захтева.
СКЛДБМСПостгреСКЛСубкуериесДатабасесСКЛ упитиФилтрирање података Сортирање податакаГрупирање података Придруживање табела Уобичајени изрази табеле
Пројекат
Написаћете серију упита различите сложености у базу података која чува податке о инвеститорима, стартапима и улагањима у њих.
7 спринт 3 недеље
Анализа показатеља пословања
Сазнајте који су показатељи у пословању. Научите да користите алате за анализу података у пословању: кохортна анализа, продајни ток и економија јединица.
• метрике и токови. Конверзија. Токови. Маркетинг левак. Утисци. Кликови. ЦТР. Лијевак производа.
• Кохортна анализа. Профил корисника. стопа задржавања. Стопа одлива. Хоризонт анализе. Визуелизација кохортне анализе. Анализа задржавања насумичних кохорти. Конверзија у кохортној анализи. Израчунавање метрике у Питхон-у.
• Јединична економија. Метрика ЛТВ, ЦАЦ, РОИ. АРПУ, АРППУ. Израчунавање метрике у Питхон-у. Напредна визуелизација метрике. Шери параметар. Покретни просек.
• Прилагођене метрике. Процена активности корисника. Корисничка сесија. Истрага аномалија.
МетрицсФуннелсЦонверсионЕкономија јединицеКохортна анализаМетрија производаМаркетинг метрицс
Пројекат
На основу података разумете понашање корисника, као и анализирајте профитабилност купаца и повраћај улагања од рекламирања да бисте дали препоруке за маркетинг одељење.
8 спринт 2 недеље
Адванцед СКЛ
Проћи ћете додатни курс о раду са базама података и постати још ближи послу. Користећи СКЛ језик, анализираћете израчунавање главних пословних метрика са којима сте се упознали у спринту „Анализа пословних индикатора“. Размислите о раду са сложеним алатом као што су функције прозора. Научите да мењате садржај база података локално, без симулатора, користећи посебне клијентске програме и библиотеке за Питхон.
• Израчунавање показатеља пословања. Шема података. Конверзија. ЛТВ. АРПУ. АРППУ. РОИ. Обрачун помоћу СКЛ-а.
• Агрегирање функција прозора. ОВЕР израз. ПАРТИЦИЈА БИ параметар прозора.
• Функције рангирања прозора. Функције рангирања. Прозор ОРДЕР БИ оператор. РОВ_НУМБЕР(). РАНК(). ДЕНСЕ_РАНК(). НТИЛЕ(). Оператори прозора заједно са функцијама рангирања.
• Функције померања прозора. Кумулативне вредности. Оффсет функције. ЛЕАД(). ЛАГ(). Функције прозора и алиаси.
• Кохортна анализа. Стопа задржавања, стопа одлива. ЛТВ.
• Инсталација и конфигурација базе података и клијента базе података. Клијент базе података. Инсталирање ПостгреСКЛ-а. Инсталирање ДБеавер-а. ДБеавер интерфејс. Креирање базе података. Примена депоније базе података. Отпремање резултата упита. Презентација резултата упита.
СКЛДБМСМетрицсПостгреСКЛДбазе податакаСКЛ упитиФункције прозора Анализа кохорте
Пројекат
Користећи Питхон и СКЛ, повежите се са базом података, израчунајте и визуализујте кључне метрике у систему услуге питања и одговора за програмирање.
9 спринт 2 недеље
Доношење одлука у пословању
Научићете шта је А/Б тестирање и разумећете у којим случајевима се користи. Научите да дизајнирате А/Б тестирање и процените његове резултате.
• Основе тестирања хипотеза у пословању. Водећи показатељи. Основе експеримената. Генерисање хипотеза. Одређивање приоритета метрике. Избор методе за извођење експеримента. Квалитативне методе за проверу хипотеза. Квантитативне методе за проверу хипотеза. Предности и мане А/Б тестова.
• Одређивање приоритета хипотеза. РИЦЕ оквир. Параметар досега. Параметар утицаја. Параметар поверења. Параметар напора.
• Припрема за спровођење А/Б теста. А/А тест. Грешке И и ИИ типа. Снага статистичког теста. Значај статистичког теста. Вишеструка поређења, методе за смањење вероватноће грешке. Израчунавање величине узорка и трајања А/Б теста. Графичка анализа метрике.
• Анализа резултата А/Б тестова. Тестирање хипотезе о једнакости удела. Схапиро-Вилк тест за тестирање нормалности података. Непараметријски статистички тестови. Манн-Вхитнеи тест. Стабилност кумулативних метрика. Анализа одступања и рафала.
• Алгоритми понашања. Чињенице, емоције, процене. Објасните своје гледиште.
А/Б тестирање Приоритет хипотеза Припрема за А/Б тестирање Анализа резултата А/Б тестирања Анализа резултата А/Б тестирања
Пројекат
Анализирајте резултате А/Б тестирања у великој онлајн продавници.
10 спринта 1 недеља
Завршни пројекат другог модула
Научите да тестирате статистичке хипотезе користећи А/Б тестирање и припремите закључке и препоруке у формату аналитичког извештаја.
Продајни ток А/Б тестирање Обрада података Анализа података истраживања
Пројекат
Истражите ток продаје и анализирајте резултате А/Б тестирања у мобилној апликацији.
11 спринт 2 недеље
Како испричати причу са подацима
Научићете како да правилно представите резултате свог истраживања користећи графиконе, најважније бројке и њихову тачну интерпретацију. Упознајте Сеаборн и Плотли библиотеке.
• Коме, како, шта и зашто рећи. Представљање резултата истраживања. Циљна публика наратора. Шта и зашто рећи аналитичару података.
• Сеаборн библиотека. Сеаборн библиотека као проширење Матплотлиб библиотеке. јоинтплот() метода. Опсег боја. Стилови графикона. Визуелизација дистрибуција.
• Библиотека парцела. Интерактивни графикони. Линијски графикон. Колона графикон. Пие цхарт. Графикон тока.
• Визуелизација података у геоаналитици. Геоаналитика. Либрари Фолиум. Приказ карте. Постављање маркера са одређеним координатама. Креирање кластера тачака. Прилагођене иконе за маркере. Хороплет.
• Припрема презентације. Закључци на основу студије. Сезонство и спољни фактори. Апсолутне и релативне вредности. Симпсонов парадокс. Принципи конструисања презентација. Извештаји у Јупитер Нотебоок-у.
ПлотлиФолиумСеаборнМатплотлибПресентатионГеоаналитика Визуелизација података
Пројекат
Припремите студију тржишта на основу отворених података о јавним угоститељским објектима у Москви, визуелизујте добијене податке.
12 спринт 2 недеље
Израда контролних табли у Таблеау-у
У овом спринту ћете радити са Таблеау БИ системом. Научите да се повежете са подацима и измените их, направите различите типове графикона, саставите контролне табле и презентације.
• Основе рада са Таблеауом. БИ системи. Таблеау. Креирање документа. Чување документа. Објављивање документа.
• Рад са изворима података. Извори података. Спајање података. Метода односа. Метод придруживања. Бленд метход. Метода синдиката. Промена формата табеле.
• Типови података. Основни типови података. Меасурементс. Мере. Рад са датумом и временом. Сетови. Групе. Опције. Промена формата променљивих. Променљиве имена мере, вредности мере, број.
• Табеле и прорачуни. Интерфејс за уређивање листова. Пивот табле. Израчуната поља. ЛОД изрази.
• Филтери и сортирање. Мере сортирања. Димензије сортирања. Угнежђене сорте. Сортирање помоћу параметра. Филтери.
• Визуелизације. Контроле визуелизације. Топлотне карте. Кришка. Колона графикони. Хистограми. Дијаграми домета. Сцаттер дијаграм. Линијски графикони. Комбиновани графови. Графикони подручја.
• Специјалне визуализације и описи алата. Картице. Мапа карактера. Буббле цхарт. Мапа дрвета. Дијаграми приказа круга. Буллет дијаграми. Гантови графикони. Имена мера и вредности мере у визуелизацијама. Обрнути инжењеринг. Описи алатки. Објашњења са визуелизацијама. Вредности прага на графиконима. Аналитички алати у Цустом.
• Презентације. Додатне опције. Проучавање типичних параметара. Креирање презентације.
• Контролне табле. Учитавање и припрема података. Припрема визуелизације. Монтажа контролне табле. Акције. Демонстрација контролне табле. Објављивање контролне табле.
ТаблеауДасхбоардсБИ-алатиБИ-алатиВизуелизација података
Пројекат
Истражите историју ТЕД конференција и направите контролну таблу у Таблеау-у на основу добијених података.
Ектра Спринт
Основе машинског учења
Упознајте се са основама машинског учења и сазнајте о главним задацима машинског учења у пословању.
ПитхонПандасСклеарнМашинско учењеЗадаци машинског учења Алгоритми машинског учења
Ектра Спринт
Вежбајте Питхон
Похађаћете неколико лабораторијских часова са додатним задацима из програмског језика Питхон. Такође ћете научити како да извучете податке из веб ресурса.
Хоћеш:
• у структури ХТМЛ страница и раду ГЕТ захтева,
• научи да пише једноставне регуларне изразе,
• упознајте АПИ и ЈСОН,
• упутите неколико захтева сајтовима и прикупите податке.
ЈСОНПитхонРЕСТ АПИ Веб сцрапинг
13 спринт 3 недеље
Дипломски рад
У последњем пројекту потврдите да сте савладали нову професију. Појасните задатак купца и прођите кроз све фазе анализе података. Сада нема лекција ни домаћих задатака – све је као на правом послу.
Финални спринт укључује рад на пројекту, А/Б тестирање и СКЛ задатке, као и додатни задатак. Пројекат садржи исказ проблема, очекивани резултат, скуп података и њихов опис.
Задатак се односи на једну од пет пословних области:
• банке,
• малопродаја,
• игре,
• мобилне апликације,
• е-трговина.
Неће бити уобичајеног описа корака у пројекту. Ви ћете сами радити кроз њих.
СК ЛПитхон ПандасТаблеау контролне табле Постгре СКЛ декомпозиција А/Б тестирање