Edit

Я Анастасія. Мій блог STEMINIST присвячений початківцям у програмуванні та дівчатам у STEM, бізнесі та активізмі. Тут ви знайдете завдання, челенджі, корисні матеріали та натхнення з підтримкою.

hello@steminist.com.ua

Yelyzaveta Losieva: Data Scientist, Machine Learning Engineer, Deep Learning Engineer, NLP Engineer

Я твердо вірю, що ви можете вирішити і досягти всього, якщо любите те, що ви робите.

Yelyzaveta Losieva LinkedIn: @yelyzaveta-losieva
Data Scientist, Machine Learning Engineer, Deep Learning Engineer, NLP Engineer
🎤 Привіт, не могли б ви представитися?

Привіт всім! Мене звуть Yelyzaveta Losieva, я фахівець по роботі з великими даними, інженер з обробки природної мови, розробниця програмних продуктів з відкритим кодом і учасниця Arctic Code Vault від GitHub (докладніше про програму GitHub🔗). Я народилася і живу в Києві, Україна. Я захоплена рішенням проблем в галузі науки про дані, особливо в області обробки природної мови. Крім того, я активно підтримую жінок в STEM і люблю проводити публічні виступи, щоб надихати і спонукати жінок, а також проводжу технічні дискусії про науку і дані. Я була учасницею однієї з провідних груп “Women Techmakers” і “Women Who Code Kyiv”. Я була стипендіаткою Грейс Хоппер, 2016 р Х’юстон, штат Техас, і виграла стипендію Women Who Code Travel Stipend to Google I/O в Маунтін-В’ю, Каліфорнія в 2017 р, а також гранти на поїздки та конференції Google для участі в заході ACM Celebration of Women in Computing womENcourage 2018 м.Белград.
Я твердо вірю, що ви можете вирішити і досягти всього, якщо любите те, що ви робите.

🎤 Над чим ви працюєте?

В даний час я продовжую займатися самоосвітою в галузі науки про дані і одночасно займаюся різними проектами з відкритим вихідним кодом на GitHub. Одна з моїх цілей – продовжувати створювати і вносити вклад в різні репозиторії GitHub з відкритим вихідним кодом в сферах Data Science (github.com/ElizaLo/Data-Science 🔗), Машинне навчання (github.com/ElizaLo/Machine -Learning 🔗), Обробка природної мови (github.com/ElizaLo/NLP-Natural-Language-Processing 🔗), Підготовка до співбесіди для FAANG (github.com/ElizaLo/Interview-Preparation 🔗) тощо, що включає в себе не тільки «класні списки» на ці теми, але також деяку теоретичну інформацію, передовий досвід і оптимальну реалізацію на Python.
Крім того, одна з моїх цілей – створити блог, в якому я буду легко пояснювати з нуля складні теми з області науки про дані.

🎤 Який у вас досвід роботи?

Під час отримання ступеня магістра комп’ютерних наук я працювала в люксембурзькому стартапі «Unicorn Nest» керівником дослідників. Оскільки у нас не було набору даних, моєю метою було зібрати і створити його. Я координувала роботу всіх існуючих молодших дослідників/операторів даних по створенню набору даних для навчання нейронної мережі. Моніторинг результатів їх роботи і результатів NER (Named Entity Recognition) і витяг фактів зі статей, написаних різними людьми на різних платформах, за допомогою існуючої нейронної мережі.
Ця робота дала мені досвід і глибоке розуміння створення складних нейронних моделей глибокого навчання з нуля, коли у вас немає нічого, навіть необхідного набору даних.

🎤 Як ви потрапили у свою сферу?

Почнемо з того, що з раннього дитинства мене цікавила і хвилювала область технологій. Я маю на увазі, що мене завжди цікавили питання такого типу: «Як працює ця машина або механізм?» і «Чому так працює?».
Отже, в середній школі я дійсно зацікавилася фізикою і інформаційними технологіями, а в останні роки я цікавилася програмуванням. Наприклад, у старшій школі я вивчила HTML. Так що у восьмому класі я вже твердо вирішила, що зв’яжу своє життя з програмуванням. Також протягом останніх чотирьох років в школі я брала участь в олімпіаді з фізики і веб-дизайну. Зі шкільних предметів мені найбільше подобалися математика, фізика і програмування.
Потім я поступила в Київський національний університет імені Тараса Шевченка на факультет комп’ютерних наук і кібернетики по стипендіальній програмі і отримала ступінь бакалавра прикладної математики. Це дало мені відмінні пізнання в різних математичних дисциплінах. Після цього я вирішила отримати ступінь магістра інформатики. Під час навчання в магістратурі я захопилася наукою про дані і особливо обробкою природної мови.
Під час навчання в університеті я познайомилася з безліччю чудових однокурсників, які продовжують надихати мене навіть зараз. Крім того, я була дуже активна і намагалася відвідувати якомога більше різних професійних зустрічей і спілкуватися на них з різними людьми. Пізніше багато хто з цих людей стали моїми друзями, але також вони вплинули на мене, щоб я пішла в сферу технологій і обрала свій власний шлях.

🎤 Який набір знань необхідний, щоб стати хорошим професіоналом у вашій області?

Оскільки я цікавлюся наукою про дані, можу сказати про неї:

  • Безумовно необхідні хороші математичні знання (особливо алгебра, обчислення, статистика і теорія ймовірностей).
  • Знання Python або R (залежить від того, що ви хочете робити), SQL.
  • Знання загальних фреймворків машинного навчання.
  • Відмінне знання алгоритмів машинного навчання і глибокого навчання.
  • Дослідження й експерименти з сучасними алгоритмами машинного навчання/штучного інтелекту для вирішення критичних бізнес-проблем.
  • Уміння читати, розуміти, реалізовувати та застосовувати до бізнес-проектам останні дослідні роботи.
  • Володіння хоча б одним з хмарних провайдерів.
  • Можливість писати дослідні роботи в майбутньому.
  • Легко пояснювати складні речі з нуля.
  • Публічні доповіді на конференціях і зустрічах.
  • Буде великим плюсом знання обробки природної мови або машинного зору або і те, і інше.
  • Творчий і підприємницький склад розуму.
  • Захоплення штучним інтелектом.
  • І, звичайно ж, хороші навички спілкування, сильні усні та письмові комунікативні навички.
🎤 Опишіть свій перший проект і яка ваша роль у ньому.

Одним з найбільших моїх самостійних проектів стала магістерська робота. Я робила систему питання-відповідь на основі набору даних SQuAD v2.0: порівнювала моделі BERT і BiDAF. Я проаналізувала дві версії набору даних SQuAD (v1.1 і v2.0) і вибрала останню, у якій є питання, на які не дано відповідей або питання без відповіді, щоб створити систему контролю якості, яка враховує контекст речення.
Я реалізувала дві моделі, які включають механізм уваги, а саме модель BiDAF (з нуля) з використанням вбудовування слів GLoVe і BERT-small (з використанням бібліотеки Hugging Face). Я навчила його на CPU і використовувала метрики EM (точний збіг) і F1 для порівняння та аналізу результатів.

Крім того, в іншому проекті я створила метод виявлення країв клітин з використанням опуклої оптимізації, а саме метод множників зі змінним напрямком (ADMM) з одного зображення клітини, зробленого під мікроскопом, щоб допомогти раніше діагностувати рак.
Це було реалізовано на C ++ без використання будь-яких додаткових бібліотек.
Я випробувала цей метод на великій кількості фотографій клітин, зроблених під мікроскопом, і переконалася, що запропонований метод працює і може бути використаний в медицині.

🎤 З якими труднощами ви зіткнулися на своєму шляху?

Спочатку я іноді не вірила в себе і свої сили, але потім зрозуміла, що з усім справляюся і все залежить від мене. Крім того, мене завжди дуже підтримували люди, які мене оточують.
Також одну з ключових ролей зіграв той факт, що на той момент я виграла кілька стипендій. Головною з них була стипендія, яка допомогла мені відвідати Grace Hopper Celebration 2016 Х’юстоні, штат Техас. Ця конференція надихнула мене найбільше і допомогла повірити в себе.
Повернувшись в Україну, я стала і залишаюся членом різних спільнот, які підтримують і надихають жінок в сфері технологій, таких як «Women Who Code Kyiv» і «WomenTechmakers».

🎤 Я знаю, що ви виграли кілька стипендій під час навчання в університеті і відвідали безліч конференцій по всьому світу, включаючи технічні конференції та конференції, які надихають жінок в STEM. Чи не могли б ви розповісти про це детальніше: як подати заявку і т.д.? Або ви могли б поділитися з нами своїм досвідом?

Звичайно, з великим задоволенням!
Першим і головним було присудження стипендії GHC для участі в заході Grace Hopper Celebration of Women in Computing (GHC) в 2016 році в Х’юстоні, штат Техас.
Я прочитала про цю конференцію в одному з технічних пабліків в соціальних мережах. Свято Грейс Хоппер (GHC) – це найбільше в світі зібрання жінок-технологів. Подача заявки на стипендію була відкрита і я тут же вирішила подати заявку. Процедура була досить стандартною: щоб подати заявку, ви повинні були бути або студентом в STEM в наступному році, або викладачем, заповнити онлайн-форму з питаннями, написати кілька есе з відкритими питаннями, відправити свої оцінки в університеті англійською мовою і попросити свого професора написати рекомендаційний лист.
Через три місяці я отримала лист про те, що мені присуджують стипендію і я почала збиратися на конференцію.
Стипендії для студентів і викладачів включають індивідуальну реєстрацію на триденну конференцію, проживання в готелі на всі дні конференції, карту харчування, стипендію для поїздки на конференцію з будь-якої точки світу. Ця конференція дає приголомшливі можливості для встановлення контактів і вступу в жіночі технічні співтовариства. Я зустріла велику кількість надихаючих жінок з усього світу, і з деякими з них я до сих пір підтримую стосунки. Крім того, кожен день проводиться безліч технічних бесід і сесій, на яких ви можете зустрітися з жінками-програмістами з різних технологічних компаній і задати питання. А в кінці кожного дня – кілька корпоративних вечерь. І, звичайно ж, є ярмарка вакансій, де ви можете отримати нову роботу або стажування на наступне літо.

Після цього «Women Who Code» нагородила мене стипендією на поїздку і квитком зі знижкою на відвідування технічної конференції Google I/O від Google в 2017 році, Маунтін-В’ю, Каліфорнія. Я отримала інформацію про цю стипендії зі списку розсилки Women Who Code. Щоб подати заявку на стипендію, вам також необхідно заповнити онлайн-форму і написати есе. Ця конференція щорічно збирає розробників з усього світу для бесід, практичного навчання з експертами Google і першого знайомства з новітніми продуктами Google для розробників.

І в третій раз я була нагороджена «Грантом Google Travel and Conference Grant» і отримала стипендію на поїздку і квиток на участь в ACM Celebration of Women in Computing womENcourage 2018 у Белграді, Сербія. Щоб мати право на отримання гранту для участі в конференції в Європі, заявники повинні:

  • Бути жінкою, яка працює або вивчає інформатику, комп’ютерну інженерію або технічну область, пов’язану з тематикою конференції (обмеження за місцем проживання відсутні)
  • Мати сильну академічну і/або професійну освіту з продемонстрованими лідерськими здібностями.

WomENcourage об’єднує жінок, зайнятих у комп’ютерній професії і суміжних технічних областях, для обміну знаннями та досвідом і надання особливої підтримки жінкам, які отримують наукові ступені і починають свою кар’єру в області обчислень.
За допомогою програми, наповненою актуальними темами і освітніми, мережевими заходами що залучають, womENcourage надає унікальний досвід колективної енергії, прагнення і майстерності, якими професійні жінки діляться, щоб підтримувати одна одну.

Крім того, я була на саміті WomenTechmakers Leads в 2017 році в Празі, Чеська Республіка, і в 2018 році в Мадриді, Іспанія. Ці саміти також надали прекрасну можливість поспілкуватися з провідними жінками в технічних областях з усієї Європи.

Ви можете зв’язатися зі мною через LinkedIn і дізнатися більше про кожну з цих конференцій і стипендій!

🎤 Існує загальна думка, що жінкам важко займатися STEM (наука, технологія, інженерія і математика). Ви коли-небудь зустрічали когось з такою ж думкою? Якщо так, то як ви впоралися з ситуацією?

На щастя, я ніколи не стикалася з такими ситуаціями, мене завжди підтримували моя сім’я, друзі, вчителі в школі, професори, жіночі спільноти, такі як WomenTechmakers і Women Who Code, і люди, що оточують мене.

🎤 Як ви думаєте, як ми можемо допомогти підтримати рух жінок в STEM, бізнесі та активізмі?

Нам потрібно говорити про це докладніше! Нам потрібно більше говорити про нерівні права для жінок і чоловіків, про те, що жінкам все ще платять менше за один і той же вид роботи. Ми повинні допомагати один одному боротися з гендерними стереотипами про жінок в STEM, які існують досі. Нам необхідно проводити більше зустрічей і конференцій про жінок в STEM і їх досягнення. І про це потрібно говорити ще зі шкільних часів. Ось чому необхідно створювати різні заходи, щоб заохочувати і надихати молодих дівчат вступати на факультети STEM.

🎤 Яку пораду ви б дали дівчатам, зацікавленим в кар’єрі у вашій сфері?

Перш за все, не думайте, що ви робите щось не так або що хтось знає краще. Вірте в себе, і ви досягнете всього, чого захочете. Навіть якщо виникають якісь труднощі і у вас щось не виходить, значить, ви на правильному шляху. Спочатку це завжди може бути складно і незрозуміло. Спробуйте знайти однодумців, відвідуйте різні тематичні зустрічі, конференції, приєднуйтесь до різних технічних спільнот, таким як WomenTechmakers, Women Who Code, Групи розробників Google, Студентський клуб розробників Google, Кола розробників Facebook і т.д. Більшість з них є в кожної з країн і в кожному регіоні. Не бійтеся підійти першим і поговорити. Нетворкінг дуже важливий в наш час.
Багато що залежить від того, як ви себе налаштуєте.

🎤 Які у вас кар’єрні цілі?

Як інженер з обробки природної мови я безумовно хотіла б поліпшити існуючі голосові помічники, такі як Google Assistant, Siri, Alexa і т.д. Я вважаю, що з їх допомогою ми можемо значно полегшити життя багатьом людям у всьому світі. Особливо це стосується людей з обмеженими можливостями.
Я хотіла б і далі надихати і спонукати жінок у всьому світі і публічно говорити про це. Крім того, в майбутньому я хотіла б бути наставником і допомагати людям переключитися на область науки про дані і вивчати її з нуля. І хотіла б отримати кілька професійних сертифікатів в області Data Science, Machine Learning і Cloud.

🎤 Як ви поєднуєте навчання, роботу, хобі та особисте життя?

Для мене це завжди було непросте питання. Оскільки я дуже відповідальна людина і дійсно обожнюю те, що роблю, я завжди намагаюся робити все можливе і покращувати все. Ось чому я завжди багато часу проводжу на роботі чи навчанні. Одна з речей, які мені допомагають, – це самоврядування (self-management). На щастя, в даний час про це написано багато різних книг і курсів.

🎤 Які книги, ресурси і блоги ви читаєте і рекомендуєте іншим?

У мене є приголомшливі списки, зроблені мною на GitHub (github.com/ElizaLo 🔗), так що ви можете знайти там набагато більше. Ось мій топ:

Курси:
• Безумовно, класичний курс машинного навчання від Andrew Ng (посилання 🔗).
• Stanford CS229: Машинне навчання | Осінь 2018 (посилання 🔗)
• Збірник лекцій | Згорткові нейронні мережі для візуального розпізнавання (весна 2017 р.) (посилання 🔗) Стенфорд
• Введення в навчання з підкріпленням з Девідом Сильвером (посилання 🔗) від Deep Mind, Google
• CS224N: обробка природної мови з глибоким навчанням | Зима 2019 (посилання 🔗) от Стенфорд
• Початок роботи з Data Science Foundations (посилання 🔗) список кращих курсів Coursera
• Машинне навчання для інженерів-програмістів (посилання 🔗)

Кращі книги:
• Глибоке навчання (серія адаптивних обчислень і машинного навчання) (посилання 🔗), Ян Гудфеллоу.
• Розпізнавання образів і машинне навчання, Bishop (посилання 🔗)
• Обробка мови і мови (проект 3-го вид.) Дена Джурафскі і Джеймса Х. Мартіна (посилання 🔗)
• 100 кращих книг про машинний зір всіх часів (посилання 🔗)

Крім того, ви можете знайти останні дослідження на arXiv або в Papers With Code по будь-яким тем, які вам подобаються.

🎤 Який найкращий спосіб бути в курсі того, що ви робите?

Не соромтеся додавати мене і звертатися:

LinkedIn: @yelyzaveta-losieva
GitHub: @ElizaLo

Мої проекти з відкритим вихідним кодом:

+1
1
+1
7
+1
1
+1
11
+1
3
+1
0
Підписатися
Сповістити про
guest
0 Коментарі
Вбудовані Відгуки
Переглянути всі коментарі
ukUkrainian