Data scientist – nowy zawód na nowe czasy

Data scientist – nowy zawód na nowe czasy28.09.2018 16:57

Artykuły o pracy w świecie IT skupiają się głównie wokół programistów. Najczęściej słyszymy o zapotrzebowaniu na osoby specjalizujące się w aplikacjach webowych, desktopowych czy mobilnych, albo będącą ekspertami związanymi z bazami danych. W ostatnich latach coraz głośniej mówi się również o zawodzie, który jest rozszerzeniem analityka danych o umiejętności programowania, ale i nie tylko. Kim są zatem specjaliści data science, czym się zajmują oraz jakie umiejętności warto mieć, aby rozpocząć pracę na wymarzonym stanowisku?

Big Data i nowe wyzwania

Wraz z rozwojem IT, firmy pozyskują coraz więcej danych odnośnie klientów, produktów czy innych dóbr. Ilość informacji zwiększa się bardzo szybko i problemem nie jest już ich pozyskanie (aczkolwiek też jest nadal ważne), ale obróbka i użycie dostępnych faktów. Firmy są obecnie świadome, iż odpowiednie wykorzystanie danych jest kluczem do sukcesu (afera z Cambridge Analytica i wyborami w USA). Informacje o nas zbierają smartfony, smartwatche, telewizory, systemy operacyjne, przeglądarki internetowe, kamery przemysłowe czy nawet lodówki. Każdy z nas niebezpośrednio generuje olbrzymie ilości danych. Odpowiednie przetworzenie i użycie tych informacji generuje realny zysk. To właśnie zapotrzebowanie na zarządzanie danymi wymusiło potrzebę zaistnienia specjalistów data science.

Eksperci w tej dziedzinie są połączeniem osób zajmujących się analizą danych z nauczaniem maszynowym. Pozyskane informacje nie są już wartością samą w sobie. Głównym celem jest odpowiednie ich przetworzenie i wykorzystanie. Omawiany zawód łączy wiele zadań, które do tej pory wykonywane były przez różne zespoły, często w całkowitym odseparowaniu od siebie. Obecnie biznes oczekuje realnych korzyści z posiadanych danych. Mogą to być systemy do rekomendowania produktów w Internecie na podstawie działań użytkownika, aż po analizę danych z kamer CCTV w celu wykrywania terroryzmu (Microsoft obecnie tworzy system do wykrywania broni z obrazów z kamerach przemysłowych).

Data scientist – nieszablonowy zawód w branży IT

Specjaliści data science mają bardzo szerokie kompetencje. Muszą mieć wiedzę z zakresu matematyki i statystki, a także być biegłymi w programowaniu. Oczywiście warto znać także dziedzinę, którą badamy. Omawiani eksperci to także osoby, które stoją na pograniczu biznesu i IT. Często muszą komunikować się z klientem i mieć wiedzę niezbędną do przelania potrzeb na kod z użyciem dostępnych danych. Dodajmy tutaj, że jak zawsze w branży IT, język angielski jest niezbędny, aby móc realnie myśleć o pracy na stanowisku data scientist.

Osoby rozpoczynające karierę w tej dziedzinie nie muszą już od startu być obeznane we wszystkich omówionych zagadnieniach. Podstawą jest analityczne myślenie, które jest niezbędne w tej pracy, gdzie głównym celem jest rozwiązywanie zaistniałych problemów. Warto nadmienić, że zapewne łatwiej rozpocząć karierę w data science osobom mającym już jakiekolwiek doświadczenie w temacie

analizy danych czy statystyki. Z drugiej strony poszukiwani są również pracownicy z innych branż jak chociażby ekonomia, gdzie w trakcie późniejszej pracy będą mogli posiąść pozostałe wymagane umiejętności. Wspólną cechą niezbędną do wykonywania zawodu jest jednakże kreatywne podejście do zadanego tematu i komunikatywność.

Umiejętności miękkie to również bardzo ważny aspekt data science. Swobodna komunikacja z kardą zarządczą i umiejętność przekazania wyników analiz są ważne w pracy w każdej firmie. Dodatkowo zaawansowani eksperci data science często pełnią funkcje kierownicze nad całym zespołem, który składać się może z osób o różnych umiejętnościach.

Data Scientist, a programowanie

Umiejętność kodowania jest niezmiernie ważna w pracy osób na stanowisku data scientist. Wybór języka nie jest jednak w tym przypadku trywialny. Może się okazać, że wymagane będzie posiadanie wiedzy z programowania w kilku językach, w zależności od projektu czy klienta.

Rozpoczynając jednakże naukę warto zdecydować się na język popularny w danej dziedzinie i najbardziej przyszłościowy. Bez wątpienia takim językiem jest obecnie Python. Wg KDnuggets (https://www.kdnuggets.com/2018/05/poll-tools-analytics-data-science-machine-learning-results.html) Python ma obecnie niemalże 66% rynku data science. Wyprzedził on już rok temu „nieśmiertelny” język R i nie zwalnia tempa.

O popularności Pythona w data science zadecydowało kilka czynników. Po pierwsze jest on w pełni darmowy co jest niezaprzeczalną zaletą w porównaniu chociażby do płatnego Matlaba. Kolejną zaletą Pythona jest niski próg wejścia, w porównaniu do konkurencyjnych języków. Rozpoczęcie z nim przygody jest bardzo proste, co jest niezmiernie ważne w dziedzinie skupiających specjalistów z różnych dziedzin. Pierwsze skrypty można stworzyć odczuwalnie szybciej w Pythonie, niż w takiej Javie czy C++. Jest on także znacznie przejrzystszy i popularniejszy niż R, dzięki czemu łatwiej jest znaleźć kursy Pythona w sieci. Dodatkowo sam język jest bardzo uniwersalny i szeroko stosowany w różnych gałęziach IT. Znajdziemy go w aplikacjach zarówno desktopowych jak i webowych. Nic nie stoi na przeszkodzie, aby użyć go w procesie ETL (extraction, transformation, loading – wstępnej obróbki danych).

Dodatkowo za Pythonem przemawia bardzo duża liczba solidnych pakietów wykorzystywanych przy data science. Znajdziemy tutaj chociażby Pandas, Scikit-learn czy Tensorflow. Sprawa to, że Python jest znacznie atrakcyjniejszy od popularnej w świecie programowania Javy.

Jeśli omawiamy data science i języki programowania warto pamiętać, że ciągle ważna jest znajomość baz danych. Czy wybierzemy R, Pythona czy Javę, na jakimś etapie pracy pojawi się zapewne wymóg posiadania wiedzy z SQLa.

Ciekawy zawód z wyzwaniami

Data scientist to zawód, który jest wymagający, ale dający jednocześnie wiele satysfakcji. Pozwala on na poszerzenie wiedzy z zakresu programowania i analitycznego myślenia. Będzie to praca z wieloma wyzwaniami i problemami do rozwiązania. Ujarzmienie i wykorzystanie Big Data w wielu firmach to klucz do sukcesu, a jednocześnie coraz większe ilość danych dostarczanych przez ludzi i systemy powoduje, iż zapotrzebowanie na data scientistów będzie rosło.

Nie jest to praca prosta, a prawdziwi eksperci w swojej dziedzinie to osoby mające bardzo szeroką wiedzę. Znajomość matematyki i statystki, a także programowania jest zrozumiała w pracy data scientystów. Jednakże warto dodać, że równie ważne są umiejętności miękkie i ogólna dociekliwość w poszukiwaniu korelacji. Nie bez znaczenia jest także znajomość dziedziny, która wykorzystuje zdobyte dane do przetworzenia i użycia. Pomimo wielu wymogów, praca jest wyjątkowo ekscytująca i satysfakcjonująca. Data science jest młodą odnogą IT, która ma realny wpływ na otaczający nas świat.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.