Szkolenia Elasticsearch – Big Dot Software

Firma BigDotSoftware specjalizuje się we wdrożeniach i integracjach systemów wykorzystujących szeroko pojęte technologie BigData. Wychodząc naprzeciw oczekiwaniom naszych klientów przeprowadzamy także profesjonalne szkolenia z zakresu rozwiązań takich jak Hadoop, Hbase, Elasticsearch , Kafka, RabbitMQ, Redis oraz podobnych. Dzięki przeprowadzonym szkoleniom i warsztatom nasi klienci posiadający własne działy IT są w stanie samodzielnie utrzymywać i rozwijać systemy BigData.

Nasi trenerzy to doświadczeni programiści z ponad 19-letnim doświadczeniem, aktywnie pracujący z systemami BigData w lokalnych jak i w międzynarodowych projektach na zlecenia Politechniki Gdańskiej czy prestiżowych firm jak ThomsonReuters, Energa, Nordea. Posiadają oni doświadczenie w projektowaniu, realizacji, wdrożeniach czy utrzymywaniu systemów BigData

Szkolenie może zostać przeprowadzone zarówno w języku Polskim jak i Angielskim oraz może być dostosowane do indywidualnych potrzeb i wymagań klienta.

Umiejętności zdobywane podczas kursu:

Umiejętność konfiguracji klastra Elasticsearch o parametrach odpowiednich dla potrzeb projektowanego systemu
Umiejętność praktycznego użycia Elasticsearch i integracji z istniejącym oprogramowaniem (unikanie tzw. golden hammer),
Umiejętność projektowania optymalnego modelu danych
Efektywne mechanizmy ingest i query
Umiejętność przetwarzania i transformowania danych
Umiejętność pracy z NoSQL
Umiejętność pracy w rozproszonych systemach
Umiejętność integracji SQL i NoSQL oraz optymalizacja wydajności
Testowanie wydajności rozproszonego systemu i odnajdywania wąskich gardeł,
Umiejętność wyboru gotowych na rynku narzędzi i frameworków celem optymalizacji pracy developera – użycie technologii które do tej pory nie były brane pod uwagę a z sukcesem mogą zostać wdrożone

Czas trwania

1 do 4 dni, w zależności od aktualnego doświadczenia uczestników z Elasticsearch. Na przerobienie całego konspektu szkolenia zaleca się 4 dni, ale wybrane tematy mogą być również przeprowadzone w ciągu 1 dnia

Cena

6000zł netto/dzień dla grupy do 8 osób (skontaktuj się z nami aby otrzymać dedykowaną ofertę)

Ogólny/przykładowy konspekt/elementy szkolenia

Wprowadzenie
1. Dlaczego świat ekscytuje się BigData i co to jest? – wprowadzenie w świat technologii BigData
2. Własny DC czy Chmura – przegląd plusów i minusów w kontekście Amazon Web Services (AWS)
3. Przegląd dostępnych technologii OpenSource BigData (t.j.: Hadoop, Hbase, Hive, Pig, Kafka, RabbitMQ, Elasticsearch itp.) – jakich produktów należy używać i kiedy, jakie są różnice między nimi, jakie są wady i zalety poszczególnych z nich
4. Open Source vs Closed Source – dlaczego warto wybierać technologie OpenSource
5. NoSQL vs SQL – wprowadzenie do świata NoSQL, wady i zalety, transakcyjność, systemy rozproszone
Elasticsearch – podstawy
1. Indeksy Lucene – co to jest i dlaczego mówimy o Lucene w kontekście Elasticsearch
2. Architektura produktu Elasticsearch
3. Środowisko pracy – Window vs Unix, różne wersje Javy
4. Node, shard, replica, mappings, routing, alokacja, templates, dynamic mapping – podstawowe elementy Elasticsearch , których zrozumienie jest kluczowe
5. Jak Elasticsearch przechowuje dane – objects vs nested objects, refresh, cache, source, store, multi fields, wersjonowanie, definiowanie kluczy, wewnętrzne struktury danych + mechanizmy cache’owania, inverted index, cache
Elasticsearch – standalone instance
1. Uruchomienie standalone instance
2. Index, update, upsert – tworzenie i aktualizacja pojedynczych dokumentów oraz poprzez bulk
3. Search – przegląd Query DSL
4. Query, filter, aggregation(facets) – podstawy zapytań NoSQL czyli jak efektywnie pytać o dane
5. Rating, shard i formuły liczenia scoringu – TF*IDF, BM25 czy może własny?
Elasticsearch – budowanie klastra
1. Skalowalność – Vertical scaling vs Horizontal scaling
2. Mechanizm Zen Discovery
3. Konfiguracja nodów w klastrze (ingest/data/master/ml), dobór ilości masterów w klastrze,
4. Fault tolerance – odporność na awarie
5. Optymalizacja klastra – parametry konfiguracyjne, custom allocation, tags, rack_id, zone itp.
6. Split-brain effect, load balancing, transport client – czyli podstawowe elementy architektury o których należy pamiętać
7. Study Case – ile klastrów chcemy mieć i jak zasilać je danymi
Logstash + Beats
1. Uruchomienie i konfiguracja produktu
2. Transformacja danych
3. Ingest do Elasticsearch
Kibana
1. Architektura UI w kontekście Elasticsearch – jak najlepiej zamodelować UI
2. Kibana (discovery, metryki, index patterns, devtools, dashboardy, canvas, APM server, machine learning, X-Pack)
Elasticsearch – mechanizmy zaawansowane
1. Query vs Ingestion – zaawansowane mechanizmy populacji danych poprzez systemy kolejkowe t.j Kafka, RabbitMQ
2. NoSQL Query – budowanie zaawansowanych zapytań, dlaczego każde kolejne jest szybsze?
3. Ingestion – jak efektywnie indeksować TB danych w Elasticsearch
4. Zaawansowane konfiguracja klastra Elasticsearch – przegląd i wyjaśnienie parametrów konfiguracyjnych
5. Indexer, data storage czy reporting – jak dostosować klaster do naszych potrzeb,
6. Tokenizer, Analyser, Filter, Char filter – jak budować i testować zaawansowane analizatory i tokenizery dokumentów
7. Machine Learning – detekcja anomalii
8. Percolate – reverse search, system alertów,
9. Suggesters, spell corrections, highlighting
10. Search – profile, explain, custom scoring, effective pagination
11. Monitorowanie klastra – zapoznanie z Kibaną oraz alternatywnymi podejściami,
12. Testowanie klastra pod kątem wydajności – optymalizacja wydajności i profilowanie
13. Pluginy – jakie są dostępne i jak tworzyć własne(plusy i minusy)
14. X-Pack – opis możliwości
15. Security
Budowanie UI
1. Architektura UI w kontekście Elasticsearch – jak najlepiej zamodelować UI
2. Użycie gotowych UI – wady i zalety
3. Kibana – przegląd możliwości
4. Bezpieczne wyciąganie danych z klastra – czyli jak nie dopuścić do stanu „red”
Codzienność z Elasticsearch
1. Integracja Elasticsearch z istniejącymi systemami,
2. Typowe problemy utrzymania klastra, synchronizacji, skalowalności – dyskusja, podzielenie się doświadczeniami z wymagających projektów BigData,
3. Backupy
4. Kierunki rozwoju Elasticsearch i kompatybilność wsteczna – a własciwie jej brak, czyli jak sobie z tym radzić (dla przykładu: TransportClient vs RESTclient, plugins vs no-plugins itp.)
Rozszerzony program warsztatów

Zachęcamy do kontaktu celem otrzymania szczegółowej oferty.