Ako vizualizovať komplexné údaje v systéme Linux

Obsah:

Anonim

Pravdepodobne ste už počuli o službe Elasticsearch - vyhľadávacom nástroji, ktorý vám umožňuje indexovať a potom rýchlo prehľadávať vaše údaje. Možno ste vytvorili niekoľko vizualizácií v Kibane, GUI pre Elasticsearch, ukazujúcich a preklikávajúcich sa cez elegantné rozhranie.

Čo ste možno nepoužili, je menej známy vizualizačný doplnok s názvom Timelion.

Timelion je fantastický nástroj na vytváranie vizualizácií, ktorý umožňuje písať vaše dotazy v jednoduchom a výkonnom jazyku vyjadrovania a zobrazovať grafy. Používa sa na zobrazenie údajov časových radov, ako je populačný rast alebo prírastky na vašom webe.

  • Tu je zoznam najlepších notebookov pre vývojárov
  • Skontrolujte tieto najlepšie distribúcie pre vývojárov
  • Na týchto najlepších pracovných staniciach môžete ľahko skresať čísla
O tomto článku

Tento článok sa prvýkrát objavil v časopise Linux Format Magazine, vydanie # 269, publikovanom v novembri 2022-2023.

Pomocou Timelionu môžeme vypočítať kĺzavé priemery, zobraziť rozdiel medzi údajmi za minulý týždeň a dnes a vykonať základnú detekciu anomálií. Je to užitočný nástroj, s ktorým viete pracovať. Začnime.

Inštalácia

Ak ste bežným čitateľom formátu Linux, existujú docker komponujúce príklady nastavenia klastra v LXF261.

Inak je inštalácia Elasticsearch a Kibana pomerne jednoduchá. Jedinou požiadavkou je Java, ktorú už máte pravdepodobne nainštalovanú.

Pokiaľ to nie je jednoduchá inštalácia sudo apt install default-jre, nainštaluje ju na distribúcie založené na Debiane alebo sudo dnf install java by mala urobiť to isté pre rodinu distribúcií Red Hat.

Potom si stačí stiahnuť najnovšiu verziu aplikácií Elasticsearch a Kibana pre požadovanú chuť operačného systému.

V čase písania tohto článku je najnovšia verzia kibana-7.8.1-linux-x86_64.tar.gz.

Môžete ho extrahovať pomocou tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, zmeniť sa do extrahovaného adresára a spustiť ./bin/kibana & na spustenie inštancie Kibana.

Ak ste nastavili Elasticsearch presne rovnakými krokmi a nahradili ste výraz „kibana“ výrazom „elasticsearch“, mali by ste vo svojom obľúbenom prehliadači prejsť na adresu http: // localhost: 5601 a vidieť nové lesklé rozhranie Kibana na hranie okolo s.

Ak dávate prednosť inštalácii balíkov pomocou správcu balíkov, rovnaký odkaz ako predtým obsahuje informácie o pridaní Elastic repo do vášho systému a inštalácii balíkov Kibana a Elasticsearch týmto spôsobom.

Môžete prekrývať grafy jeden na druhého a pomocou formátovania ich grafy vyzerajú čo najlepšie.

Získajte nejaké údaje

Posledné verzie Kibany umožňujú automatické prijímanie súborov údajov do nášho klastra pomocou Data Visualizer namiesto toho, aby bolo potrebné vytvárať skript alebo konfiguráciu Logstash. Môže pracovať s množinami údajov vo formáte JSON alebo CSV, ako aj s niektorými štandardnými súbormi protokolov, ako sú protokoly Apache. Jediným obmedzením je, že majú veľkosť menšiu ako 100 MB. To je pre naše účely viac ako dosť.

Budeme používať celosvetový súbor údajov prípadov Covid-19 z portálu EÚ pre otvorené údaje. Stiahli sme súbor CSV zo sekcie Zdroje na tejto stránke.

Ak máte problémy, môžete si namiesto toho stiahnuť verziu Excel .xlsx, otvoriť pomocou LibreOffice Calc a uložiť ju ako formát Text CSV (.csv). Na stiahnutie je k dispozícii aj verzia JSON, ktorú môžete použiť ako alternatívu.

Ak sa chcete dostať do Data Visualizer v Kibane, kliknite na ikonu hamburgeru v ľavom hornom rohu, potom na Machine Learning a nakoniec Data Visualizer. Potom kliknite do poľa Importovať údaje na možnosť Nahrať súbor, potom vyberte alebo presuňte súbor a vyberte súbor CSV, ktorý chcete prehrať.

Po krátkej analýze ukáže niektoré štatistiky, ktoré boli objavené z prvých 1 000 riadkov súboru CSV. Toto bude formát, v ktorom sa nachádza každé z polí, napríklad text, dátum alebo číslo, a zvýraznenie najvyšších hodnôt nájdených v týchto poliach.

Spravidla to urobí dobre, keď to zistíme za nás. Ak ste potrebovali vykonať nejaké úpravy, môžete kliknúť na Prepísať nastavenia a upraviť ich - napríklad názov poľa tak, ako bude nastavený v Elasticsearch.

Jeden názov poľa, ktorý by sme mali prepísať, je dateRep, ktorý predstavuje dátum vypočítaného údaja v našom súbore údajov. Timelion nebude vedieť, ako to predvolene použiť ako časové pole, takže si môžeme neskôr zjednodušiť život tým, že toto pole teraz premenujeme na niečo, čo bude rozpoznávať.

Dobrý kandidát je časová značka. Nastavíte to kliknutím na Použiť. Ak ste spokojní s tým, ako to vyzerá, kliknite do dolnej časti Importovať, pomenujte index - vybrali sme covid - a potom znova kliknite na Importovať, aby sa údaje dostali do vášho klastra.