Menu

Vyšel Apache Hadoop 3

22. ledna 2018/Johnson Darkwah

Koncem roku 2017 vyšla dlouho očekávaná nová verze Apache Hadoop 3.0.0, frameworku pro zpracování velkého množství strukturovaných i nestrukturovaných dat. Co přináší nového a proč se už nemůžeme dočkat, až s ní budeme pracovat, krátce přibližuje náš specialista na big data řešení Johnson Darkwah.

Proč je vydání nové verze důležité?

Apache Hadoop 3.0.0 je naprostá novinka, která se do komerční distribuce dostane pravděpodobně v polovině roku 2018. Hadoop je technologie, která zásadně ovlivnila to, jak se v současnosti pracuje s velkými daty. Nyní vyšla nová verze se zásadními aktualizacemi, proto vzbuzuje tolik zájmu.

Co důležitého s sebou nová verze přináší?

Podle mě je nejvýznamnější novou funkcí HDFS Erasure Coding, která sníží využití prostoru na discích přibližně o 50 %. To znamená jedinou, ale velmi podstatnou věc – snížení nákladů na uložení dat.

Takže jde především o zrychlení a nižší náklady?

Hadoop se v posledních letech instaloval především jako on-premise přímo v datacentru zákazníka. Obecně bylo třeba Hadoop aktualizovat a posunout dál. Ukládání dat do cloudu je už poměrně levná záležitost, tudíž snaha snížit vstupní a provozní náklady Hadoopu představuje logický krok.

Jaké další zlepšení přinese nová verze?

Pro nás jsou zajímavé změny v YARN, konkrétně podpora Docker kontejnerů, od které si slibujeme především rychlejší vývoj na Hadoopu.

Co znamená vydání nové verze pro zákazníky?

Rychlejší, levnější a bezpečnější ukládání dat a jejich zpracování na všech úrovních. Zákazníci by měli vědět, že v Gauss Algorithmic vývoj Hadoopu pečlivě sledujeme a jakmile uznáme, že je systém vyspělý, zařadíme ho do svého portfolia a začneme nabízet jako součást našeho datalake. Hadoop je pro nás taková srdcovka – využíváme ji ve většině našich řešeních a verzi 3 nabídneme českým a slovenským zákazníkům jako první.

Jakou roli zde hraje společnost Cloudera?

Přestože je Hadoop open-source technologie, Cloudera jako taková zásadně řídí směr jejího vývoje. V Cloudeře navíc pracuje Doug Cutting, který je jedním ze zakladatelů Hadoop a člen představenstva Apache Hadoop FoundationGauss Algorithmic je také oficiální partner Cloudery pro střední a východní Evropu, díky čemuž jsme schopni dodávat robustní řešení ve velmi krátkém čase.

Více detailních informací o nové verzi je možné se dočíst na blogu Cloudery nebo přímo na stránkách Apache Hadoop.

 

Líbí se vám článek? Sdílejte jej.

K tématu by vás mohlo zajímat

Detekce anomálií pomocí časových řad
Detekce anomálií pomocí časových řad14. května 2019

Detekce anomálií je jedna z oblastí, které se v Gauss Algorithmic věnuju. Se zvědavostí jsem proto na Machine Learni...

Více informací o Detekce anomálií pomocí časových řad

Máte zájem o naše služby?

Kontaktujte nás

Sbíráme anonymní data a měříme, abychom náš web mohli dále vylepšovat. Souhlasíte se sběrem cookies?

AnoNe, více informací