{"id":88,"date":"2015-02-05T14:56:49","date_gmt":"2015-02-05T12:56:49","guid":{"rendered":"http:\/\/flexray.pl\/?p=88"},"modified":"2015-10-04T15:47:14","modified_gmt":"2015-10-04T13:47:14","slug":"nowosci-hdp-2-2","status":"publish","type":"post","link":"http:\/\/flexray.pl\/nowosci-hdp-2-2\/","title":{"rendered":"Nowo\u015bci HDP 2.2"},"content":{"rendered":"
Wersja 2.2 pakietu Hortonworks Data Platform<\/strong> (HDP) zawiera tysi\u0105ce ma\u0142ych poprawek oraz nowych funkcjonalno\u015bci, pocz\u0105wszy od dost\u0119pu do danych przez bezpiecze\u0144stwo \u015brodowiska a\u017c po warstw\u0119 zarz\u0105dzania oraz systemu uaktualnie\u0144. Z ka\u017cd\u0105 wersj\u0105 staje si\u0119 on \u0142atwiejszy do wdro\u017cenia w przedsi\u0119biorstwie jako kluczowy element nowoczesnej architektury danych (Modern Data Architecture).<\/p>\n Wewn\u0105trz pakietu znajdziemy najnowsze innowacje ze stajni Apache Software Foundation<\/a>, przygotowuj\u0105cej ca\u0142y ekosystem wog\u00f3\u0142 Apache Hadoop<\/strong>.<\/p>\n Poni\u017cej zamie\u015bci\u0142em schemat podzia\u0142u architektury i aplikacji rozwi\u0105zania HDP<\/strong> pomi\u0119dzy takie warstwy jak:<\/p>\n Poni\u017csza rycina obrazuje ewolucj\u0119 platformy w przeci\u0105gu ostatnich 2 lat z jednoczesnym rozwojem poszczeg\u00f3lnych projekt\u00f3w Apache Software Foundation<\/strong>. Wiele firm skupia\u0142o si\u0119 na konkretnych wersjach projekt\u00f3w, tworz\u0105c ich w\u0142asne produkty pochodne, oddalaj\u0105c si\u0119 od pracy na najnowszych wersjach i utrudniaj\u0105c sobie drog\u0119 do aktualizacji. HDP<\/strong> postawi\u0142o na mo\u017cliwie najnowsze oprogramowanie, daj\u0105c du\u017c\u0105 przewag\u0119 zar\u00f3wno technologiczn\u0105 jak i wydajno\u015bciow\u0105.<\/p>\n <\/p>\n Dzi\u0119ki znacznym zmianom w YARN<\/a>, otworzy\u0142y si\u0119 nowe mo\u017cliwo\u015bci dla silnik\u00f3w aplikacji pracuj\u0105cych w ekosystemie Hadoop, traktuj\u0105c go jako efektywne repozytorium danych dost\u0119pnych na wiele r\u00f3\u017cnych sposob\u00f3w. Kolejn\u0105 wa\u017cn\u0105 zmian\u0105 jest umo\u017cliwienie uruchamiania zada\u0144 o charakterze d\u0142ugiego cyklu \u017cycia poprzez zmiany w systemie zarz\u0105dzania zasobami, wysokiej dost\u0119pno\u015bci, zarz\u0105dzania zdarzeniami i zabezpiecze\u0144. U\u017cytkownik mo\u017ce dzi\u0119ki temu wykorzystywa\u0107 takie zadania podobnie jak zadania charakteryzuj\u0105ce si\u0119 kr\u00f3tkim cyklem \u017cycia. Hortonworks do\u0142\u0105czy\u0142 do spo\u0142eczno\u015bci Apache Slider, projektu b\u0119d\u0105cego frameworkiem YARN dla Hadoop, daj\u0105cy mo\u017cliwo\u015b\u0107 uruchamiania istniej\u0105cych rozproszonych aplikacji na YARN bez najmniejszych zmian w kodzie, dostarczaj\u0105c jedynie specyfikacj\u0119 w jaki spos\u00f3b aplikacja powinna zosta\u0107 uruchomiona. O ile YARN pozwoli\u0142 na uruchamianie nowych silnik\u00f3w na platformie Hadoop, nadal najbardziej popularnym punktem integracji pozostaje SQL wraz z produktem Apache Hive jako standard. W wydaniu 2.2 uda\u0142o si\u0119 wej\u015b\u0107 w pierwsz\u0105 faz\u0119 inicjatywy Stinger.next<\/a>, d\u0105\u017c\u0105c\u0105 do poprawy pr\u0119dko\u015bci, skali i sk\u0142adni SQL<\/strong>, staj\u0105c si\u0119 w pe\u0142ni interaktywnym systemem zapyta\u0144.<\/p>\n <\/p>\n Poprawi\u0142a si\u0119 tak\u017ce wydajno\u015b\u0107 Hive dzi\u0119ki Cost Based Optimizer, u\u017cywaj\u0105cy statystyk do generowania plan\u00f3w wykonawczych i wybieraj\u0105c najbardziej efektywn\u0105 \u015bcie\u017ck\u0119 w zale\u017cno\u015bci od wymaganych zasob\u00f3w.<\/p>\nZarz\u0105dzanie i integracja<\/h4>\n
\n
Dost\u0119p do danych<\/h4>\n
\n
Zarz\u0105dzanie danymi<\/h4>\n
\n
Bezpiecze\u0144stwo (autentykacja, autoryzacja, audyt i ochrona danych)<\/h4>\n
\n
Utrzymanie.<\/h4>\n
\n
YARN w HDP 2.2<\/h3>\n
\nOd wersji 2.2 YARN mo\u017ce zarz\u0105dza\u0107 zar\u00f3wno zasobami pami\u0119ci RAM jak i procesora, daj\u0105c wi\u0119ksz\u0105 elastyczno\u015b\u0107 w rozk\u0142adaniu obci\u0105\u017cenia pomi\u0119dzy w\u0119z\u0142ami klastra oraz lepsze harmonogramowanie.<\/p>\nEnterprise SQL w Hadoop<\/h3>\n
Integracja Spark z YARN<\/h3>\n