Hive
Edit

Hive

https://hadoop.apache.org/
Last activity: 25.10.2024
Active
Categories: AnalyticsAppComputerDataHardwareITPlatformSoftwareStreamingWarehouse
The Hadoop framework transparently provides both reliability and data motion to applications. Hadoop implements a computational paradigm named MapReduce, where the application is divided into many small fragments of work, each of which may be executed or re-executed on any node in the cluster. In addition, it provides a distributed file system that stores data on the compute nodes, providing very high aggregate bandwidth across the cluster. Both map/reduce and the distributed file system are designed so that node failures are automatically handled by the framework. It enables applications to work with thousands of computation-independent computers and petabytes of data. The entire Apache Hadoop “platform” is now commonly considered to consist of the Hadoop kernel, MapReduce and Hadoop Distributed File System (HDFS), as well as a number of related projects – including Apache Hive, Apache HBase, and others.

Hadoop is written in the Java programming language and is an Apache top-level project being built and used by a global community of contributors. Hadoop and its related projects (Hive, HBase, Zookeeper, and so on) have many contributors from across the ecosystem. Though Java code is most common, any programming language can be used with "streaming" to implement the "map" and "reduce" parts of the system.
Likes
3.86K
Website visits
251.7K /mo.
Mentions
178

Mentions in press and media 178

DateTitleDescription
31.10.2024The Rise of AutoML: Streamlining Model Management in BankingIn the fast-paced world of finance, data-driven decisions are paramount. As banks like Alfa-Bank embrace machine learning (ML), the need for efficient model management becomes critical. Enter the AutoReTrainable ML Framework (ARTEML), a gam...
25.10.2024Фреймворк ARTEM(L): Как мы автоматизируем обучение и обновление моделей в Альфа-банкеИли как избавить DS от рутинных задач по обучению и обновлению моделей и их дальнейшему передеплою в проде? Всем привет! Я Настя Бондарева, senior Data Scientist в Хабе Юридических Лиц Альфа-Банка, лидирую инициативу ARTEML (AutoReTrainable...
28.09.2024The Rise of Streaming Frameworks: Unpacking Apache FlinkIn the digital age, speed is king. Users demand instant gratification. A few seconds of delay can feel like an eternity. This urgency drives the need for systems that can process vast amounts of data in real time. Enter streaming frameworks...
27.09.2024Что такое Big Data | Биг Дата?Big Data – термин, который вы можете часто встретить на просторах интернета. Вы можете найти множество статей, докладов и прочих материалов по этому термину, но давайте попробуем разобраться в нём, потому что он не так страшен, как о нём го...
19.09.2024Майкл Стоунбрейкер: «Всё новое — это хорошо забытое старое. Продолжение»От редакции: Майкл Стоунбрейкер — один из самых известных в IT мире ученых и отец-основатель Postgres. В соавторстве с Энрю Павло недавно опубликовал большой обзор всех актуальных технологий систем управления базами данных. В этом материале...
18.09.2024The Rise of Open Source in Russia: A New Era for Machine Learning and Data AnalysisIn the vast landscape of technology, open source is a beacon of collaboration. It invites innovation and democratizes access to tools that drive progress. Recently, a study by ITMO University has shed light on the state of open source in Ru...
17.09.2024Navigating the Waters of Memory Leaks and Client Retention: Insights from Pinterest's Tech JourneyIn the fast-paced world of technology, memory leaks can feel like hidden icebergs. They lurk beneath the surface, waiting to sink systems when least expected. Pinterest, a titan in the digital advertising space, recently faced such a challe...
17.09.2024ИТМО провёл исследование open source в сферах машинного обучения и анализа данныхСпециалисты центра «Сильный ИИ в промышленности» при ИТМО опубликовали результаты исследования особенностей и направления развития опенсорс-сообщества в сфере машинного обучения и анализа данных в России. В лидерах российского опенсорса ока...
16.09.2024Опыт отладки хитрой утечки прямой памятиPinterest поддерживает формирование отчётов по метрикам рекламных объявлений внешних рекламодателей и расчёт рекламных бюджетов в реальном времени. Всё это основано на потоковых конвейерах обработки данных, созданных с помощью на Apache Fli...
03.09.2024Big Data в моде: как мы внедрили 1-to-1 персонализацию в каталоге и поискеПривет, Хабр! Это Сергей Евстафьев и Дана Злочевская из команды ранжирования и поиска Lamoda Tech. Наша задача — помочь пользователю найти то, что ему нужно, и не потеряться в море доступных вариантов. В каталоге Lamoda в наличии более полу...
Show more

Reviews 0

Sign up to leave a review

Sign up Log In