Date | Title | Description |
31.10.2024 | The Rise of AutoML: Streamlining Model Management in Banking | In the fast-paced world of finance, data-driven decisions are paramount. As banks like Alfa-Bank embrace machine learning (ML), the need for efficient model management becomes critical. Enter the AutoReTrainable ML Framework (ARTEML), a gam... |
25.10.2024 | Фреймворк ARTEM(L): Как мы автоматизируем обучение и обновление моделей в Альфа-банке | Или как избавить DS от рутинных задач по обучению и обновлению моделей и их дальнейшему передеплою в проде?
Всем привет! Я Настя Бондарева, senior Data Scientist в Хабе Юридических Лиц Альфа-Банка, лидирую инициативу ARTEML (AutoReTrainable... |
28.09.2024 | The Rise of Streaming Frameworks: Unpacking Apache Flink | In the digital age, speed is king. Users demand instant gratification. A few seconds of delay can feel like an eternity. This urgency drives the need for systems that can process vast amounts of data in real time. Enter streaming frameworks... |
27.09.2024 | Что такое Big Data | Биг Дата? | Big Data – термин, который вы можете часто встретить на просторах интернета. Вы можете найти множество статей, докладов и прочих материалов по этому термину, но давайте попробуем разобраться в нём, потому что он не так страшен, как о нём го... |
19.09.2024 | Майкл Стоунбрейкер: «Всё новое — это хорошо забытое старое. Продолжение» | От редакции: Майкл Стоунбрейкер — один из самых известных в IT мире ученых и отец-основатель Postgres. В соавторстве с Энрю Павло недавно опубликовал большой обзор всех актуальных технологий систем управления базами данных. В этом материале... |
18.09.2024 | The Rise of Open Source in Russia: A New Era for Machine Learning and Data Analysis | In the vast landscape of technology, open source is a beacon of collaboration. It invites innovation and democratizes access to tools that drive progress. Recently, a study by ITMO University has shed light on the state of open source in Ru... |
17.09.2024 | Navigating the Waters of Memory Leaks and Client Retention: Insights from Pinterest's Tech Journey | In the fast-paced world of technology, memory leaks can feel like hidden icebergs. They lurk beneath the surface, waiting to sink systems when least expected. Pinterest, a titan in the digital advertising space, recently faced such a challe... |
17.09.2024 | ИТМО провёл исследование open source в сферах машинного обучения и анализа данных | Специалисты центра «Сильный ИИ в промышленности» при ИТМО опубликовали результаты исследования особенностей и направления развития опенсорс-сообщества в сфере машинного обучения и анализа данных в России. В лидерах российского опенсорса ока... |
16.09.2024 | Опыт отладки хитрой утечки прямой памяти | Pinterest поддерживает формирование отчётов по метрикам рекламных объявлений внешних рекламодателей и расчёт рекламных бюджетов в реальном времени. Всё это основано на потоковых конвейерах обработки данных, созданных с помощью на Apache Fli... |
03.09.2024 | Big Data в моде: как мы внедрили 1-to-1 персонализацию в каталоге и поиске | Привет, Хабр! Это Сергей Евстафьев и Дана Злочевская из команды ранжирования и поиска Lamoda Tech. Наша задача — помочь пользователю найти то, что ему нужно, и не потеряться в море доступных вариантов.
В каталоге Lamoda в наличии более полу... |
31.08.2024 | Transforming Industries: Advanced AI and Machine Learning in Action | Share
Tweet
Share
Share
Email
Ashok Kandipati holds a prominent position in the field of AI and machine learning, combining technical expertise with strategic insight. His journey commenced with a solid educational background, obtaining a M... |
29.08.2024 | Жизнь после SAP: импортозамещение платформы данных | Последние пару лет не перестает сходить с первого плана вопрос импортозамещения софта ушедших вендоров. Мы занимаемся данными, поэтому и делимся опытом импортозамещения платформ данных у наших enterprise заказчиков. Если попробовать классиф... |
28.08.2024 | Unpatchable 0-day in surveillance cam is being exploited to install Mirai | Enlarge
Getty Images reader comments 44
Malicious hackers are exploiting a critical vulnerability in a widely used security camera to spread Mirai, a family of malware that wrangles infected Internet of Things devices into large networks fo... |
20.08.2024 | Navigating the Data Migration Maze: Lessons from Teradata to GreenPlum | In the world of data management, migrations are like moving houses. You pack up your belongings, transport them, and hope everything arrives intact. Recently, a significant migration took place, moving over 400 terabytes of data from Terada... |
19.08.2024 | Navigating the Data Landscape: Innovations in Data Lineage and Observability | In the world of data, clarity is key. As organizations grapple with vast amounts of information, understanding the flow of data becomes crucial. Data lineage and observability are two concepts that have emerged as essential tools in this qu... |
19.08.2024 | Как мы перенесли архив данных из Teradata в GreenPlum с помощью Hadoop и PXF | Привет, Хабр! Мы продолжаем серию статей о проведённой миграции аналитического хранилища данных с платформы Teradata на GreenPlum. В предыдущей статье мы рассказали о нашем опыте и результатах автоматизированного переписывания SQL-скриптов ... |
17.08.2024 | Data Lineage из топора | Статья навеяна удачной реализацией Data Lineage «на коленке». Рассматривается случай, когда в окружающем корпоративном ландшафте Apache Atlas, Datahub или Amundsen еще не подвезли (и неизвестно, будет ли, и если будет, то когда) — а посмотр... |
13.08.2024 | The Rise of the Sixth Data Platform: A New Era in Data Management | In the fast-paced world of technology, data is the new oil. It fuels decisions, drives innovation, and shapes industries. As we stand on the brink of a new era, the concept of the "sixth data platform" emerges as a beacon of hope ... |
09.08.2024 | Financial Data Analysts: Making Sense of Big Data in FinTech | Share
Tweet
Share
Share
Email
Financial technology, or FinTech, data is the new gold. Companies are increasingly relying on vast amounts of data to make informed decisions, drive innovation, and maintain a competitive edge. This influx of d... |
09.08.2024 | Шестая платформа данных: новое слово в хранении и обработке данных | Скорее всего, в ближайшие 3–5 лет появятся новые интеллектуальные приложения для работы с данными, и для них понадобится новый тип современной платформы. Мы называем ее «шестая платформа данных».
Раньше описывали эту концепцию при помощи ме... |
31.07.2024 | Они управляют большими данными в финтехе. Как мы находим топовых специалистов по DWH | Примета времени – бизнес быстро обрастает огромным количеством данных. Если есть big data, то нужна команда, которая с ними разберется. Я Ольга, рекрутер в Clevertec. Наши специалисты развивают корпоративные хранилища данных. На своем опыте... |
25.07.2024 | The Voice of Trust: Navigating the Digital Landscape of AI Assistants**
** | ** In the age of technology, trust is a fragile thread. It weaves through our interactions with devices that listen, learn, and respond. Voice assistants like Yandex's "Alice" are at the forefront of this evolution. They promise c... |
19.07.2024 | Как вырастить динозавра: масштабирование платформы YTsaurus от 200 до 20 000 хостов. Доклад Яндекса | Привет! Меня зовут Паша Сушин. Уже больше десяти лет я занимаюсь в Яндексе развитием платформы YTsaurus — нашего внутреннего инструмента, который в марте 2023 года вышел в опенсорс и теперь доступен всем на GitHub по лицензии Apache 2.0.
Се... |
15.07.2024 | Вопросы по Apache Spark к собеседованиям для Data Engineer | Spark можно определить как вычислительный движок с открытым исходным кодом, функциональный подход к параллельной обработке данных на компьютерных кластерах, а также как набор библиотек и выполняемых файлов.
или как фреймворк для распределён... |
07.07.2024 | Проблемная секунда | Сегодня каждый может легко проверить текущее время множеством способов. У нас есть смартфоны, часы, компьютеры, ТВ, холодильники и так далее. Все знают, какой на дворе год, и что он означает. Мы разбираемся во временны́х зонах и знаем, что ... |
20.06.2024 | Нужна ли нам Lakehouse архитектура? | Когда озер и хранилищ данных недостаточно.
Изображение создано автором.Введение
Впервые я услышал термин "Lakehouse" в 2019 году, когда пролистывал документ Dremio. Будучи по своей натуре консервативным человеком, я предположил, ч... |
13.06.2024 | Миграция витрины данных с СУБД Teradata в СУБД Greenplum | Миграция СУБД с одной технологии на другую — сложный процесс, который связан не только с конвертацией кода и переливкой данных из одной системы в другую. Хотя и здесь есть неочевидные нюансы. Часто это вопросы, связанные с совместимостью фу... |
06.06.2024 | К2Тех и Arenadata: «Ситуация с Greenplum не является неожиданностью» | Ситуация, возникшая вокруг международного проекта с открытым исходным кодом Greenplum, не окажет негативного влияния на развитие продукта Arenadata DB. Об этом официально заявили представители Arenadata — ведущего российского разработчика П... |
28.05.2024 | Интеграция PostgreSQL и Hadoop | Привет, Хабр!
Представим некое перепутье, где с одной стороны — мощные возможности PostgreSQL, а с другой — необъятные просторы Hadoop. Выбор кажется сложным, но зачем выбирать одно, если можно соединить их и получить лучшее из обоих?
Объед... |
27.05.2024 | Быстрая Data Quality проверка на базе алгоритма adversarial validation | Привет, Хабр! Всем привет, меня зовут Максим Шаланкин, я Data Science Team Lead в команде Финтеха Big Data МТС. Из этой статьи вы узнаете, как оценивать качество данных при помощи алгоритма adversarial validation с использованием spark user... |
24.05.2024 | Миграция Big Data на практике: как мы готовили напильники | Всем привет, меня зовут Алексей Марьин, я IT-лидер стрима «Озеро данных» в ВТБ. До 2019 года мы активно и вполне успешно использовали для анализа и обработки больших данных продукт Oracle Big Data Appliance с Cloudera Hadoop Distribution вн... |
22.05.2024 | Cirata Simplifies Gerrit Instance Data Replication Across Multiple Global Sites | Cirata Gerrit MultiSite Enhances Scalability, Availability and Collaboration for Multi-Location Development Teams
SAN RAMON, Calif., May 22, 2024 /PRNewswire-PRWeb/ -- Cirata, the company that provides DevOps solutions to enterprise teams t... |
14.05.2024 | Cirata Data Migrator Now Available on Google Cloud Marketplace | Cirata data migration technology improves large Hadoop data transfer processes and integration for modern cloud analytics and AI workloads.
SAN RAMON, Calif., May 14, 2024 /PRNewswire-PRWeb/ -- Cirata, the company that automates Hadoop data... |
08.05.2024 | Open Data Access Layer — замена для AWS S3 SDK? | Всем привет. Сегодня я хочу рассказать про относительно новый продукт в стеке Apache Software Foundation для инженерии данных — OpenDAL.
Из официального описания на сайте проекта: OpenDAL предоставляет унифицированную абстракцию, которая по... |
07.05.2024 | Рулим запуском Spark-приложений в Airflow с помощью самописного оператора | Airflow в Lamoda Tech играет роль оркестратора процессов обработки данных. Ежедневно с его помощью мы запускаем 1 800+ тасок на проде, примерно половина из которых являются Spark-приложениями.
Все Spark-приложения сабмитятся из Docker-конте... |
25.04.2024 | Greenplum, NiFi и Airflow на страже импортозамещения: но есть нюансы | В статье описывается практическое применение популярных Open-Source технологий в области интеграции, хранения и обработки больших данных: Apache NIFI, Apache Airflow и Greenplum для проекта по аналитике учета вывоза отходов строительства.
С... |
19.04.2024 | Бороздим облака будущего: впечатления айтишника о конференции GoCloud | Добрый день, уважаемые подписчики Хабр. На связи Владимир Миронов (@VladimirMironovML). 21 марта я посетил масштабную IT-конференцию GoCloud «Облачные грани будущего». Мероприятие было приурочено к пятилетию работы команды Cloud.ru на росси... |
17.04.2024 | Разбираемся с Apache Spark | В сегодняшней статье мы начнем знакомиться с универсальной и высокопроизводительной кластерной вычислительной платформой Apache Spark, научимся разворачивать данное решение и выполнять простейшие программы. При обработке больших объемов дан... |
15.04.2024 | Строим lineage моделей машинного обучения и признаков с помощью OpenMetadata | Привет, Хабр!
Мы в билайне любим машинное обучение. В какой-то момент моделей машинного обучения стало так много, что это вынудило нас решать определенные задачи. Я Дмитрий Ермилов, руковожу ML в дирекции по искусственному интеллекту и цифр... |
04.04.2024 | Как перезапускать PySpark-приложение и зачем это может понадобиться | Сегодня все крупные компании сохраняют и обрабатывают большие объёмы информации, причём стремятся делать это максимально эффективным для бизнеса способом. Меня зовут Мазаев Роман и я работаю в проекте загрузки данных на платформу SberData. ... |
31.03.2024 | Hive: Distributed Cloud Computing Company Raises €12 Million | SC Ventures (Standard Chartered’s ventures arm) is leading a €12 million (USD $13 million) Series A funding round for distributed cloud provider Hive, which aims to increase businesses’ and individuals’ access to sustainable and high-powere... |
21.03.2024 | Что такое MLOps и как мы внедряли каскады моделей | Привет, меня зовут Александр Егоров, я MLOps инженер. В статье расскажу о том, как мы в банке выкатываем огромное количество моделей. Разберем не только пайплайн по выкладке отдельных моделей, но и целые каскады.Как появляется потребность в... |
13.03.2024 | Новое электричество, новая нефть, или Как эффективно управлять разрозненными данными | Изображение — Shubham Dhage — Unsplash.com
Последние 10 лет о данных говорят, что это новое электричество, новая нефть, из которых можно извлекать выгоду для компании. Но не все умеют это делать. Если данные просто лежат в старой Oracle Exa... |
26.01.2024 | Hadoop в Облаке: история миграции сотен петабайт | Миграция с «железа» в облако в большинстве случаев уже не кажется чем-то сложным или удивительным — тенденция на развертывание решений в облаке общая и устоявшаяся. Но если с переносом в облачную среду небольших ИТ-компонентов все просто, т... |
17.11.2023 | Top Big Data Tools for Java Developers in 2023 | In the modern era of data-driven decision-making, the abundance of data generated every day has necessitated the development of robust tools for processing, analyzing and deriving insights from these massive datasets. Java developers, with ... |
29.09.2023 | Hadoop в любой непонятной ситуации. Как выжить кластеру в большой ML команде | Привет, Habr!
Я работаю инженером по машинному обучению в МегаФоне. Занимаюсь аналитикой данных и являюсь частью команды разработки MLOps платформы. Задача нашей команды состоит в том, чтобы выстраивать и оптимизировать процессы разработки ... |
24.08.2023 | Вам в хранилище или к озеру? Чем занимаются специалисты по работе с данными и как стать Data-инженером | Привет, Хабр! Сегодня рассказываем, чем отличаются подходы к построению распределённых хранилищ данных Data Warehouse (DWH) и Data Lake и в чём специфика задач специалистов, работающих с данными.
Этот материал — переработанная версия вебина... |
24.08.2023 | Неструктурированные данные: примеры, инструменты, методики и рекомендации | В современном построенном на данных мире организации накапливают огромные объёмы информации, позволяющие принимать важные решения и выводы. Целых 80% от этой цифровой сокровищницы представляют собой неструктурированные данные, в которых отс... |
14.08.2023 | Доступ к потоковой передаче данных в режиме реального времени | Как Redpanda и Materialize воплощают данную идею в жизнь
Как эти продукты, не основанные на JVM, делают потоковую обработку доступной для широких масс за счет снижения операционных издержек? Обсудим в статье.
Говорят, что данные - это сырая... |
24.07.2023 | Data Engineering: концепции, процессы и инструменты | Data science, машинное обучение и искусственный интеллект — не просто громкие слова: многие организации стремятся их освоить. Но прежде чем создавать интеллектуальные продукты, необходимо собрать и подготовить данные, которые станут топливо... |
30.06.2023 | Prompt-инженер как новый тренд. Требования и зарплаты у специалистов | Технологические компании со всего мира ищут квалифицированных и эффективных инженеров, которые бы облегчили общение с машиной и составление инструкций. Екатерина Саяпина, Product Owner личного кабинета платформы МТС Exolve, созданной компан... |
03.06.2023 | Big Data Analytics: The Key to Resolving Complex Business Dilemmas | Big data analytics is the complex process of examining large and diverse datasets to uncover hidden patterns, correlations, market trends, and customer preferences. It is a crucial tool for organizations to make informed business decisions ... |
23.03.2023 | GTC 2023: Nvidia shares how Rapids can future-proof Apache Spark | Join top executives in San Francisco on July 11-12, to hear how leaders are integrating and optimizing AI investments for success. Learn More
Following the initial rise of Hadoop, data teams across industries have adopted Apache Spark as th... |
04.12.2022 | 2003–2023: Краткая история Big Data | Когда, играя в ту или иную RPG, я оказываюсь в библиотеке, то обязательно перечитываю все книги на полках, чтобы лучше вникнуть во вселенную игры. Помнит кто-нибудь «Краткую историю империи» в Morrowind?
Большие данные (Big Data) и, в частн... |
22.11.2022 | ETL и ELT: ключевые различия, о которых должен знать каждый | ETL и ELT — самые широко используемые способы доставки данных из одного или нескольких источников в централизованную систему для удобства доступа и анализа. Обе этих методики состоят из этапов extract (извлечения), transform (преобразования... |
08.11.2022 | Как упаковывать и дистрибутировать модели машинного обучения с помощью MLFlow | MLFlow - это инструмент для управления всеми стадиями жизненного цикла модели машинного обучения. Более того, в статье рассматриваются вопросы инсталляции и настройки службы MLFlow, а также приводятся примеры создания и совместного использо... |
27.05.2022 | Best data science tools and software 2022 | Image: VAKSMANV/Adobe Stock
Data is one of any organization’s most valuable resources. And while data has its benefits, such as enabling businesses to better understand their customers and financial health, it’s also a complicated science.
... |
26.05.2022 | Apache Spark vs Apache Hadoop: Compare data science tools | Image: Adobe Stock
Apache Spark and Apache Hadoop are both popular, open-source data science tools offered by the Apache Software Foundation. Developed by and supported by the community, they continue to grow in popularity and features. Mus... |
24.03.2022 | Что лучше: Spark Structured Streaming или полное прекращение работы прода? | Правильное построение ETL-процессов (преобразования данных) — сложная задача, а при большом объёме обрабатываемых данных неизбежно возникают проблемы с ресурсами. Поэтому нам требуется выискивать новые архитектурные решения, способные обесп... |
21.01.2022 | NetApp : Improve Apache Spark performance with the S3 magic committer - The Spot by NetApp Blog | Most Apache Spark users overlook the choice of an S3 committer (a protocol used by Spark when writing output results to S3), because it is quite complex and documentation about it is scarce. This choice has a major impact on performance whe... |
20.01.2022 | Области применения инструмента Apache Sqoop | Введение
Часто перед дата-инженерами ставится задача по миграции данных из какого-либо источника или системы в целевое хранилище. Для этого существует множество различных инструментов. Если говорить про платформу Big Data, то чаще всего у р... |
28.07.2021 | Обзор плагина Big Data Tools | Храните файлы в облачных файловых системах или, может быть, используете Hadoop, Spark и Zeppelin? А пробовали ли вы работать с ними напрямую из IDE?
Привет, меня зовут Олег, я из команды плагина Big Data Tools. В этой статье мы поговорим, з... |
27.07.2021 | Spark Structured Streaming graceful shutdown — Что в этом сложного и как это правильно делать? | Тем кто знает зачем graceful shutdown нужен и что такое Spark Structure Stream не понаслышке рекомендую сразу перейти к решению.
Введение
Что будет в статье:
1. Код с решемением проблемы
2. Описание проблемы
3. Мои пояснения о работе к Spar... |
07.05.2021 | Scalable and Dynamic Data Pipelines Part 4: Elasticsearch Indexin... | Editor's note: This is the fourth and final post in a series titled, 'Scalable and Dynamic Data Pipelines.' This series details how we at Maxar have integrated open-source software to create an efficient and scalable pipeline to quickly pro... |
11.12.2020 | Ubuntu Server: A cheat sheet | Ubuntu Server is an open source platform that does more than you might think. With its ability to serve as an internal company server or to scale all the way up and out to meet enterprise-level needs, this operating system can do it all.
Th... |
08.07.2020 | Working And Innovating Virtually With No Corporate Address? Been There, Done That | Innovation doesn't care where you sit.Getty |
13.09.2019 | Инфраструктура баз данных. Обязанности сисадмина, которые лучше доверить провайдеру | Рекламный материал
Anonymous 13 сентября 2019, 09:01 Инфраструктура баз данных. Обязанности сисадмина, которые лучше доверить провайдеру
Оставить комментарий... |
10.09.2019 | Google brings Cloud Dataproc to Kubernetes | Cloud Dataproc is probably one of the lesser-known products in Google Cloud’s portfolio, but it’s a powerful tool for data wranglers who are looking for a fully managed cloud service that lets them run Apache Spark and Hadoop clusters witho... |
02.07.2018 | Пять трендов финтех-индустрии Статьи редакции | Эксперты финансовой компании Exness — о больших данных, управлении рисками и автоматизации.
8519 просмотров
Материал подготовлен при поддержке компании Exness
Какие технологии и нововведения сейчас используются в финтехе и как скоро они рас... |
04.04.2017 | VB Summit welcomes the Chuck Norris of Google | Jeff Dean, the brain behind Google Brain, will be one of the premier speakers at VentureBeat’s exclusive VB Summit, Riding the AI Wave, taking place June 5-6 at the luxury Claremont Hotel & Spa in Berkeley, CA. Early-bird pricing at 50%... |
01.04.2017 | Cloudera finally ready for the public stage | When I first met Cloudera CEO Tom Reilly in 2015 at the Intel Capital Summit, we were about to go onstage for a fireside chat to discuss, among other things, Intel’s massive investment in his company.
While onstage, the conversation inevita... |
21.03.2017 | Latin American Big Data Market to Triple by 2022 Driven by Real Time Analysis Solutions | Hadoop is becoming standard for Big Data projects due to its disruptive characteristics, finds Frost & Sullivan's Digital Transformation team
SAO PAULO, March 21, 2017 /PRNewswire/ -- In Latin America, the Big Data and Analytics (BDA) m... |
03.01.2017 | 1. Commercial Drone (UAV) Technology will Turn to Software | Drones, Cars, Intelligent Apps, Virtual Reality and More – What to expect in 2017
There’s an age old saying that humans tend to overestimate what can be accomplished in one day, but underestimate what can be accomplished in one year. As 201... |
05.12.2016 | The AWS juggernaut | Scott Raney Contributor
Since joining Redpoint in 2000 Scott Raney has focused on cloud investments; his past portfolio includes Twilio, Heroku, and Adap.tv and recent investments in Stripe, Expensify, and Cyanogen.
More posts by this contr... |
14.11.2016 | What you need to know about Hadoop | Unless you’ve been hiding away from the world of computing for the last few years, you’ll have come across Hadoop.
Apache Hadoop, to give it its full name, is an open source framework designed to handle the storage and processing of large a... |
07.11.2016 | What you need to know about data warehousing | Data warehouses are at the core of many information driven business initiatives. They’re used to store large volumes of historical data which can then be used in business intelligence projects to create knowledge-based reporting.
But a data... |
31.10.2016 | 10 Popular Big Data Software and Tools We Found for you. | Share
Tweet
Share
Share
Email
Data processing is a do-or-die requirement for businesses today. There are many Big Data software out there. Many of them promise to save you money, time and help you find never-before-seen insights. Although t... |
04.08.2016 | From big data pilot to production | According to Gartner, more than half of all big data projects fail to make it beyond the pilot stage. It’s important to consider what it takes to make big data projects successful in a production environment and to ensure you’re building in... |
02.08.2016 | Latest Amazon Elastic MapReduce release supports 16 Hadoop projects | Amazon announced the release of Elastic MapReduce (EMR) 5.0.0 today, which includes, among other things, support for 16 open source Hadoop projects.
As AWS continues to hone its various tools to help customers manage myriad enterprise funct... |
02.08.2016 | How fog computing pushes IoT intelligence to the edge | Ben Dickson Contributor
Ben Dickson is a software engineer and the founder of TechTalks.
More posts by this contributor
Monetizing computing resources on the blockchain
Unlocking the potential of eye tracking technology
As the Internet of T... |
24.03.2016 | Social Gaming с Playtika. Логирование как главный инструмент техподдержки
Логи для бизнеса
Продакшен-логи
Локальные логи
Краши
Четыре вывода на закуску
Также читайте в проекте: Как крупнейший ра... | Anonymous 24 марта 2016, 12:50 Social Gaming с Playtika. Логирование как главный инструмент техподдержки
Оставить комментарий |
01.03.2016 | Getting predictive about politics (and everything else) | David Elkington Contributor
David Elkington is the founder and chief executive of InsideSales.com.
As the polls were closing for the 1948 presidential election between Thomas Dewey and Harry Truman, the Chicago Tribune went to print with th... |
08.12.2015 | MapR Tries To Separate From Hadoop Pack With New Streams Product | MapR is one of several companies built on the open source Hadoop platform, and as such it has a bit of competition in the space. Today, possibly in an effort to create some separation from its better heeled rivals, it announced a new produc... |
23.09.2015 | Google Launches Cloud Dataproc, A Managed Spark And Hadoop Big Data Service | Google is adding another product in its range of big data services on the Google Cloud Platform today. The new Google Cloud Dataproc service, which is now in beta, sits between managing the Spark data processing engine or Hadoop framework d... |
25.08.2015 | Hortonworks Acquires Onyara, Early Startup With Roots In NSA | Hortonworks, the big data company built on Hadoop, bought early-stage startup Onyara today. The company, which launched at the end of last year, has its roots in the NSA — yes that NSA.
The Onyara engineers worked at the NSA for 8 years hel... |
01.08.2015 | 18 open source проектов для практики программирования | Отдел новостей 1 августа 2015, 10:18 18 open source проектов для практики программирования
Оставить комментарий |
12.07.2015 | Spark And Hadoop Are Friends, Not Foes | Raymie Stata Contributor
Raymie Stata is the CEO of Altiscale.
June was an exciting month for Apache Spark. At Hadoop Summit San Jose, it was a frequent topic of conversation, as well as the subject of many session presentations. On June 15... |
16.04.2015 | Pepperdata Scores $15M For Hadoop Cluster Management | Pepperdata, a company that’s built a platform for managing and fine-tuning Hadoop cluster performance, announced a $15M Series B funding round today.
The round was led by new investors Wing Venture Partners along with Citi Ventures and Sili... |
25.03.2015 | InfluxDB has taken its open-source business to Silicon Valley | Paul Dix is holding on to his Williamsburg apartment. The CEO and cofounder of InfluxDB has strong personal ties to Brooklyn and it’s unlikely that he’ll totally vacate the place any time soon. However, his investors wanted his time series ... |
29.11.2014 | Zennet to Pay for Distributed Computing With Blockchain Tech | For several years now, kindly volunteers have been contributing their spare computing power to vast, distributed supercomputers, all in the name of worthy causes.
Spare computing cycles have been used for everything from scanning cosmic rad... |
18.09.2014 | Japan’s Largest Internet Company Deploys Brocade VCS Fabric for Enterprise-Wide Big Data Initiative | Bangalore, Karnataka, India
Brocade (NASDAQ: BRCD) today announced that Yahoo Japan Corporation, the country’s largest Internet company and a global digital market leader, has completed deployment of a Brocade Ethernet fabric solution as th... |
17.08.2014 | How Bitcoin might transform international payments — a lifeline for millions | It’s September, 13th, 2008. One of the most powerful men in America is about to foresee an earthquake in the financial system, something that will change the world.
Jamie Dimon, the head of JP Morgan Chase, has seen it all—but even he has t... |
12.05.2014 | What Facebook knows about data science may surprise you | At Facebook, you don’t have to be a “data scientist” to tackle tough data problems.
That’s what we heard from Justin Moore, whose data science career spans a pair of financial firms as well as Foursquare and Facebook. And he should know: As... |
02.05.2014 | Open Source’s Cult Of Personality Is Dying—Thankfully | Roy Rubin, co-founder of the popular Magento open-source project, announced this week he is bowing out of the project he helped launch back in 2008.
It’s not the first time the leader of an open-source project has stepped away from her proj... |
16.04.2014 | Google’s Cloud Platform Gets Improved Hadoop Support With BigQuery And Cloud Datastore Connectors | Google has long made it possible for its users to run Hadoop — a framework for storing and processing large amounts of data — on its Cloud Platform. Until now, however, the only way to get in and out of Hadoop on Cloud Platform was through ... |
14.01.2014 | Google Cloud Storage Connector For Hadoop Launches As Data Analytics Becomes A Priority For Cloud Providers | Google Cloud Storage has long had the ability to run Hadoop so developers can do advanced analytics on its distributed computing platform. Today, Google is attempting to simplify this process with a new connector that the company says makes... |
24.12.2013 | The secrets of designing and building big data apps | Aaron Kimball co-founded WibiData in 2010. He has worked with Hadoop since 2007 and is a committer on the Apache Hadoop project.
Software applications have traditionally been perceived as a unit of computation designed and used to solve a p... |
17.12.2013 | Amazon Kinesis Now In Public Beta For Developers To Build Real-Time Apps | Amazon Kinesis, the company’s new data streaming analytics platform, is now in public beta. It allows developers to build real-time apps without managing the complexity of multiple clusters. But though it has been heralded as a new type of ... |
15.12.2013 | Impala: Another Google Inspired Platform Enters The Mainstream Data World | Amazon Web Services has added support for Impala, the Google inspired query tool developed by big data startup Cloudera. It provides real-time, parallel processing for large amounts of data. With Impala, a developer can load new or access e... |
12.12.2013 | Survey: Hadoop still isn't reliable or secure enough | Hadoop, that ecosystem of open-source tools for storing and analyzing large quantities and many kinds of data, is spawning more and more companies. Some offer commercial support or consulting assistance for Hadoop. Others provide analytics ... |