Date | Title | Description |
18.01.2025 | Bridging Realities: The Rise of Arnis in Minecraft | In the digital age, the line between reality and virtuality blurs. Enter Arnis, a groundbreaking tool that transforms the way we build in Minecraft. This utility allows users to recreate real-world locations in mere minutes, leveraging data... |
17.01.2025 | Spreadsheets ( гугл док ) для аналитика, чтение и запись данных. Настраиваем коннекшен | Кому будет интересна эта статья?
Вы работаете в Pandas/Python и вам необходимо получить таблицу из гугл дока.
Вы работаете в Pandas/Python и вам необходимо записать таблицу в гугл док.
Но коннекшена нету, тогда эта статья для вас!
И так сде... |
16.01.2025 | Rowsan Jahan Bhuiyan: A Trailblazer in Computer Science Research and Innovation | Share
Tweet
Share
Share
Email
Rowsan Jahan Bhuiyan
Rowsan Jahan Bhuiyan, a PhD student in Computer Science at the University of the Potomac, is a prominent figure in the field of computer science and engineering. With an impressive academic... |
15.01.2025 | Unleashing the Power of Local Data Analytics with Docker | In the fast-paced world of data analytics, speed and efficiency are king. Imagine being able to set up your entire analytics environment in minutes. Picture a world where you can bypass the bureaucratic hurdles of corporate processes. This ... |
15.01.2025 | Arnis: как перенести реальный мир в Minecraft за пару кликов | На днях энтузиасты с GitHub выпустили Arnis — утилиту, которая переворачивает представление о строительстве в Minecraft. Теперь, опираясь на реальные данные из OpenStreetMap, за считаные минуты можно создать масштабную копию существующего г... |
14.01.2025 | Полный цикл аналитической разработки за пару минут | Сталкивались ли вы в вашей компании с проблемами?
Невозможностью по-быстрому создать таблицу. Вместо этого нужно катить миграцию, получать апрувы от DWH, следить за тем чтобы таблица была производительна и тд
Вам не нравится BI вашей компан... |
14.01.2025 | Как аналитику развернуть локальный эирфлоу и прокинуть хуки в бд? | Кому можем быть полезна эта статья?
В вашей компании вообще нету эирфлоу или аналога.
У вас есть эирфлоу но тестирование дага можете проводить только на проде, нету стейджа ( деф контура). А если на прод еще и апрув нужен то это вообще сказ... |
11.01.2025 | Миграция данных: Понятие, виды и примеры на Python | Миграция данных — это важный процесс, который включает в себя перенос информации из одной системы хранения данных в другую. Это может быть необходимо по множеству причин, таких как обновление систем, интеграция новых технологий или соблюден... |
08.01.2025 | Открытые книги по ML и работе с данными | Мы регулярно публикуем подборки литературы для специалистов: делали дайджест книг для желающих поближе познакомиться с Postgres и Kubernetes. Сегодня на очереди справочники и пособия по машинному обучению, которые можно найти в открытом дос... |
02.01.2025 | The Rise of RP2040: A New Era in Embedded Development | In the world of embedded systems, change is a constant. The RP2040 microcontroller from Raspberry Pi has emerged as a beacon of simplicity and power. It’s like a breath of fresh air in a landscape cluttered with complexity. Many developers ... |
01.01.2025 | Как улучшить влажность в квартире: проверяем на практике | Введение
Тема влажности воздуха помещения в зимний период это особенная тема для обсуждения в наших широтах. Воздух холодный, сухой, влажность в жилых помещениях падает в зимний период. Кто-то без проблем переносит изменение климатических у... |
31.12.2024 | Чего ждать от Python в 2025 году — и чем он радовал нас в этом | Предновогодний привет, Хабр! Ну что, самое время подводить итоги и мечтать о прекрасном? А так как у нас стартует год Питона Змеи, поговорим про Python.
Ниже собрали мнения экспертов цифровой экосистемы МТС: обсудили, чем был интересен рели... |
30.12.2024 | Изобретаем polimer — фреймворк на Python для ускорения разработки научных прототипов | Еще с третьей версии в Python появились аннотации типов, которые можно использовать в качестве комментариев к аргументам функций, для статического анализа и поиска ошибок или даже перегрузки методов в зависимости от типов аргументов. Помимо... |
25.12.2024 | Пишем свой PyTorch на NumPy. Часть 2. Добавляем новые слои | PyTorch — это мощный и гибкий фреймворк для машинного обучения, широко используемый для создания нейронных сетей. Он особенно популярен благодаря простоте использования, динамическим вычислительным графам и богатой экосистеме инструментов д... |
24.12.2024 | The Cinematic Landscape: Trends, Data, and Box Office Battles | In the world of cinema, data is the new gold. As audiences flock to theaters, understanding what drives their choices is crucial. The recent analysis of film data from platforms like КиноПоиск and the box office performance of films like &q... |
23.12.2024 | Стратификация: как не облажаться с A/B тестами | Привет, Хабр!
Представьте: вы запускаете A/B тест. Цель проста: проверить, работает ли новая кнопка лучше старой. Но тут же возникает мысль: «А вдруг мобильные юзеры и десктопные реагируют по‑разному? А что с новыми пользователями? Их мнени... |
23.12.2024 | Рекомендательная библиотека RePlay: сравнение с конкурентами RecBole и Recommenders на примере SOTA-модели SASRec | Привет, Хабр! Мы — команда ML‑разработчиков Сбера и Sber AI Lab. Хотим рассказать о нашем open‑source инструменте RePlay, который позволяет создавать рекомендательные системы с нуля, начиная с самых ранних DS‑экспериментов и заканчивая пром... |
21.12.2024 | The Power of Gradient Boosting and Spark in Machine Learning | In the vast landscape of machine learning, many tools and techniques vie for attention. Among them, gradient boosting stands out like a lighthouse in a storm. It offers clarity and precision, especially when paired with Apache Spark, a tita... |
21.12.2024 | Unleashing the Power of LZ4 Compression in Embedded Systems | In the world of embedded systems, every byte counts. Imagine a tiny microcontroller, tasked with displaying vibrant animations on a limited-resolution LED screen. The challenge? To deliver rich visuals without overwhelming the device's meag... |
20.12.2024 | Машинное обучение на Spark | Существует множество подходов к машинному обучению. Со стороны может показаться, что генеративные модели на архитектуре под названием «трансформер» заняли передовые позиции и ближайшее обозримое будущее именно за ними. Но существуют и други... |
20.12.2024 | Анализ фильмов с интернет-портала Кинопоиск | О. Р. Чумакова* , С. Р. Леонов* , И. В. Пятлин* и А. А. Антонов*
*Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия
Данное исследование посвящено анализу данных о фильмах, собранных с крупнейшей российс... |
20.12.2024 | Обработка временных рядов в TimescaleDB с интеграцией pandas и NumPy | Привет, Хабр!
Если вы когда‑либо занимались анализом данных, связанных со временем, то наверняка знаете, каким это иногда бывает нелегким занятием — особенно когда данных много, миллионы строк, и SQL начинает медленно кряхтеть под нагрузкой... |
10.12.2024 | Python-библиотеки, которые упрощают жизнь программиста. Часть 1 | Привет всем! Меня зовут Алексей Жиряков, я техлид backend-команды витрины онлайн-кинотеатра KION. Сегодня хочу поделиться любимыми Python-библиотеками, которые помогают нам оптимизировать работу. Надеюсь, вам они тоже будут полезны. И конеч... |
06.12.2024 | Как должен выглядеть идеальный GitHub для поиска работы | Вступление
Сколько раз вы слышали совет: "Укажи GitHub в резюме для поиска работы"?
Многие думают, что просто создать аккаунт и запушить пару репозиториев будет достаточно, чтобы работодатели будут выстраиваться в очередь. Но на с... |
21.11.2024 | Объединяем фреймы данных в pandas: две самые распространённые операции | Предположим, что проводится большое исследование основных биохимических показателей крови у пациентов, проходивших обследование в нескольких клиниках. Все пациенты должны отказаться в одном наборе данных — но исходно каждая клиника поставля... |
17.11.2024 | Дообучаем языковую модель GPT2 с помощью Torch | Доброго времени суток, в этой статье я хочу поговорить о дообучения языковых моделей. В интернете уже много информации на эту тему, но большинство подобных статей затрагивают ее поверхностно. Сегодня я попробую разобраться в этом подробнее.... |
16.11.2024 | Top Tips for Analyzing Export and Import Data for Global Trade Success | Share
Tweet
Share
Share
Email
Globally trading companies depend on the analysis of export import data and customs data. This analysis offers insightful perspectives on competitor environments, demand and supply dynamics, and market trends. ... |
15.11.2024 | Harnessing Dask and Heatmaps for Data Analysis: A Dual Approach | In the realm of data analysis, two powerful tools stand out: Dask for time series analysis and heatmaps for game level optimization. Each serves a unique purpose, yet both share a common goal: transforming raw data into actionable insights.... |
15.11.2024 | Navigating the Skies: The Evolution of Drone Mapping with Litchi Add-ons | In the world of drone technology, efficiency is king. Pilots crave tools that simplify complex tasks. Enter Litchi, a popular app for drone flight planning. It’s like a Swiss Army knife for aerial photography. But what happens when it falls... |
15.11.2024 | 7 продвинутых приемов pandas для науки о данных | Pandas — это основная библиотека для работы с данными. Вот несколько приёмов, которые я использую, чтобы быстрее и проще выполнять повторяющиеся задачи по работе с данными.
Данная статья переведена с английского с адаптациями в рамках курса... |
13.11.2024 | Dask для анализа временных рядов | Привет, Хабр!
Сегодня расскажем, как с помощью Dask можно анализировать временные ряды. С временными рядами всегда заморочек много: большие данные, сложные расчеты. Но Dask отлично с этим справляется.
Для начала установим Dask:
!pip install... |
02.11.2024 | Быстрый старт с OODA Loop | Автор статьи: Михайлов Артём
Привет, Хабр! Сегодня в коротком формате ознакомимся с инструментом, который может изменить командную динамику и повысить эффективность принятия решений.
Если вы еще не знакомы с OODA Loop, давайте кратко разбер... |
31.10.2024 | Navigating the Transition: From StatsD to Prometheus in a Month | In the fast-paced world of technology, change is the only constant. For Mixpanel, a company that thrives on data, the transition from StatsD to Prometheus was not just a shift; it was a leap into a new era of metrics collection. This migrat... |
30.10.2024 | Как сократить время ответа в 2 раза, добавив одну строку кода | Вечером после напряжённого рабочего дня часто хочется расслабиться и посмотреть новый фильм или сериал. Но как выбрать что-то стоящее среди огромного количества контента? Поможет рекомендательная система. Наша команда разработчиков стремитс... |
24.10.2024 | Государственные перевороты: бармалеи выпрыгивают как черти из табакерки. Не хотите, дети, в Африку сыграть? | На исторических данных за 1991-2019 год покажем, как можно "увидеть" и "выцепить" признаки переворота. С помощью машинного обучения и ансамблевых модели. Ансамбли (конечно, не музыкальные), как показывает практика, – бол... |
23.10.2024 | Книга: «Causal Inference на Python. Причинно-следственные связи в IT-разработке» | Привет, Хаброжители!
Причинно-следственный анализ — одна из важнейших методологий современной науки о данных (data science), однако между теорией и практикой сохраняется большой пробел. Матеуш написал лучшую на сегодняшний день книгу, котор... |
19.10.2024 | Создаём свой реестр данных на основе ФГИС «Аршин». Часть 1 — добавляем данные в PostgreSQL и сокращаем размер БД | Всем привет. Этот практический цикл статей рассчитан на начинающих. Я решил поделиться своим опытом создания реестра данных на основе государственного. Данные будут храниться в базе данных PostgreSQL, доступ к ним будет осуществляться через... |
16.10.2024 | Navigating the Digital Cinema Landscape: A DIY Movie Recommendation System | In the age of streaming, choosing a movie can feel like searching for a needle in a haystack. With countless options available, how do you find that perfect film? This article explores a DIY approach to creating a movie recommendation syste... |
15.10.2024 | The Art of Sorting: More Than Just Order | Sorting is like a magician's trick. At first glance, it seems simple. You click a button, and voilà! Everything is in order. But beneath the surface lies a complex world of algorithms and data structures. Sorting is not just about arranging... |
15.10.2024 | Рекомендатель кино или как я писал свое DIY-решение для поиска новых фильмов | Вечер. Пересматриваю «Пятницу 13». Не люблю пересматривать фильмы, даже хорошие. Но выбрать интересное кино из потока новинок сложно. Поэтому мне захотелось написать свой рекомендатор кино. Этим и займусь в выходные.
В статье покажу, что по... |
14.10.2024 | Её величество Сортировка | Сначала кажется, что сортировка - это тривиально. В Excel жмешь "Sort Smallest to Largest" и все хорошо. Ну или sorted() в питоне. Всё само делается.
Серьезное знакомство с сортировкой у меня произошло на курсах Яндекс.Практикума ... |
12.10.2024 | Линейная регрессия и её регуляризация в Scikit-learn | В этой статье мы рассмотрим модели линейной регрессии, доступные в scikit-learn. Обсудим, что такое регуляризация, на примерах Ridge, Lasso и Elastic Net, а также покажем, как эти методы можно реализовать на Python.
Создание модели линейной... |
11.10.2024 | Hacking Hardware with a Lighter: A Journey into Electromagnetic Fault Injection | In the world of hacking, creativity is key. The tools of the trade can be as simple as a lighter. Yes, a common barbecue lighter can become a powerful weapon in the hands of a skilled hacker. This article explores the fascinating realm of e... |
11.10.2024 | The Power of PL/Python: Enhancing PostgreSQL with Python Magic | In the world of databases, PostgreSQL stands tall. It’s robust, reliable, and loved by developers. But what if you could supercharge it? Enter PL/Python. This powerful extension merges the strengths of PostgreSQL with the versatility of Pyt... |
11.10.2024 | The Fusion of PostgreSQL and Python: A New Era in Database Management | In the realm of database management, PostgreSQL stands tall as a robust and versatile system. Now, with the introduction of PL/Python, it has evolved into a powerhouse that combines the best of both worlds: the reliability of SQL and the fl... |
10.10.2024 | Gain Python Skills That Top Companies Value for $40 | TL;DR: Unlock real-world Python skills with The 2024 Python All-in-One Course Bundle for only $39.99, and start building your career in tech.
Python is the engine behind major platforms, data analysis tools, and countless innovations in tec... |
09.10.2024 | Усиление PostgreSQL с помощью PL/Python | Привет, Хабр!
Сегодня мы прокачаем PostgreSQL, добавив в него Python. А именно — PL/Python. Это расширение позволяет писать функции на Python прямо внутри базы данных. Лично для меня это как объединение двух лучших миров: любимого PostgreSQ... |
07.10.2024 | The Art of Data Preprocessing in Machine Learning: A Crucial Step for Success | In the world of machine learning, data is the lifeblood. But raw data is often messy, like a canvas splattered with paint. Before we can create a masterpiece, we must first clean it up. This process is known as data preprocessing. It’s the ... |
07.10.2024 | Предварительная обработка данных в машинном обучении: инструкция, инструменты, полезные ресурсы для начинающих... | В статье рассказываем, зачем обрабатывать данные перед загрузкой в модель, как провести предобработку и какие инструменты использовать.
Мария Жарова
Data Scientist, Альфа-БанкЧто такое предобработка данных
Предобработка — это подготовка наб... |
26.09.2024 | Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Начало | В первой главе исследования был описан набор данных с временными рядами о погоде, который мы будем использовать для выполнения задачи прогнозирования температуры, а также были приведены шаги по его предварительной подготовке.
В данной главе... |
25.09.2024 | The Eye of Technology: How Computer Vision is Revolutionizing Medicine | In the realm of medicine, the marriage of technology and healthcare is akin to a symphony, where each note plays a crucial role in creating harmony. One of the most compelling instruments in this orchestra is computer vision (CV). This tech... |
25.09.2024 | Unlocking the Future: Affordable Data Solutions for Everyone | In a world where data reigns supreme, having the right tools is crucial. The digital landscape is evolving rapidly. Businesses and individuals alike are searching for ways to harness the power of data science and secure their information. F... |
25.09.2024 | Unlocking Potential: Affordable Tools for the Modern Professional | In today's fast-paced world, efficiency is the name of the game. Professionals need tools that empower them to work smarter, not harder. Two standout offerings have emerged recently: the Afirstsoft AI PDF Editor and the 2024 Data Science &a... |
24.09.2024 | Harness the Power of Data Science & Machine Learning from Home | TL;DR: The 2024 Data Science & Machine Learning Bundle is available for just $39.99 (reg. $269) and includes comprehensive training to build your AI and data science skills.
With most things in life, flexibility is key, and that’s espec... |
24.09.2024 | Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава первая | После перерыва продолжаю цикл статей про одно из самых интересных направлений в статистике и науке о данных — прогнозировании временных рядов (или рядов динамики, как их первоначально называли в учебниках по эконометрике). Эта работа будет ... |
23.09.2024 | Сложная агрегация в Pandas с MultiIndex | Привет, Хабр!
Сегодня поговорим о Pandas MultiIndex — мощной штуке, которая спасла меня, когда пришлось агрегировать кучу многомерных данных. В отчётах за несколько лет с миллионами строк, обычный groupby() просто не справлялся, а MultiInde... |
20.09.2024 | DBS Bank: Pioneering AI in Banking | In the bustling financial landscape of Asia, DBS Bank stands out as a beacon of innovation. Recently, Harvard Business School (HBS) published a case study that delves into DBS's ambitious journey with Artificial Intelligence (AI). This mark... |
20.09.2024 | Navigating the Venture Capital Landscape: Legal Strategies for Success | In the fast-paced world of venture capital (VC), the stakes are high. Investors seek to fund the next big innovation, while startups aim to turn their visions into reality. However, the road to success is fraught with risks. Understanding t... |
19.09.2024 | Топ-5 библиотек для анализа данных на Python | Python — один из самых популярных языков для анализа данных благодаря множеству удобных и эффективных библиотек. Эти инструменты помогают обрабатывать, анализировать и визуализировать данные, делая вашу работу быстрее и проще.
Преподаватель... |
18.09.2024 | The Rise of Open Source in Russia: A New Era for Machine Learning and Data Analysis | In the vast landscape of technology, open source is a beacon of collaboration. It invites innovation and democratizes access to tools that drive progress. Recently, a study by ITMO University has shed light on the state of open source in Ru... |
17.09.2024 | ИТМО провёл исследование open source в сферах машинного обучения и анализа данных | Специалисты центра «Сильный ИИ в промышленности» при ИТМО опубликовали результаты исследования особенностей и направления развития опенсорс-сообщества в сфере машинного обучения и анализа данных в России. В лидерах российского опенсорса ока... |
16.09.2024 | Теорема о разбиении регрессоров: делаем CUPED аб-тесты в один шаг | Хай!
Пишу эту статью для тех, кто уже знаком с CUPED, но ищет больше понимания этого метода и взгляда на него с другой стороны. Здесь я не буду детально объяснять базовый алгоритм CUPED аб-тестирования: про это уже достаточно материала в се... |
13.09.2024 | Пошаговое руководство по созданию синтетических данных в Python | Простое руководство для новичков: как самому генерировать данные для анализа и тестирования
Представьте: вы только что написали модель машинного обучения и вам нужно протестировать её работу в конкретном сценарии. Или вы собираетесь опублик... |
11.09.2024 | Введение в Feature Engineering для начинающих дата-сайентистов и ML-инженеров | Feature Engineering, или генерация признаков — это процесс создания новых признаков (характеристик или фич) из имеющихся данных, чтобы улучшить работу модели машинного обучения. Он может включать преобразование данных, создание новых призна... |
07.09.2024 | Знакомимся с линейной алгеброй в NumPy | Библиотека NumPy для Python — это основа науки о данных и биоинформатики. При этом, хоть каждому программисту Python и знакомо имя пакета для установки:
pip install numpy
и команда импорта библиотеки:
import numpy as np
в практических задач... |
03.09.2024 | DuckDB. OLAP-куб в кармане | Привет, меня зовут Антон, я старший инженер в департаменте аналитических решений ЮMoney. В компании мы используем технологию MSSQL OLAP-кубов SSAS, которая хорошо себя зарекомендовала — она сравнительно легко развёртывается и достаточно про... |
20.08.2024 | Navigating the Complexities of Medical Data Management and Software Updates | In the world of healthcare, data is the lifeblood. It flows through hospitals, clinics, and research institutions, connecting patients to their histories and treatments. But managing this data can feel like navigating a labyrinth. Each twis... |
17.08.2024 | Интегрируем pandas с электронными таблицами: три способа | Открываем и сохраняем файлы Excel в pandas
Pandas идеально подходит для работы с табличными данными – он способен открывать файлы Excel и проводить внутри преобразования. Более того, сохранить датафрейм тоже можно в файл Excel. Это делает у... |
17.08.2024 | Создание и обработка медицинской базы данных с помощью python/R | Идея
Реализация
Результат
Идея: в медицинском учреждении выписные эпикризы (информация из истории болезни) пациентов хранятся в общегоспитальной локальной сети.
Необходимо сформировать базу данных пациентов с перенесенным заболеванием COVID... |
13.08.2024 | The Rise of the Sixth Data Platform: A New Era in Data Management | In the fast-paced world of technology, data is the new oil. It fuels decisions, drives innovation, and shapes industries. As we stand on the brink of a new era, the concept of the "sixth data platform" emerges as a beacon of hope ... |
09.08.2024 | Financial Data Analysts: Making Sense of Big Data in FinTech | Share
Tweet
Share
Share
Email
Financial technology, or FinTech, data is the new gold. Companies are increasingly relying on vast amounts of data to make informed decisions, drive innovation, and maintain a competitive edge. This influx of d... |
06.08.2024 | Как быстро удалить дублирующиеся строки в CSV, Excel и таблицах Markdown? | Если вы используете CSV, Excel или Markdown таблицы, вы можете столкнуться с дублирующимися строками. Это может произойти, если вы вручную ввели одинаковые данные или импортировали дубликаты из других источников. Какова бы ни была причина, ... |
03.08.2024 | Navigating the Open Data Revolution: The Rise of the Lakehouse Architecture | In the vast ocean of data, organizations are navigating treacherous waters. The emergence of open data stacks is reshaping the landscape, offering a lifeboat against the storm of vendor lock-in. This transformation is not just a trend; it’s... |
02.08.2024 | Analysts foresee changes ahead as database vendors navigate shifting landscape in compute engines for AI
Selecting the right compute engines for enterprise use
Shifting landscape for governance layer
... | Data applications are now being built on different platforms for different use cases, and artificial intelligence is one of the key drivers behind which compute engines for AI an enterprise may want to use.
Databricks Inc. and Snowflake Inc... |
01.08.2024 | Введение в MLflow | MLflow - это инструмент для управления жизненным циклом машинного обучения: отслеживание экспериментов, управление и деплой моделей и проектов. В этом руководстве мы посмотрим, как организовать эксперименты и запуски, оптимизировать гиперпа... |
30.07.2024 | Кто такой Python-разработчик, что делает и какие навыки необходимы? | Разработчик Python / Python developer — это программист(developer), занимающийся разработкой программного обеспечения с использованием языка программирования Python.
Python — это высокоуровневый язык, широко применимый в разных сферах: от в... |
27.07.2024 | Navigating the Waters of Automated Trading: A Newbie's Journey | In the vast ocean of financial markets, many dream of sailing smoothly toward wealth. Automated trading, or algorithmic trading, is one vessel that promises to navigate these waters efficiently. However, for newcomers, the journey can be fr... |
26.07.2024 | Newbee торговый бот: часть вторая, скрининг рынка облигаций ОФЗ | После того как ко мне пришло небольшое понимание того, как минимизировать финансовые убытки, я начал заимствовать немного кода с Kaggle Learn. С помощью чего попытаюсь в этой статье показать, как определить на какие позиции лучше не лезть, ... |
25.07.2024 | DuckDB: The New Powerhouse for Data Engineering**
** | ** In the vast ocean of data management tools, DuckDB emerges as a sleek, agile vessel. This columnar database is designed for analytical workloads, making it a go-to choice for data engineers. With its recent stable release, version 1.0.0,... |
24.07.2024 | Релиз Shiny for Python 1.0 | Разработчики выпустили Shiny for Python 1.0 с большим набором функций и стабильным API. Фреймворк построен на основе современного веб-стека Python и использует Starlette и asyncio для создания веб-приложений.
Новая версия включает:
новый ко... |
19.07.2024 | Всё что нужно знать про DuckDB | Оглавление
SQL
Copy
Prepared Statements
Functions
Extensions
PostgreSQL Extension
Parquet
Parquet Import
Parquet Export
Buena Vista
Практика
Installation
Client API Python
In-memory
Physical database
Result Conversion
Data Input
Установка в... |
19.07.2024 | Делаем новых людей за 12 строк кода: как с Python ускорить подготовку демо-стенда по HR планированию и соблюсти закон... | Привет, меня зовут Максим Бритвин, и я старший консультант-разработчик. Вот уже почти 10 лет я занимаюсь внедрением и доработкой проектов бюджетирования на платформе Oracle Hyperion, в частности интеграцией данных между Hyperion и различным... |
16.07.2024 | Бутстрап и доверительные интервалы: от теории к практике на Python | Введение
Применение
Ограничения
Схема бутстрапа
Эфронов доверительный интервал
Доверительный интервал Холла
t-процентильный доверительный интервал
Реализация на Python
Проблемы
ПримечанияВведение
Бутстрап — это вычислительный статистический... |
15.07.2024 | Использование моделей EfficientNet для классификации изображений | Искусственные нейронные сети (ИНС) — мощный инструмент в области компьютерного зрения, особенно в задачах классификации изображений. Эта область применения была одной из первых, для которой ИНС были разработаны. Например, перцептрон Розенбл... |
10.07.2024 | 10 библиотек Python для машинного обучения — подборка для начинающих | Составили список самых важных библиотек Python для машинного обучения и рассказали, для каких задач они могут быть полезны начинающим ML-инженерам и специалистам по Data Science. Собрать подборку помог Кирилл Симонов — ML-разработчик компан... |
05.07.2024 | Расчет КТУ с использованием библиотеки pandas | Коэффициент трудового участия — коэффициент, отражающий количественную оценку меры трудового участия отдельного работника в общих результатах труда группы работников, характеризующий суммарный вклад работника в общие результаты труда произв... |
04.07.2024 | Google Colab вместо Jupyter Notebook: плюсы и особенности работы для новичков | Привет! Меня зовут Ольга Матушевич, я наставница на курсе «Аналитик данных» в Яндекс Практикуме. С Jupyter Notebook я впервые столкнулась шесть лет назад, когда начала изучать Python и анализ данных. И именно установка Jupyter Notebook стал... |
28.06.2024 | Основы теории вероятностей для будущих программистов и дата-аналитиков | Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.
Вместе с Ильей Котовым, спе... |
27.06.2024 | Разделяй и запускай: делим тестовый стенд между департаментами | Промышленное математическое программирование - тема раскрученная в академической среде для стандартизированных случаев, но детали реальных внедрений раскрываются редко и спустя много лет.
В настоящей статье делюсь опытом разработки и внедре... |
25.06.2024 | Маршрутизация обращений: автоматизация в ИТ-поддержке с помощью ИИ и языковых моделей | Передовые технологии ИИ могут не только ускорить, но и значительно повысить качество обработки обращений. Я занимаюсь в НЛМК генеративным искусственным интеллектом и расскажу, как нам совместно с ИТ‑вендором Аксеникс удалось преобразовать п... |
25.06.2024 | Обнаружение вторжений с применением технологий машинного обучения. Часть 1 | Привет Хабр! Меня зовут Татьяна Ошуркова, я главный аналитик департамента ИТ корпоративного, инвестиционного и депозитарного бизнеса Росбанка и автор телеграм-канала IT Talks.
Совсем недавно я провела несколько вебинаров на тему использован... |
24.06.2024 | Дообучение модели GPT-2 (RUS) для генерации описаний заведений на основании названия, рубрики и оценки | Привью
Исходный кодАннотация
В данной работе представлен процесс дообучения модели генерации текста на основе архитектуры GPT-2. Целью работы является демонстрация возможностей применения дообученной модели для генерации текстов, соответств... |
21.06.2024 | Он победил LLM RAG: реализуем BM25+ с самых азов | Привет, меня зовут Борис. Я автор телеграм канала Борис опять. Периодически мне на глаза попадается что-то интересное и я глубоко в этом закапываюсь. В данном случае это алгоритм поиска BM25+.
Статья началась с того, что я наткнулся на гром... |
19.06.2024 | «Как искусственные нейросети помогают в поиске любви: опыт использования для фильтрации анкет в дейтинг-приложении... | Девушка мечты ("представление" YandexART)
Заметили сколько новостей и статей начало выходить с упоминанием нейросетей и дейтинг приложений в одном тексте? Возможно научить нейросеть фильтровать анкеты в дейтинг сервисе? Помогает э... |
18.06.2024 | Pandas НЕ для анализа данных | Введение
В среде питонистов библиотека Pandas пользуется большой популярностью и по большей мере известна в контексте DataSciense и анализа данных. Как следует из русскоязычной википедии: "pandas — это программная библиотека на языке P... |
18.06.2024 | Про что могут спросить аналитика данных о статистике на интервью: 3 темы | Привет, Хабр!
Когда проходит собес на позицию аналитика данных, одна из важных проверок - это знания по статистике. Компании хотят убедиться, что вы понимаете статистику и умеете применять ее на практике для принятия решений на основе данны... |
17.06.2024 | NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей | Привет, Хабр! Меня зовут Иван, я Data Science специалист SimbirSoft. Я расскажу, как на одном из проектов мы занимались прогнозированием на месяц вперед с помощью методов NLP, Catboost и тематического моделирования на новостном потоке.
Один... |
14.06.2024 | Лучшие библиотеки Python для Data Science в 2024 году | Python — один из самых распространенных языков программирования в Data Science (третье место в опросе разработчиков StackOverflow). Популярность языка обусловлена наличием множества пакетов, которые можно использовать для решения различных ... |
12.06.2024 | Временные ряды и ARIMA: Как предсказывать будущее без хрустального шара | Часть 1
Что такое временной ряд, модель ARIMA и как к ней подбирать параметры.
Временной ряд — собранный в разные моменты времени статистический материал о значении каких-либо параметров (в простейшем случае одного) исследуемого процесса. (... |
07.06.2024 | Повышаем интерпретируемость SHAP-графиков | Привет, Хабр! В моей работе часто возникают задачи на исследование влияния факторов, на которые мы можем оказывать продуктовое влияние, на целевые метрики сообществ ВКонтакте. Один из возможных способов решения подобных задач — обучение ML‑... |