Date | Title | Description |
31.10.2024 | The Rise of AI-Powered Drone Technology in Railway Safety | In the realm of modern technology, drones are the new eyes in the sky. They hover above, capturing images with precision that rivals the best cameras. This innovation is not just for breathtaking landscapes or thrilling aerial shots. It’s m... |
30.10.2024 | Распознавание ж/д пикетных столбиков по фотографиям с беспилотника на основе PyTorch и YOLOv5 | Тенденция применения беспилотных летательных аппаратов (БПЛА) продолжает развиваться и процветать. Оснащение беспилотников камерами и навигационным оборудованием геодезического класса точности позволяет получать ортофотопланы с сантиметрово... |
24.10.2024 | Государственные перевороты: бармалеи выпрыгивают как черти из табакерки. Не хотите, дети, в Африку сыграть? | На исторических данных за 1991-2019 год покажем, как можно "увидеть" и "выцепить" признаки переворота. С помощью машинного обучения и ансамблевых модели. Ансамбли (конечно, не музыкальные), как показывает практика, – бол... |
23.10.2024 | Книга: «Causal Inference на Python. Причинно-следственные связи в IT-разработке» | Привет, Хаброжители!
Причинно-следственный анализ — одна из важнейших методологий современной науки о данных (data science), однако между теорией и практикой сохраняется большой пробел. Матеуш написал лучшую на сегодняшний день книгу, котор... |
22.10.2024 | The Rise of Automation: Simplifying Your Digital Workspace with WorkStarter | In the digital age, efficiency is king. Every second counts. Enter WorkStarter, a utility designed to streamline your Windows experience. This tool is like a personal assistant, ready to launch your favorite applications and websites the mo... |
21.10.2024 | Может ли простейшая нейросеть найти математическую закономерность в данных? | В этой небольшой статье мы научим нейросеть решать задачу умножения перестановок длины 5 (группа ) и визуализируем результаты обучения с помощью методов проекции t-SNE (и понизим размерность PCA) и алгоритма UMAP. Мы убедимся в том, что даж... |
16.10.2024 | Navigating the Digital Cinema Landscape: A DIY Movie Recommendation System | In the age of streaming, choosing a movie can feel like searching for a needle in a haystack. With countless options available, how do you find that perfect film? This article explores a DIY approach to creating a movie recommendation syste... |
15.10.2024 | The Art of Sorting: More Than Just Order | Sorting is like a magician's trick. At first glance, it seems simple. You click a button, and voilà! Everything is in order. But beneath the surface lies a complex world of algorithms and data structures. Sorting is not just about arranging... |
15.10.2024 | Рекомендатель кино или как я писал свое DIY-решение для поиска новых фильмов | Вечер. Пересматриваю «Пятницу 13». Не люблю пересматривать фильмы, даже хорошие. Но выбрать интересное кино из потока новинок сложно. Поэтому мне захотелось написать свой рекомендатор кино. Этим и займусь в выходные.
В статье покажу, что по... |
14.10.2024 | Её величество Сортировка | Сначала кажется, что сортировка - это тривиально. В Excel жмешь "Sort Smallest to Largest" и все хорошо. Ну или sorted() в питоне. Всё само делается.
Серьезное знакомство с сортировкой у меня произошло на курсах Яндекс.Практикума ... |
12.10.2024 | Линейная регрессия и её регуляризация в Scikit-learn | В этой статье мы рассмотрим модели линейной регрессии, доступные в scikit-learn. Обсудим, что такое регуляризация, на примерах Ridge, Lasso и Elastic Net, а также покажем, как эти методы можно реализовать на Python.
Создание модели линейной... |
11.10.2024 | Hacking Hardware with a Lighter: A Journey into Electromagnetic Fault Injection | In the world of hacking, creativity is key. The tools of the trade can be as simple as a lighter. Yes, a common barbecue lighter can become a powerful weapon in the hands of a skilled hacker. This article explores the fascinating realm of e... |
11.10.2024 | The Power of PL/Python: Enhancing PostgreSQL with Python Magic | In the world of databases, PostgreSQL stands tall. It’s robust, reliable, and loved by developers. But what if you could supercharge it? Enter PL/Python. This powerful extension merges the strengths of PostgreSQL with the versatility of Pyt... |
11.10.2024 | The Fusion of PostgreSQL and Python: A New Era in Database Management | In the realm of database management, PostgreSQL stands tall as a robust and versatile system. Now, with the introduction of PL/Python, it has evolved into a powerhouse that combines the best of both worlds: the reliability of SQL and the fl... |
09.10.2024 | Усиление PostgreSQL с помощью PL/Python | Привет, Хабр!
Сегодня мы прокачаем PostgreSQL, добавив в него Python. А именно — PL/Python. Это расширение позволяет писать функции на Python прямо внутри базы данных. Лично для меня это как объединение двух лучших миров: любимого PostgreSQ... |
07.10.2024 | The Art of Data Preprocessing in Machine Learning: A Crucial Step for Success | In the world of machine learning, data is the lifeblood. But raw data is often messy, like a canvas splattered with paint. Before we can create a masterpiece, we must first clean it up. This process is known as data preprocessing. It’s the ... |
07.10.2024 | Предварительная обработка данных в машинном обучении: инструкция, инструменты, полезные ресурсы для начинающих... | В статье рассказываем, зачем обрабатывать данные перед загрузкой в модель, как провести предобработку и какие инструменты использовать.
Мария Жарова
Data Scientist, Альфа-БанкЧто такое предобработка данных
Предобработка — это подготовка наб... |
26.09.2024 | Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Начало | В первой главе исследования был описан набор данных с временными рядами о погоде, который мы будем использовать для выполнения задачи прогнозирования температуры, а также были приведены шаги по его предварительной подготовке.
В данной главе... |
25.09.2024 | The Eye of Technology: How Computer Vision is Revolutionizing Medicine | In the realm of medicine, the marriage of technology and healthcare is akin to a symphony, where each note plays a crucial role in creating harmony. One of the most compelling instruments in this orchestra is computer vision (CV). This tech... |
25.09.2024 | Unlocking the Future: Affordable Data Solutions for Everyone | In a world where data reigns supreme, having the right tools is crucial. The digital landscape is evolving rapidly. Businesses and individuals alike are searching for ways to harness the power of data science and secure their information. F... |
25.09.2024 | Unlocking Potential: Affordable Tools for the Modern Professional | In today's fast-paced world, efficiency is the name of the game. Professionals need tools that empower them to work smarter, not harder. Two standout offerings have emerged recently: the Afirstsoft AI PDF Editor and the 2024 Data Science &a... |
24.09.2024 | CV в медицине: как компьютерное зрение помогает лечить болезни | Компьютерное зрение, или CV, — общее название для множества технологий распознавания изображений: выделения объектов, сравнения лиц или оценки того, что происходит на снимке. Эти технологии используются не только в графических редакторах и ... |
24.09.2024 | Harness the Power of Data Science & Machine Learning from Home | TL;DR: The 2024 Data Science & Machine Learning Bundle is available for just $39.99 (reg. $269) and includes comprehensive training to build your AI and data science skills.
With most things in life, flexibility is key, and that’s espec... |
24.09.2024 | Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава первая | После перерыва продолжаю цикл статей про одно из самых интересных направлений в статистике и науке о данных — прогнозировании временных рядов (или рядов динамики, как их первоначально называли в учебниках по эконометрике). Эта работа будет ... |
20.09.2024 | DBS Bank: Pioneering AI in Banking | In the bustling financial landscape of Asia, DBS Bank stands out as a beacon of innovation. Recently, Harvard Business School (HBS) published a case study that delves into DBS's ambitious journey with Artificial Intelligence (AI). This mark... |
20.09.2024 | Navigating the Venture Capital Landscape: Legal Strategies for Success | In the fast-paced world of venture capital (VC), the stakes are high. Investors seek to fund the next big innovation, while startups aim to turn their visions into reality. However, the road to success is fraught with risks. Understanding t... |
19.09.2024 | Топ-5 библиотек для анализа данных на Python | Python — один из самых популярных языков для анализа данных благодаря множеству удобных и эффективных библиотек. Эти инструменты помогают обрабатывать, анализировать и визуализировать данные, делая вашу работу быстрее и проще.
Преподаватель... |
18.09.2024 | The Rise of Open Source in Russia: A New Era for Machine Learning and Data Analysis | In the vast landscape of technology, open source is a beacon of collaboration. It invites innovation and democratizes access to tools that drive progress. Recently, a study by ITMO University has shed light on the state of open source in Ru... |
17.09.2024 | The Rise of AI-Driven Text Generation: A Dive into Markov Chains and Telegram Bots | In the digital age, artificial intelligence (AI) is the new frontier. It’s like a vast ocean, teeming with possibilities. Among the many tools in this ocean, Markov chains stand out as a simple yet powerful method for generating text. This ... |
17.09.2024 | ИТМО провёл исследование open source в сферах машинного обучения и анализа данных | Специалисты центра «Сильный ИИ в промышленности» при ИТМО опубликовали результаты исследования особенностей и направления развития опенсорс-сообщества в сфере машинного обучения и анализа данных в России. В лидерах российского опенсорса ока... |
16.09.2024 | Теорема о разбиении регрессоров: делаем CUPED аб-тесты в один шаг | Хай!
Пишу эту статью для тех, кто уже знаком с CUPED, но ищет больше понимания этого метода и взгляда на него с другой стороны. Здесь я не буду детально объяснять базовый алгоритм CUPED аб-тестирования: про это уже достаточно материала в се... |
16.09.2024 | Цепи Маркова в Telegram-боте | Рано или поздно я должен был начать писать статьи для хабра.
Привет, меня зовут Александр и я жёсткая самоучка в области искусственного интеллекта (ИИ). 5 лет назад я задался целью создать сильный искусственный интеллект (СИИ).
Наглядный пр... |
13.09.2024 | Пошаговое руководство по созданию синтетических данных в Python | Простое руководство для новичков: как самому генерировать данные для анализа и тестирования
Представьте: вы только что написали модель машинного обучения и вам нужно протестировать её работу в конкретном сценарии. Или вы собираетесь опублик... |
10.09.2024 | Раскрываем секреты роя: оптимизация на Python с помощью PSO | Начну с небольшой шутки:
"Знаете ли вы, что до изобретения часов людям приходилось активно ходить повсюду и спрашивать время?"
Этот незамысловатый анекдот иллюстрирует важную концепцию: информация, доступная одному члену группы, м... |
09.09.2024 | Эхо Дайджест: Железо, Python, ИИ, Raspberry Pi | Железные новостиРоссия
В Зеленограде запускается образовательная программа по аппаратному программированию на отечественном микроконтроллере MIK32 Амур для школьников 7-11 классов, направленная на подготовку будущих специалистов в радиоэлек... |
07.09.2024 | Знакомимся с линейной алгеброй в NumPy | Библиотека NumPy для Python — это основа науки о данных и биоинформатики. При этом, хоть каждому программисту Python и знакомо имя пакета для установки:
pip install numpy
и команда импорта библиотеки:
import numpy as np
в практических задач... |
30.08.2024 | Школьники и нейросети: как разработать искусственный интеллект на Python для детей | Кто сегодня не слышал о нейросетях? Таких людей практически не осталось. Популярность технологий ИИ выросла настолько, что слово «нейросеть» было объявлено словом 2023 года. В последние несколько лет узнаваемость и востребованность таких те... |
22.08.2024 | The Power of "Grok" Series: Simplifying Complex Concepts in Tech | In the vast ocean of technology literature, the "Grok" series from Piter Publishing stands out like a lighthouse. It illuminates the often murky waters of complex subjects such as algorithms, machine learning, and programming. Wit... |
21.08.2024 | Серия книг “Грокаем” от издательства “Питер” | Привет, Хаброжители!
Сегодня вышла новая книга “Грокаем алгоритмы. 2-е издание”, в связи с чем мы решили рассказать о всей серии “Грокаем”.
А заодно подарить скидку!
Чем хороши “Грокаем”? Каждая книга яркая и оставляющая след. Важная особен... |
20.08.2024 | Revolutionizing Traffic Management: The Quest for Intelligent Traffic Lights | Traffic lights are the unsung heroes of urban life. They orchestrate the flow of vehicles, yet many are stuck in the past, relying on outdated timers. This inefficiency leads to congestion, frustration, and wasted time. But what if traffic ... |
19.08.2024 | Создание оптимального алгоритма переключения светофора на перекрестке | Введение в область
Каждый из нас хоть раз в жизни сталкивался с плохой работой светофора на перекрестке: неравномерное движение трафика по нему, слишком долгие интервалы переключения и т. д. Всё это из‑за наивного способа переключения «зеле... |
17.08.2024 | Матрица Вандермонда | Введение
Александр Теофил Вандермонд (28 февраля 1735 - 1 января 1796) - французский музыкант и математик, известный благодаря своей работе в области высшей алгебры.
Главным увлечением Вандермонда длительное время была лишь музыка, но к 35-... |
15.08.2024 | Феномен Рунге | Введение
Карл Давид Тольме Рунге (30 августа 1856 - 3 января 1927) - выдающийся немецкий математик, физик и спектроскопист. Обучался в Берлинском университете, где получил степень PhD, являлся профессором математики в Ганноверском университ... |
13.08.2024 | The Rise of the Sixth Data Platform: A New Era in Data Management | In the fast-paced world of technology, data is the new oil. It fuels decisions, drives innovation, and shapes industries. As we stand on the brink of a new era, the concept of the "sixth data platform" emerges as a beacon of hope ... |
09.08.2024 | Financial Data Analysts: Making Sense of Big Data in FinTech | Share
Tweet
Share
Share
Email
Financial technology, or FinTech, data is the new gold. Companies are increasingly relying on vast amounts of data to make informed decisions, drive innovation, and maintain a competitive edge. This influx of d... |
01.08.2024 | Введение в MLflow | MLflow - это инструмент для управления жизненным циклом машинного обучения: отслеживание экспериментов, управление и деплой моделей и проектов. В этом руководстве мы посмотрим, как организовать эксперименты и запуски, оптимизировать гиперпа... |
30.07.2024 | Кто такой Python-разработчик, что делает и какие навыки необходимы? | Разработчик Python / Python developer — это программист(developer), занимающийся разработкой программного обеспечения с использованием языка программирования Python.
Python — это высокоуровневый язык, широко применимый в разных сферах: от в... |
28.07.2024 | Часть 2. Алгоритм Тарьяна для приведения нелинейной системы уравнений к вычисляемой последовательности подстановок... | Это вторая часть статьи, посвященную вопросу применения алгоритма Тарьяна для решения систем уравнений. В первой части рассматривалась проблема поиска минимального набора уравнений, из неё нам понадобится только несколько определений.
Тепер... |
27.07.2024 | Navigating the Digital Frontier: TCP/IP and Bayesian Modeling on IBM Mainframes and Python | In the world of technology, two realms stand out: the robust architecture of IBM mainframes and the fluidity of Python programming. Both have their unique languages, their own protocols, and their intricate dance of data. Let’s dive into th... |
26.07.2024 | PyMC3: байесовское моделирование и прогнозирование в Python | Привет, Хабр!
Сегодня мы рассмотрим то, как реализовать байесовское моделирование и прогнозирование с использованием замечательной библиотеки PyMC3.
Байесовские методы - подход к статистическому моделированию, который включает в себя оценку... |
25.07.2024 | DuckDB: The New Powerhouse for Data Engineering**
** | ** In the vast ocean of data management tools, DuckDB emerges as a sleek, agile vessel. This columnar database is designed for analytical workloads, making it a go-to choice for data engineers. With its recent stable release, version 1.0.0,... |
19.07.2024 | Делаем новых людей за 12 строк кода: как с Python ускорить подготовку демо-стенда по HR планированию и соблюсти закон... | Привет, меня зовут Максим Бритвин, и я старший консультант-разработчик. Вот уже почти 10 лет я занимаюсь внедрением и доработкой проектов бюджетирования на платформе Oracle Hyperion, в частности интеграцией данных между Hyperion и различным... |
19.07.2024 | Всё что нужно знать про DuckDB | Оглавление
SQL
Copy
Prepared Statements
Functions
Extensions
PostgreSQL Extension
Parquet
Parquet Import
Parquet Export
Buena Vista
Практика
Installation
Client API Python
In-memory
Physical database
Result Conversion
Data Input
Установка в... |
16.07.2024 | Бутстрап и доверительные интервалы: от теории к практике на Python | Введение
Применение
Ограничения
Схема бутстрапа
Эфронов доверительный интервал
Доверительный интервал Холла
t-процентильный доверительный интервал
Реализация на Python
Проблемы
ПримечанияВведение
Бутстрап — это вычислительный статистический... |
15.07.2024 | Использование моделей EfficientNet для классификации изображений | Искусственные нейронные сети (ИНС) — мощный инструмент в области компьютерного зрения, особенно в задачах классификации изображений. Эта область применения была одной из первых, для которой ИНС были разработаны. Например, перцептрон Розенбл... |
10.07.2024 | 10 библиотек Python для машинного обучения — подборка для начинающих | Составили список самых важных библиотек Python для машинного обучения и рассказали, для каких задач они могут быть полезны начинающим ML-инженерам и специалистам по Data Science. Собрать подборку помог Кирилл Симонов — ML-разработчик компан... |
03.07.2024 | Декодирование Витерби с TensorFlow | Привет, Хабр!
Алгоритм был предложен Эндрю Витерби в 1967 году для декодирования сигналов с кодировкой, используемой в системах связи.
Алгоритм Витерби предназначен для поиска наиболее вероятной последовательности скрытых состояний в моделя... |
01.07.2024 | Aqueduct: Как мы экономим железо для МЛ-вычислений | Привет! Меня зовут Олег Бугримов, я руковожу разработкой в команде Data Science SWAT в Авито. Мы занимаемся инженерией для машинного обучения. Одно из направлений - это оптимизация продового инференса. Наша задача чтобы модельки работали бы... |
28.06.2024 | Основы теории вероятностей для будущих программистов и дата-аналитиков | Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.
Вместе с Ильей Котовым, спе... |
27.06.2024 | Разделяй и запускай: делим тестовый стенд между департаментами | Промышленное математическое программирование - тема раскрученная в академической среде для стандартизированных случаев, но детали реальных внедрений раскрываются редко и спустя много лет.
В настоящей статье делюсь опытом разработки и внедре... |
25.06.2024 | Книга: «Тюнинг систем: экспериментирование для инженеров от A/B-тестирования до байесовской оптимизации» | Привет, Хаброжители!
Работает ли программа так, как следует? Изменения сделали систему лучше или хуже? Стоит ли заниматься повышением производительности вместо разработки нового функционала? На подобные вопросы можно ответить только с помощ... |
21.06.2024 | Он победил LLM RAG: реализуем BM25+ с самых азов | Привет, меня зовут Борис. Я автор телеграм канала Борис опять. Периодически мне на глаза попадается что-то интересное и я глубоко в этом закапываюсь. В данном случае это алгоритм поиска BM25+.
Статья началась с того, что я наткнулся на гром... |
19.06.2024 | Работа с YOLOV8. Детекция, сегментация, трекинг объектов, а также подготовка собственного датасета и обучение | Если вам кажется, что начать работу с нейросетями - это сложно, то этот материал для вас!
Итак, YOLO (You Only Look Once) — нейронная сеть, предназначенная работы с объектами на изображениях и может решать следующие задачи:
Детекция - обнар... |
19.06.2024 | SARIMAX vs Экспоненциальное сглаживание: Когда простота побеждает | В прошлом посте я рассказывала про свои мучения с моделькой ARIMA. Здесь же я расскажу о следующей серии издевательств над временными рядами, SARIMAX и экспоненциальным сглаживанием.
Для начала хочу исправить косяки прошлой статьи и прогово... |
19.06.2024 | «Как искусственные нейросети помогают в поиске любви: опыт использования для фильтрации анкет в дейтинг-приложении... | Девушка мечты ("представление" YandexART)
Заметили сколько новостей и статей начало выходить с упоминанием нейросетей и дейтинг приложений в одном тексте? Возможно научить нейросеть фильтровать анкеты в дейтинг сервисе? Помогает э... |
18.06.2024 | Про что могут спросить аналитика данных о статистике на интервью: 3 темы | Привет, Хабр!
Когда проходит собес на позицию аналитика данных, одна из важных проверок - это знания по статистике. Компании хотят убедиться, что вы понимаете статистику и умеете применять ее на практике для принятия решений на основе данны... |
17.06.2024 | Релиз NumPy 2.0.0 | 16 июня 2024 года состоялся релиз стабильной версии Python-библиотеки для научных вычислений NumPy 2.0.0. Это первый значительный релиз открытого проекта с 2006 года. Новая версия NumPy включает в себя новые возможности и оптимизации произв... |
17.06.2024 | NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей | Привет, Хабр! Меня зовут Иван, я Data Science специалист SimbirSoft. Я расскажу, как на одном из проектов мы занимались прогнозированием на месяц вперед с помощью методов NLP, Catboost и тематического моделирования на новостном потоке.
Один... |
12.06.2024 | Временные ряды и ARIMA: Как предсказывать будущее без хрустального шара | Часть 1
Что такое временной ряд, модель ARIMA и как к ней подбирать параметры.
Временной ряд — собранный в разные моменты времени статистический материал о значении каких-либо параметров (в простейшем случае одного) исследуемого процесса. (... |
07.06.2024 | Где лучше всего пробовать идеи для обучающихся систем? | Для того, чтобы разобраться в сложной и объемной теме машинного обучения, попробовать свои силы и отточить навыки, оптимально подходит библиотека scikit-learn (sklearn). Это среда языка Python, она реализует множество различных алгоритмов о... |
07.06.2024 | Повышаем интерпретируемость SHAP-графиков | Привет, Хабр! В моей работе часто возникают задачи на исследование влияния факторов, на которые мы можем оказывать продуктовое влияние, на целевые метрики сообществ ВКонтакте. Один из возможных способов решения подобных задач — обучение ML‑... |
03.06.2024 | The 5 Best Udemy Courses That Are Worth Taking in 2024 | Udemy is an online course platform where professionals and aspiring workers can find training on a wide variety of subjects. Here are five of the best Udemy courses for workers in the tech field who want to start new careers or add new skil... |
28.05.2024 | Учим нейронную сеть генерировать текст | Автор статьи: Виктория Ляликова
Всем привет!
На волне популярности различных нейросетевых моделей, позволяющих генерировать связный текст, отвечающих на вопросы и позволяющих вести беседы, хотелось бы рассмотреть вопрос о том, а что вообще ... |
27.05.2024 | Быстрая Data Quality проверка на базе алгоритма adversarial validation | Привет, Хабр! Всем привет, меня зовут Максим Шаланкин, я Data Science Team Lead в команде Финтеха Big Data МТС. Из этой статьи вы узнаете, как оценивать качество данных при помощи алгоритма adversarial validation с использованием spark user... |
25.05.2024 | Спустя 18 лет: новая версия NumPy 2.0 выходит 16 июня | 16 июня 2024 года выходит новая версия всеми любимой библиотеки. NumPy 2.0.0 — первый значительный релиз с 2006 года. Релиз включает множество новых функций и изменений как в Python, так и в C API.
В числе новых функций NumPy 2.0 новый дина... |
22.05.2024 | Распознавание капчи при помощи CNN модели | Привет, Хабр!
Хочу поделиться своим опытом предобработки картиной с капчей и созданием модели, которая может определить, что же за символы в этой картинке. Код с архитектурой модели и обучением тоже будет, но основной упор часть с предобраб... |
21.05.2024 | Основные алгоритмы многоруких бандитов в рекомендательных системах | Привет, Хабр!
Рекомендательные системы становятся все более сложными и точными, а методы их реализации разнообразнее. Один из хороших подходов в этой области - это алгоритмы, основанные на проблеме многоруких бандитов. Эти алгоритмы позволя... |
21.05.2024 | Переехать ближе к работе или сэкономить: что выбрать IT-джуну? | Об авторе
Приветствую вас! Меня зовут Эрик, и я хочу поделиться своим личным опытом и знаниями. Я практикующий дата-сайентист, имеющий успешный опыт участия и судейства в чемпионатах по прогнозированию, а также аналитик-исследователь, котор... |
20.05.2024 | Алгоритмы разбора результата распознавания рукописного текста для анкет | Одним из первых моих проектов было распознавание рукописных анкет и перевод их в формат Excel для загрузки в CRM в качестве лидов. Сейчас анкеты обрабатываются операторами, в пиковом сезоне время обработки достигает трех недель. За это врем... |
19.05.2024 | А/В эксперименты. Ускорение вычислений с помощью бакетизации | Введение
В современном мире больших данных и высокопроизводительных вычислений оптимизация времени выполнения алгоритмов играет ключевую роль. Одним из эффективных методов ускорения вычислений является бакетизация данных.
В данной статье мы... |
18.05.2024 | Решаем простую статистическую задачу пятью способами | Вот тут ув. @dimview на пальцах и Си объясняет за бутстрап решая несложную задачу. И в статистике существует 100500 разных тестов для (не)подтверждения нулевой гипотезы.
Давайте используем ряд самых распространеных и посмотрим на результаты... |
11.05.2024 | На Commodore 64 запустили ИИ-генератор изображений | Разработчик Ник Билд создал инструмент генеративного искусственного интеллекта для Commodore 64, который можно использовать для генерации изображений с разрешением 64x64. Одна генерация занимает 20 минут и требует 90 итераций.
Билд использо... |
10.05.2024 | Методы оптимизации в машинном и глубоком обучении. От простого к сложному | В данной статье представлен обзор различных популярных (и не только) оптимизаторов, которые применяются в машинном и глубоком обучении, в частности для обучения нейронных сетей. Мы рассмотрим их основную идею и ключевые особенности, переход... |
09.05.2024 | Шахматы. От начала до читов | Как-то пару лет назад youtube начал мне подсовывать шахматные видео. Смотрел их, и спустя какое-то время начал играть. Сначала против компа на телефоне, затем на lichess. В какой-то прекрасный вечер мне надоело проигрывать и задался вопросо... |
08.05.2024 | Удалённое исполнение кода в ML: подходы и инструменты. Доклад Яндекса | Всем привет. На связи Артём Гойлик @ArtoLord и Владислав Волох @Chillintano из команды DataSphere в Yandex Cloud. Мы создаём инфраструктуру для ML‑разработчиков. И сегодня расскажем про одну задачу, которая, как и многие другие, начиналась ... |
29.04.2024 | Как обнаружить и устранить мультиколлинеарность с помощью Statsmodels в Питоне | Привет, Хабр!
Мультиколлинеарность возникает, когда в модели множественной регрессии одна из независимых переменных может быть линейно предсказана с помощью других независимых переменных с высокой степенью точности. Это явление приводит к т... |
27.04.2024 | Анализ мощности статистических критериев с использованием бакетизации | Аннотация
В данной статье рассматривается влияние бакетизации на мощность статистических критериев в условиях различных распределений данных и при разном объеме выборки. Особое внимание уделено зависимости мощности критерия от количества ба... |
27.04.2024 | Начните учиться бесплатно на курсе «Python для анализа данных» в Яндекс Практикуме | Мы добавили бесплатный вводный модуль к курсу «Python для анализа данных», чтобы вы могли познакомиться с площадкой и направлением. Модуль состоит из теоретической и практической части — в конце вы сможете запустить пример кода в интерактив... |
24.04.2024 | Пишем «Змейку» в 12 строк кода на PyTorch | Привет, Хабр! 🖖🏻
Меня зовут Олег Булыгин, я data scientist, аналитик, автор и спикер IT-курсов.
Иногда я перевожу разнообразные туториалы и руководства для начинающих, котороми бы хотел поделиться с вами :)
Давайте рассмотрим, как использов... |
23.04.2024 | Подглядывание в A/B тестах: как не потерять достоверность данных | Привет, Хабр!
A/B тестирование позволяет принимать обоснованные решения о том, какие функции или изменения наилучшим образом способствуют улучшению пользовательского опыта и повышению конверсии. Однако, несмотря на кажущуюся простоту провед... |
22.04.2024 | Линеаризация: зачем и как укрощать ratio-метрики в A/B-тестах | Привет, Хабр! В прошлой статье я указал, что в A/B-тестах используются три основных типа метрик, а именно пользовательские конверсии, средние метрики пользователей и ratio-метрики. К последним обычно относят средний чек, CTR баннера, средню... |
20.04.2024 | NumPy для самых маленьких | Математика везде в нашей жизни, но в программировании, а особенно ML ее два раза больше. Обычно Питон берут в пример самого "научного" языка программирования из-за математических фреймворков. Как не Питон может помочь оперировать ... |
20.04.2024 | ГАЙД по python стеку для Data Science инженеров | Data science - это область, которая занимается изучением и анализом больших объемов данных, чтобы находить в них полезные закономерности, делать прогнозы или принимать решения на основе фактов. В основе data science лежат методы и инструмен... |
19.04.2024 | Как аппроксимировать любую функцию с помощью PyTorch | При анализе данных и построении моделей машинного обучения часто возникает необходимость аппроксимировать сложные функции. PyTorch предоставляет удобные инструменты для создания и обучения нейронных сетей, которые могут быть эффективно испо... |
18.04.2024 | T-test. Зависимость от независимости | Привет, Хабр! Теме А/Б-тестирования посвящено достаточно много статей, и вот держите ещё одну. Тема экспериментов для выявления эффективности внедрения доработок популярна не только последний год и она, скорее всего, освещена уже со всех во... |
17.04.2024 | Определение жанра фильма по описанию | Автор статьи: Олег Блохин
Выпускник OTUS
В ходе поиска темы проектной работы, которой должен был завершиться курс Machine Learning. Professional, я решил поэкспериментировать с данными о фильмах, мультфильмах, сериалах и прочей схожей проду... |
07.04.2024 | Python для анализа годовых температур в Москве | Python - это мощный язык программирования, который широко используется в области анализа данных, включая анализ погодных данных. Давайте на примере анализа годовых температур в Москве разберемся как с его помощью можно выгрузить, предобрабо... |
03.04.2024 | Парадоксы в данных, и почему визуализация бывает необходима | В этой заметке я хочу разобрать несколько «парадоксов» в данных, о которых полезно знать как начинающему аналитику данных, так и любому человеку, кто не хочет быть введенным в заблуждение некорректными статистическими выводами.
За рассматри... |
01.04.2024 | Кратко про алгоритм обучения Q-learning и как он реализуется в Python для новичков | Привет, Хабр!
Q-learning — это алгоритм обучения с подкреплением, который позволяет агенту оптимизировать свою стратегию действий в динамичной среде, стремясь максимизировать сумму будущих наград. Агент исследует среду, принимая решения, ос... |
30.03.2024 | Линейная регрессия. Основная идея, модификации и реализация с нуля на Python | В машинном и глубоком обучении линейная регрессия занимает особое место, являясь не просто статистическим инструментом, но а также фундаментальным компонентом для многих более сложных концепций. В данной статье рассмотрен не только принцип ... |