Date | Title | Description |
08.01.2025 | Открытые книги по ML и работе с данными | Мы регулярно публикуем подборки литературы для специалистов: делали дайджест книг для желающих поближе познакомиться с Postgres и Kubernetes. Сегодня на очереди справочники и пособия по машинному обучению, которые можно найти в открытом дос... |
01.01.2025 | Как улучшить влажность в квартире: проверяем на практике | Введение
Тема влажности воздуха помещения в зимний период это особенная тема для обсуждения в наших широтах. Воздух холодный, сухой, влажность в жилых помещениях падает в зимний период. Кто-то без проблем переносит изменение климатических у... |
30.12.2024 | Изобретаем polimer — фреймворк на Python для ускорения разработки научных прототипов | Еще с третьей версии в Python появились аннотации типов, которые можно использовать в качестве комментариев к аргументам функций, для статического анализа и поиска ошибок или даже перегрузки методов в зависимости от типов аргументов. Помимо... |
14.12.2024 | The Evolution of Search Technologies: From Text to Machine Learning | In the digital age, the quest for information resembles a treasure hunt. Users seek answers, and search engines are the maps guiding them. The evolution of search technologies has transformed this hunt from a tedious task into a swift, effi... |
14.12.2024 | Navigating the Complexities of Data Clustering and Probability Assessment in Machine Learning | In the vast ocean of data, clustering and probability assessment are two islands that stand out. Each has its own unique landscape, challenges, and tools. Understanding these concepts is crucial for anyone navigating the waters of machine l... |
12.12.2024 | Фрактальная размерность: что это и как вычислить | Фрактальная размерность описывает сложность объектов, которые нельзя измерить обычными параметрами, такими как длина или площадь. Например, снежинка при увеличении не становится проще — каждая ее деталь открывает еще более мелкие элементы. ... |
11.12.2024 | Случайные разрезы данных в задаче кластеризации: коротко | Кластеризация — штука сложная. Вроде все просто: сгруппировать похожее с похожим. Но когда данных вагон, а структура запутаннее клубка проводов за столом, стандартные методы вроде k‑means или DBSCAN начинают сдавать позиции. Особенно больно... |
07.12.2024 | The Silent Architects of Our Genome: Unraveling the Mysteries of Non-Coding DNA | In the vast landscape of genetics, non-coding DNA often plays the role of the overlooked artist, painting the intricate details of gene expression without ever stepping into the spotlight. This seemingly redundant DNA occupies nearly half o... |
04.12.2024 | Когда «тихая» ДНК громче гена: как избыточная ДНК регулирует экспрессию, ничего не делая | Мир биоинформатики полон загадок: что такое избыточная ДНК, почему она занимает половину генома, и как это вообще работает? Кому-то может показаться, что некодирующая ДНК — это просто лишний «хлам», но на деле это, как если бы в вашем коде ... |
19.11.2024 | The Art and Science of Measuring Filament Thickness and the Ulam Spiral | In the world of technology and mathematics, precision and beauty often intertwine. Two seemingly disparate topics—measuring filament thickness and the Ulam spiral—offer a glimpse into this fascinating intersection. One is a practical applic... |
19.11.2024 | Красивые картинки на скатерти Улама | Скатерть Улама и тонкая структура простоты чисел . Очень много больших картинок
Скатерть Улама
( https://ru.wikipedia.org/wiki/Скатерть_Улама https://en.wikipedia.org/wiki/Ulam_spiral )
это очень красивое и наглядное представление структуры... |
16.11.2024 | Top Tips for Analyzing Export and Import Data for Global Trade Success | Share
Tweet
Share
Share
Email
Globally trading companies depend on the analysis of export import data and customs data. This analysis offers insightful perspectives on competitor environments, demand and supply dynamics, and market trends. ... |
15.11.2024 | Harnessing Dask and Heatmaps for Data Analysis: A Dual Approach | In the realm of data analysis, two powerful tools stand out: Dask for time series analysis and heatmaps for game level optimization. Each serves a unique purpose, yet both share a common goal: transforming raw data into actionable insights.... |
15.11.2024 | Navigating the Skies: The Future of Drone Mapping and Game Design Analytics | In the realm of technology, innovation often emerges from necessity. Two recent articles shed light on this phenomenon, one focusing on drone mapping and the other on game design analytics through heatmaps. Both highlight the importance of ... |
15.11.2024 | Navigating the Skies: The Evolution of Drone Mapping with Litchi Add-ons | In the world of drone technology, efficiency is king. Pilots crave tools that simplify complex tasks. Enter Litchi, a popular app for drone flight planning. It’s like a Swiss Army knife for aerial photography. But what happens when it falls... |
15.11.2024 | Дополнение к Litchi | Почитав эту статью: https://habr.com/ru/articles/684858 (особенно заинтересовали Waypoints) и обзаведясь коптером DJI, пришел к выводу - да, классно, здорово, но не удобно. Если стоит задача облететь и снять видео поля площадью пару десятко... |
14.11.2024 | Руководство по heatmap для анализа игрового уровня | Привет, Хабр! В этой статье мы разберемся, как тепловые карты (heatmaps) могут стать мощным инструментом для анализа поведения игроков и оптимизации дизайна игровых уровней. Тепловые карты позволяют выявить скрытые закономерности в том, как... |
13.11.2024 | Dask для анализа временных рядов | Привет, Хабр!
Сегодня расскажем, как с помощью Dask можно анализировать временные ряды. С временными рядами всегда заморочек много: большие данные, сложные расчеты. Но Dask отлично с этим справляется.
Для начала установим Dask:
!pip install... |
03.11.2024 | Возможности функции scatterplot() библиотеки seaborn | Диаграмма рассеяния показывает взаимосвязь двух переменных в виде точек на графике. В библиотеке seaborn диаграммы рассеяния строятся функцией scatterplot().
Перейдём сразу к практике!
Для начала нам нужны данные, на которых мы будем "... |
31.10.2024 | The Rise of AI-Powered Drone Technology in Railway Safety | In the realm of modern technology, drones are the new eyes in the sky. They hover above, capturing images with precision that rivals the best cameras. This innovation is not just for breathtaking landscapes or thrilling aerial shots. It’s m... |
30.10.2024 | Распознавание ж/д пикетных столбиков по фотографиям с беспилотника на основе PyTorch и YOLOv5 | Тенденция применения беспилотных летательных аппаратов (БПЛА) продолжает развиваться и процветать. Оснащение беспилотников камерами и навигационным оборудованием геодезического класса точности позволяет получать ортофотопланы с сантиметрово... |
23.10.2024 | Книга: «Causal Inference на Python. Причинно-следственные связи в IT-разработке» | Привет, Хаброжители!
Причинно-следственный анализ — одна из важнейших методологий современной науки о данных (data science), однако между теорией и практикой сохраняется большой пробел. Матеуш написал лучшую на сегодняшний день книгу, котор... |
13.10.2024 | Изучаем известные алгоритмы сортировок | Цель данной лабораторной работы – посмотреть на алгоритмы с различной асимптотикой, научиться анализировать время работы алгоритмов и включать разные степени оптимизации.Сортировка пузырьком
Алгоритм:
Берём самый первый элемент массива и ср... |
12.10.2024 | Линейная регрессия и её регуляризация в Scikit-learn | В этой статье мы рассмотрим модели линейной регрессии, доступные в scikit-learn. Обсудим, что такое регуляризация, на примерах Ridge, Lasso и Elastic Net, а также покажем, как эти методы можно реализовать на Python.
Создание модели линейной... |
11.10.2024 | Unlocking the Power of Programming: Free Resources for Developers | In the fast-paced world of technology, knowledge is currency. Developers are always on the hunt for tools that sharpen their skills and enhance their craft. Two standout offers have emerged recently, promising to equip programmers with esse... |
10.10.2024 | Save $43.99! Get 'Modern Python Cookbook, Third Edition' for FREE | Python is the go-to language for developers, engineers, data scientists, and hobbyists worldwide. Known for its versatility, Python can efficiently power applications, offering remarkable speed, safety, and scalability.
Modern Python Cookbo... |
07.10.2024 | The Art of Data Preprocessing in Machine Learning: A Crucial Step for Success | In the world of machine learning, data is the lifeblood. But raw data is often messy, like a canvas splattered with paint. Before we can create a masterpiece, we must first clean it up. This process is known as data preprocessing. It’s the ... |
07.10.2024 | Предварительная обработка данных в машинном обучении: инструкция, инструменты, полезные ресурсы для начинающих... | В статье рассказываем, зачем обрабатывать данные перед загрузкой в модель, как провести предобработку и какие инструменты использовать.
Мария Жарова
Data Scientist, Альфа-БанкЧто такое предобработка данных
Предобработка — это подготовка наб... |
26.09.2024 | Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Начало | В первой главе исследования был описан набор данных с временными рядами о погоде, который мы будем использовать для выполнения задачи прогнозирования температуры, а также были приведены шаги по его предварительной подготовке.
В данной главе... |
25.09.2024 | The Eye of Technology: How Computer Vision is Revolutionizing Medicine | In the realm of medicine, the marriage of technology and healthcare is akin to a symphony, where each note plays a crucial role in creating harmony. One of the most compelling instruments in this orchestra is computer vision (CV). This tech... |
24.09.2024 | Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава первая | После перерыва продолжаю цикл статей про одно из самых интересных направлений в статистике и науке о данных — прогнозировании временных рядов (или рядов динамики, как их первоначально называли в учебниках по эконометрике). Эта работа будет ... |
19.09.2024 | Топ-5 библиотек для анализа данных на Python | Python — один из самых популярных языков для анализа данных благодаря множеству удобных и эффективных библиотек. Эти инструменты помогают обрабатывать, анализировать и визуализировать данные, делая вашу работу быстрее и проще.
Преподаватель... |
18.09.2024 | The Rise of Open Source in Russia: A New Era for Machine Learning and Data Analysis | In the vast landscape of technology, open source is a beacon of collaboration. It invites innovation and democratizes access to tools that drive progress. Recently, a study by ITMO University has shed light on the state of open source in Ru... |
17.09.2024 | ИТМО провёл исследование open source в сферах машинного обучения и анализа данных | Специалисты центра «Сильный ИИ в промышленности» при ИТМО опубликовали результаты исследования особенностей и направления развития опенсорс-сообщества в сфере машинного обучения и анализа данных в России. В лидерах российского опенсорса ока... |
17.09.2024 | Предсказываем солнечные затмения с помощью ~100 строк кода Python | 8 апреля 2024 года автор статьи, основатель и СЕО компании Modal Labs, Эрик Бернхардссон планировал посмотреть свое первое полное солнечное затмение. За день до этого ему пришла в голову идея — что, если попробовать рассчитать периодичность... |
13.09.2024 | Пошаговое руководство по созданию синтетических данных в Python | Простое руководство для новичков: как самому генерировать данные для анализа и тестирования
Представьте: вы только что написали модель машинного обучения и вам нужно протестировать её работу в конкретном сценарии. Или вы собираетесь опублик... |
10.09.2024 | Раскрываем секреты роя: оптимизация на Python с помощью PSO | Начну с небольшой шутки:
"Знаете ли вы, что до изобретения часов людям приходилось активно ходить повсюду и спрашивать время?"
Этот незамысловатый анекдот иллюстрирует важную концепцию: информация, доступная одному члену группы, м... |
07.09.2024 | Знакомимся с линейной алгеброй в NumPy | Библиотека NumPy для Python — это основа науки о данных и биоинформатики. При этом, хоть каждому программисту Python и знакомо имя пакета для установки:
pip install numpy
и команда импорта библиотеки:
import numpy as np
в практических задач... |
17.08.2024 | Матрица Вандермонда | Введение
Александр Теофил Вандермонд (28 февраля 1735 - 1 января 1796) - французский музыкант и математик, известный благодаря своей работе в области высшей алгебры.
Главным увлечением Вандермонда длительное время была лишь музыка, но к 35-... |
17.08.2024 | Интегрируем pandas с электронными таблицами: три способа | Открываем и сохраняем файлы Excel в pandas
Pandas идеально подходит для работы с табличными данными – он способен открывать файлы Excel и проводить внутри преобразования. Более того, сохранить датафрейм тоже можно в файл Excel. Это делает у... |
15.08.2024 | Феномен Рунге | Введение
Карл Давид Тольме Рунге (30 августа 1856 - 3 января 1927) - выдающийся немецкий математик, физик и спектроскопист. Обучался в Берлинском университете, где получил степень PhD, являлся профессором математики в Ганноверском университ... |
30.07.2024 | Кто такой Python-разработчик, что делает и какие навыки необходимы? | Разработчик Python / Python developer — это программист(developer), занимающийся разработкой программного обеспечения с использованием языка программирования Python.
Python — это высокоуровневый язык, широко применимый в разных сферах: от в... |
27.07.2024 | Navigating the Waters of Automated Trading: A Newbie's Journey | In the vast ocean of financial markets, many dream of sailing smoothly toward wealth. Automated trading, or algorithmic trading, is one vessel that promises to navigate these waters efficiently. However, for newcomers, the journey can be fr... |
26.07.2024 | Newbee торговый бот: часть вторая, скрининг рынка облигаций ОФЗ | После того как ко мне пришло небольшое понимание того, как минимизировать финансовые убытки, я начал заимствовать немного кода с Kaggle Learn. С помощью чего попытаюсь в этой статье показать, как определить на какие позиции лучше не лезть, ... |
15.07.2024 | Использование моделей EfficientNet для классификации изображений | Искусственные нейронные сети (ИНС) — мощный инструмент в области компьютерного зрения, особенно в задачах классификации изображений. Эта область применения была одной из первых, для которой ИНС были разработаны. Например, перцептрон Розенбл... |
04.07.2024 | Google Colab вместо Jupyter Notebook: плюсы и особенности работы для новичков | Привет! Меня зовут Ольга Матушевич, я наставница на курсе «Аналитик данных» в Яндекс Практикуме. С Jupyter Notebook я впервые столкнулась шесть лет назад, когда начала изучать Python и анализ данных. И именно установка Jupyter Notebook стал... |
01.07.2024 | Визуализация данных: четыре простых способа быстро улучшить диаграмму | Для многих специальностей, будь то бизнес-аналитика, Data Science или геология и геофизика, эффективная визуализация данных вошла в число принципиально важных навыков. Наглядное представление информации, понятное и эстетически привлекательн... |
28.06.2024 | Основы теории вероятностей для будущих программистов и дата-аналитиков | Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.
Вместе с Ильей Котовым, спе... |
25.06.2024 | Маршрутизация обращений: автоматизация в ИТ-поддержке с помощью ИИ и языковых моделей | Передовые технологии ИИ могут не только ускорить, но и значительно повысить качество обработки обращений. Я занимаюсь в НЛМК генеративным искусственным интеллектом и расскажу, как нам совместно с ИТ‑вендором Аксеникс удалось преобразовать п... |
21.06.2024 | Выстраиваем стабильное соединение для обучения с подкреплением на Python на моделях AnyLogic | Введение
Стремительное развитие глубокого обучения с подкреплением (deep reinforcement learning – DRL), представляющего собой комбинацию глубокого обучения (DL) и обучения с подкреплением (RL), привлекает все больше исследователей из самых ... |
21.06.2024 | Кто выжил при крушении Титаника? | 15 апреля 1912 года потерпел крушение крупнейший пассажирский корабль первой половины ХХ века "Титаник". На его борту было 2240 пассажиров. В результате аварии с айсбергом более полутора тысяч человек погибли, и только около 700 с... |
19.06.2024 | SARIMAX vs Экспоненциальное сглаживание: Когда простота побеждает | В прошлом посте я рассказывала про свои мучения с моделькой ARIMA. Здесь же я расскажу о следующей серии издевательств над временными рядами, SARIMAX и экспоненциальным сглаживанием.
Для начала хочу исправить косяки прошлой статьи и прогово... |
17.06.2024 | NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей | Привет, Хабр! Меня зовут Иван, я Data Science специалист SimbirSoft. Я расскажу, как на одном из проектов мы занимались прогнозированием на месяц вперед с помощью методов NLP, Catboost и тематического моделирования на новостном потоке.
Один... |
15.06.2024 | Мои мысли о Python in Excel | 22 августа 2023 года компания Microsoft выпустила предварительную версию «Python in Excel». Я разработчик xlwings и автор книги O’Reilly Python for Excel, поэтому мне, разумеется, стало интересно её потестировать. Не следует судить книгу по... |
14.06.2024 | Лучшие библиотеки Python для Data Science в 2024 году | Python — один из самых распространенных языков программирования в Data Science (третье место в опросе разработчиков StackOverflow). Популярность языка обусловлена наличием множества пакетов, которые можно использовать для решения различных ... |
12.06.2024 | Временные ряды и ARIMA: Как предсказывать будущее без хрустального шара | Часть 1
Что такое временной ряд, модель ARIMA и как к ней подбирать параметры.
Временной ряд — собранный в разные моменты времени статистический материал о значении каких-либо параметров (в простейшем случае одного) исследуемого процесса. (... |
07.06.2024 | Повышаем интерпретируемость SHAP-графиков | Привет, Хабр! В моей работе часто возникают задачи на исследование влияния факторов, на которые мы можем оказывать продуктовое влияние, на целевые метрики сообществ ВКонтакте. Один из возможных способов решения подобных задач — обучение ML‑... |
27.05.2024 | Быстрая Data Quality проверка на базе алгоритма adversarial validation | Привет, Хабр! Всем привет, меня зовут Максим Шаланкин, я Data Science Team Lead в команде Финтеха Big Data МТС. Из этой статьи вы узнаете, как оценивать качество данных при помощи алгоритма adversarial validation с использованием spark user... |
23.05.2024 | «Физика для программистов» — как физтехи применяют её в приложениях. Дифракция. Интеграл Френеля | Введение
В этой части речь пойдёт про задачу моделирования дифракции Френеля: разберём теорию, которая лежит в основе модели, напишем небольшое приложение для моделирования дифракции и подумаем над оптимизацией. Протестируем полученную прог... |
22.05.2024 | Распознавание капчи при помощи CNN модели | Привет, Хабр!
Хочу поделиться своим опытом предобработки картиной с капчей и созданием модели, которая может определить, что же за символы в этой картинке. Код с архитектурой модели и обучением тоже будет, но основной упор часть с предобраб... |
21.05.2024 | Переехать ближе к работе или сэкономить: что выбрать IT-джуну? | Об авторе
Приветствую вас! Меня зовут Эрик, и я хочу поделиться своим личным опытом и знаниями. Я практикующий дата-сайентист, имеющий успешный опыт участия и судейства в чемпионатах по прогнозированию, а также аналитик-исследователь, котор... |
17.05.2024 | Реализация приложения для отслеживания самочувствия (Telegram bot) | Рад представить вам свой первый проект, как мне думается, достаточно интересная работа, если рассматривать её как первый pet project.Введение
В современном мире люди стали относится к своему здоровью с трепетом и ответственностью, именно по... |
10.05.2024 | Методы оптимизации в машинном и глубоком обучении. От простого к сложному | В данной статье представлен обзор различных популярных (и не только) оптимизаторов, которые применяются в машинном и глубоком обучении, в частности для обучения нейронных сетей. Мы рассмотрим их основную идею и ключевые особенности, переход... |
26.04.2024 | Энтузиаст представил порт Doom для Paint | Разработчик под ником wojciech-graj представил порт Doom под названием cyDoomGeneric для запуска игры в приложении Microsoft Paint под Windows XP.
Каждый кадр игры прорисовывается с помощью специального алгоритма в реальном времени. В завис... |
23.04.2024 | Разбираемся в ROC и AUC | Привет, Хабр!
В машинном обучение очень важны метрики оценки эффективности моделей. Среди таких метрик есть: кривые ROC и показатель AUC. Они позволяют оценивать бинарные классификаторы.
Кривая ROC – это график, который иллюстрирует произво... |
22.04.2024 | Линеаризация: зачем и как укрощать ratio-метрики в A/B-тестах | Привет, Хабр! В прошлой статье я указал, что в A/B-тестах используются три основных типа метрик, а именно пользовательские конверсии, средние метрики пользователей и ratio-метрики. К последним обычно относят средний чек, CTR баннера, средню... |
20.04.2024 | ГАЙД по python стеку для Data Science инженеров | Data science - это область, которая занимается изучением и анализом больших объемов данных, чтобы находить в них полезные закономерности, делать прогнозы или принимать решения на основе фактов. В основе data science лежат методы и инструмен... |
20.04.2024 | NumPy для самых маленьких | Математика везде в нашей жизни, но в программировании, а особенно ML ее два раза больше. Обычно Питон берут в пример самого "научного" языка программирования из-за математических фреймворков. Как не Питон может помочь оперировать ... |
19.04.2024 | Как аппроксимировать любую функцию с помощью PyTorch | При анализе данных и построении моделей машинного обучения часто возникает необходимость аппроксимировать сложные функции. PyTorch предоставляет удобные инструменты для создания и обучения нейронных сетей, которые могут быть эффективно испо... |
18.04.2024 | T-test. Зависимость от независимости | Привет, Хабр! Теме А/Б-тестирования посвящено достаточно много статей, и вот держите ещё одну. Тема экспериментов для выявления эффективности внедрения доработок популярна не только последний год и она, скорее всего, освещена уже со всех во... |
17.04.2024 | Определение жанра фильма по описанию | Автор статьи: Олег Блохин
Выпускник OTUS
В ходе поиска темы проектной работы, которой должен был завершиться курс Machine Learning. Professional, я решил поэкспериментировать с данными о фильмах, мультфильмах, сериалах и прочей схожей проду... |
07.04.2024 | Python для анализа годовых температур в Москве | Python - это мощный язык программирования, который широко используется в области анализа данных, включая анализ погодных данных. Давайте на примере анализа годовых температур в Москве разберемся как с его помощью можно выгрузить, предобрабо... |
06.04.2024 | Анализ новостей с помощью сегментации и кластеризации временных рядов | В Отусе я прошла курс ML Advanced и открыла для себя интересные темы, связанные с анализом временных рядов, а именно, их сегментацию и кластеризацию. Я решила позаимствовать полученные знания для своей дипломной университетской работы по ив... |
30.03.2024 | Линейная регрессия. Основная идея, модификации и реализация с нуля на Python | В машинном и глубоком обучении линейная регрессия занимает особое место, являясь не просто статистическим инструментом, но а также фундаментальным компонентом для многих более сложных концепций. В данной статье рассмотрен не только принцип ... |
24.03.2024 | Линейный дискриминантный анализ (LDA). Принцип работы и реализация с нуля на Python | Линейный дискриминантный анализ (Linear Discriminant Analysis или LDA) — алгоритм классификации и понижения размерности, позволяющий производить разделение классов наилучшим образом. Основная идея LDA заключается в предположении о многомерн... |
23.03.2024 | Наивный байесовский классификатор. Основная идея, модификации и реализация с нуля на Python | Наивный байесовский классификатор (Naive Bayes classifier) — вероятностный классификатор на основе формулы Байеса со строгим (наивным) предположением о независимости признаков между собой при заданном классе, что сильно упрощает задачу клас... |
21.03.2024 | Коэффициенты для экстраполяции прогнозов компонент CLTV на 5 лет | Эта статья описывает, как из прогнозов ряда ML-моделей получить ценность клиента с горизонтом в 5 лет. Напомним, что показатель CLTV представляет из себя композицию прогнозов ее компонент (подробнее в статье). В нашей реализации максимальны... |
21.03.2024 | Метод K-ближайших соседей (KNN). Принцип работы, разновидности и реализация с нуля на Python | К-ближайших соседей (K-Nearest Neighbors или просто KNN) — алгоритм классификации и регрессии, основанный на гипотезе компактности, которая предполагает, что расположенные близко друг к другу объекты в пространстве признаков имеют схожие зн... |
19.03.2024 | Бэггинг и случайный лес. Ключевые особенности и реализация с нуля на Python | Далее пойдёт речь про бэггинг и мой самый любимый алгоритм — случайный лес. Не смотря на то, что это одни из самых первых алгоритмов среди семейства ансамблей, они до сих пор пользуются большой популярностью за счёт своей простоты и эффекти... |
18.03.2024 | Основные типы распределений вероятностей в примерах | Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения на сайте, нажатий на целевые кнопки, поку... |
18.03.2024 | Классификация экзопланет (часть I обработка данных) | В космосе есть нечто завораживающее и прекрасное, в то же время человек устроен так, что если ему что то не известно, то он будет этого бояться (спасибо нашим мамам папам в n-ном поколении за столь широкий диапазон восприятия информации и р... |
13.03.2024 | Градиентный бустинг. Реализация с нуля на Python и разбор особенностей его модификаций (XGBoost, CatBoost, LightGBM) | На сегодняшний день градиентный бустинг (gradient boosting machine) является одним из основных production-решений при работе с табличными, неоднородными данными, поскольку обладает высокой производительностью и точностью, а если быть точнее... |
07.03.2024 | 15+ полезных ссылок для начинающего специалиста по Data Science | Привет, Хабр! Меня зовут Раф. Сейчас я работаю аналитиком ценообразования в Яндекс Лавке, куда попал после стажировки в команде аналитики Яндекс Браузера. Параллельно учусь в НИУ ВШЭ и уже успел пройти курс «Специалист по Data Science» в Пр... |
05.03.2024 | Цена качества модели: как метрики качества модели машинного обучения влияют на финансовый результат | Описание проблемы
При создании любой модели машинного обучения всегда возникает вопрос оптимального соотношения цены и качества. С одной стороны data scientist-ы всегда стараются построить максимально производительную модель, с другой сторо... |
16.12.2023 | Мамкин программист про ИИ, «программисты скоро будут не нужны» и прочие страшилки | Недавно на Habr вышел перевод статьи под названием: «Классическое программирование на грани вымирания» с постапокалиптической сгенерированной картинкой, где автор буквально пишет, что «Приближается конец эпохи классических компьютерных наук... |
05.12.2023 | Как мы научили заводчан строить красивые инженерные отчеты из Jupyter Notebook на Python | Была у нас тут история, когда легкий перфекционизм помог привести в порядок конструкторскую документацию и регулярно экономить инженерам кучу дней на прохождение бюрократических процедур. В ее основе – создание системы управления расчетными... |
19.11.2023 | Коммивояжёр за полином* | Всегда много путей достичь цель есть. Испробовать их все должны вы.
Магистр Йода, из книги «Ученик джедая. Битва за истину», Джуд Уотсон
Задача коммивояжёра, пожалуй самая известная задача комбинаторной оптимизации. Сводится она к поиску са... |
22.08.2023 | Microsoft is bringing Python to Excel | Microsoft today announced the public preview of Python in Excel, which will allow advanced spreadsheet users to combine scripts in the popular Python language and their usual Excel formulas in the same workbook.
This feature will first roll... |
10.07.2023 | Опенсорс-библиотеки для Python: 40+ вариантов, как упростить жизнь начинающего дата-сайентиста | «Удовольствие от программирования на Python должно заключаться в том, чтобы видеть короткие, лаконичные, удобочитаемые классы, которые выражают множество действий в небольшом количестве ясного кода, а не в грудах пустых символов, утомляющих... |
07.07.2023 | Фигуры Matplotlib и стиль Cyberpunk: несколько строк кода — и готова красивая фигура | Когда мы создаем инфографику или постеры с данными, мы хотим привлечь внимание читателя: для этого изображение должно быть эстетически привлекательным и при этом убедительно доносить нашу мысль. Есть множество графических библиотек для созд... |
12.06.2023 | cv3 — делаем OpenCV питоничным | TL;DR cv3 - обёртка над opencv-python, которая ускоряет написание кода, не сужая функциональность
Привет, Хабр! Хочу поделиться написанным мною фреймворком на Python, который упрощает работу с OpenCV и делает его более питоничным. Погнали!С... |
29.05.2023 | Что нам стоит диаграмму в Python построить: 5 вариантов привлекающей внимание визуализации данных и кое-что ещё | Диаграммы помогают визуализировать как простые, так и самые сложные наборы данных. При этом диаграмм — множество видов, у каждого есть свои достоинства и недостатки. О наиболее эффектных и эффективных, реализуемых с Python, мы решили расска... |
25.05.2023 | Клеточные автоматы. Игра «Жизнь». Часть 1 | 0. Как я познакомился с клеточными автоматами
В начале 2022 года я, обычный студент 4 курса с направления «Радиофизика», вместо того, чтобы постигать труды по ТОЭ и радиоэлектронике, смотрел YouTube в поисках интересного контента. Меня очен... |
23.05.2023 | Реализация функции потерь Triplet Loss в Python (функция тройных потерь) | Большинство из нас думают о машинном обучении как о "черном ящике", который принимает некоторые данные и выдает отличные результаты. В последние годы этот черный ящик работает как имитация человека в соответствующих областях, где ... |
08.05.2023 | Анализ таблиц сопряженности средствами Python. Часть 1. Визуализация | АКТУАЛЬНОСТЬ ТЕМЫ
Категориальные данные имеет огромное значение в DataScience. Как справедливо заметили авторы в [1], мы живем в мире категорий: информация может быть сформирована в категориальном виде в самых различных областях - от диагно... |
29.03.2023 | 7 шагов, которые помогут сделать ваши столбчатые диаграммы Matplotlib красивыми | Почему бы не попробовать эти примеры на вашей следующей гистограмме?
Статья была взята из этого источника:
7 шагов, которые помогут сделать ваши столбчатые…
7 шагов, которые помогут сделать ваши столбчатые диаграммы Matplotlib красивыми Сто... |
21.12.2022 | Как стать аналитиком? (и зачем) | В этом материале я расскажу вам о роли аналитика в крупной технологической компании, а также о том, как можно им стать. Что такое крупная технологическая компания? Под этим можно понимать множество организаций, но в этом материале я буду на... |
17.12.2022 | Гистограммы и графики распределения в Python
Визуализация одномерных данных в Python
Гистограммы
Когда гистограммы бесполезны
Графики распределения (Density Plots)
Заключение... | Визуализация одномерных данных в Python
Построение графика одной переменной кажется простой задачей. Но насколько это просто в действительности — эффективно отобразить данные со всего одним измерением? Долгое время я обходился стандартной г... |
16.12.2022 | Графы в Python: введение и знакомство с лучшими библиотеками | Граф – это математическая структура данных, представляющая собой множество связанных элементов. Поскольку графы, по своей сути, являются очень гибкими и позволяют сохранять информацию в знакомой и удобной для восприятия форме, они всегда ак... |
02.12.2022 | Выбросьте блокноты, или почему заниматься Data Science нужно так, будто вы разработчик | Большинство дата-сайентистов использовали или до сих пор используют notebooks. В чем-то это здорово, но кажется, что дата-сайентисты должны действовать как разработчики. И поэтому с notebooks надо переходить на скрипты, разрабатываемые в ID... |