Date | Title | Description |
03.02.2025 | Пойдём в нейросети вместе со мной | В этой статье мы
Потестируем и немного модифицируем простейшую нейросеть на python‑е реализованную через операции над матрицами из книги Тарика Рашида «Создаём нейронную сеть».
Напишем и протестируем несколько вариантов простейшей нейросети... |
29.01.2025 | The Evolving Landscape of AI Text Detection and Look-a-Like Pseudolabeling | In the world of artificial intelligence, the line between human and machine-generated text is blurring. As AI models grow more sophisticated, the challenge of distinguishing between the two becomes a game of cat and mouse. This article expl... |
26.01.2025 | Зачем в Look-a-like pseudolabelling (или самый простой метод PU-learning на службе у рекламщиков) | Готовил семинар студентам и почему-то нигде не могу найти этот простой и действенный способ именно в контектсе Look-a-Like (если не прав -- поделитесь, пожалуйста, в комментариях ссылкой).Бизнес-задача
Представьте задачу:
К вам пришел предп... |
24.01.2025 | Mastering Data Cleaning: The Unsung Hero of Data Science | In the world of data science, data cleaning is the unsung hero. It’s the meticulous art of transforming raw data into a polished gem. Just like a sculptor chisels away at a block of marble, data scientists chip away at imperfections to reve... |
23.01.2025 | 30 трюков на Python с описанием преимущества | Причет, чемпионы! Нашлось время собрать коллекцию хитростей на python в примерах. Примеры давно копились у меня в черновиках, и вот делюсь! Это первая часть, вторая будет сразу на 100 пунктов. Поехали!
1. Списковые включения (List Comprehen... |
22.01.2025 | The Rise of Python Gaming: Joy of Programming and Joblib's Power | In the world of programming, Python has emerged as a versatile titan. It’s not just a tool for developers; it’s a canvas for creativity. Two recent developments showcase this evolution: the launch of "Joy of Programming," a softwa... |
21.01.2025 | Joblib: максимум из параллельных вычислений в Python | Привет, Хабр! Сегодня разберемся с одной важной темой, которая может серьезно улучшить производительность Python‑кода — параллельные вычисления с помощью Joblib.
Joblib — это Python‑библиотека, которая предоставляет инструменты для параллел... |
18.01.2025 | Bridging Realities: The Rise of Arnis in Minecraft | In the digital age, the line between reality and virtuality blurs. Enter Arnis, a groundbreaking tool that transforms the way we build in Minecraft. This utility allows users to recreate real-world locations in mere minutes, leveraging data... |
15.01.2025 | Практическое обучение с подкреплением: от забав с MuJoCo'м до битв на арене | Добрый день, уважаемые хабровчане! Я хочу поделиться с вами очень интересным проектом, над которым работал в последнее время.
В первой статье я не буду сильно углубляться в технические подробности, а вместо этого постараюсь провести вас по ... |
15.01.2025 | Arnis: как перенести реальный мир в Minecraft за пару кликов | На днях энтузиасты с GitHub выпустили Arnis — утилиту, которая переворачивает представление о строительстве в Minecraft. Теперь, опираясь на реальные данные из OpenStreetMap, за считаные минуты можно создать масштабную копию существующего г... |
13.01.2025 | Brython: Python в вашем браузере (ч.4) | Часть 1 • Часть 2 • Часть 3 • Часть 4Распространение и упаковка проекта Brython
Метод, используемый для установки Brython, может повлиять на то, как и где вы можете развернуть свой проект Brython. В частности, для развертывания в PyPI лучши... |
12.01.2025 | О чем говорит версия проекта? | Думаю, всем из нас так или иначе приходилось работать со сторонним кодом. Например, использовать какую-нибудь стороннюю библиотеку или фреймворк. При работе со сторонним кодом так или иначе приходится иметь дело с его версиями. Это достаточ... |
08.01.2025 | Открытые книги по ML и работе с данными | Мы регулярно публикуем подборки литературы для специалистов: делали дайджест книг для желающих поближе познакомиться с Postgres и Kubernetes. Сегодня на очереди справочники и пособия по машинному обучению, которые можно найти в открытом дос... |
02.01.2025 | The Rise of RP2040: A New Era in Embedded Development | In the world of embedded systems, change is a constant. The RP2040 microcontroller from Raspberry Pi has emerged as a beacon of simplicity and power. It’s like a breath of fresh air in a landscape cluttered with complexity. Many developers ... |
31.12.2024 | Чего ждать от Python в 2025 году — и чем он радовал нас в этом | Предновогодний привет, Хабр! Ну что, самое время подводить итоги и мечтать о прекрасном? А так как у нас стартует год Питона Змеи, поговорим про Python.
Ниже собрали мнения экспертов цифровой экосистемы МТС: обсудили, чем был интересен рели... |
30.12.2024 | Изобретаем polimer — фреймворк на Python для ускорения разработки научных прототипов | Еще с третьей версии в Python появились аннотации типов, которые можно использовать в качестве комментариев к аргументам функций, для статического анализа и поиска ошибок или даже перегрузки методов в зависимости от типов аргументов. Помимо... |
25.12.2024 | Пишем свой PyTorch на NumPy. Часть 2. Добавляем новые слои | PyTorch — это мощный и гибкий фреймворк для машинного обучения, широко используемый для создания нейронных сетей. Он особенно популярен благодаря простоте использования, динамическим вычислительным графам и богатой экосистеме инструментов д... |
23.12.2024 | Стратификация: как не облажаться с A/B тестами | Привет, Хабр!
Представьте: вы запускаете A/B тест. Цель проста: проверить, работает ли новая кнопка лучше старой. Но тут же возникает мысль: «А вдруг мобильные юзеры и десктопные реагируют по‑разному? А что с новыми пользователями? Их мнени... |
23.12.2024 | Рекомендательная библиотека RePlay: сравнение с конкурентами RecBole и Recommenders на примере SOTA-модели SASRec | Привет, Хабр! Мы — команда ML‑разработчиков Сбера и Sber AI Lab. Хотим рассказать о нашем open‑source инструменте RePlay, который позволяет создавать рекомендательные системы с нуля, начиная с самых ранних DS‑экспериментов и заканчивая пром... |
23.12.2024 | Пишем свой PyTorch на NumPy. Часть 1 | PyTorch — это мощный и гибкий фреймворк для машинного обучения, широко используемый для создания нейронных сетей. Он особенно популярен благодаря простоте использования, динамическим вычислительным графам и богатой экосистеме инструментов д... |
21.12.2024 | Unleashing the Power of LZ4 Compression in Embedded Systems | In the world of embedded systems, every byte counts. Imagine a tiny microcontroller, tasked with displaying vibrant animations on a limited-resolution LED screen. The challenge? To deliver rich visuals without overwhelming the device's meag... |
20.12.2024 | Релиз открытого видеоредактора Flowblade 2.18 | 18 декабря 2024 года состоялся релиз открытого видеоредактора Flowblade 2.18, предназначенного для компоновки видеороликов из отдельных видео, звуковых файлов и изображений. Исходный код проекта написан на языке Python и опубликован на GitH... |
20.12.2024 | Обработка временных рядов в TimescaleDB с интеграцией pandas и NumPy | Привет, Хабр!
Если вы когда‑либо занимались анализом данных, связанных со временем, то наверняка знаете, каким это иногда бывает нелегким занятием — особенно когда данных много, миллионы строк, и SQL начинает медленно кряхтеть под нагрузкой... |
18.12.2024 | Пять ошибок новичков в A/B-тестах | Привет, Хабр!
Сегодня рассмотрим типичные грабли, на которые наступает каждый второй новичок, когда берется за A/B‑тесты. Ошибка №1: «Мы не проверили корректность рандомизации»
Типичная ситуация: запускаем тест: есть группа А и группа B. В ... |
14.12.2024 | The Evolution of Search Technologies: From Text to Machine Learning | In the digital age, the quest for information resembles a treasure hunt. Users seek answers, and search engines are the maps guiding them. The evolution of search technologies has transformed this hunt from a tedious task into a swift, effi... |
14.12.2024 | Navigating the Complexities of Data Clustering and Probability Assessment in Machine Learning | In the vast ocean of data, clustering and probability assessment are two islands that stand out. Each has its own unique landscape, challenges, and tools. Understanding these concepts is crucial for anyone navigating the waters of machine l... |
12.12.2024 | Фрактальная размерность: что это и как вычислить | Фрактальная размерность описывает сложность объектов, которые нельзя измерить обычными параметрами, такими как длина или площадь. Например, снежинка при увеличении не становится проще — каждая ее деталь открывает еще более мелкие элементы. ... |
11.12.2024 | Случайные разрезы данных в задаче кластеризации: коротко | Кластеризация — штука сложная. Вроде все просто: сгруппировать похожее с похожим. Но когда данных вагон, а структура запутаннее клубка проводов за столом, стандартные методы вроде k‑means или DBSCAN начинают сдавать позиции. Особенно больно... |
10.12.2024 | Машинное обучение в поиске | Привет, Хабр!
Меня зовут Михаил. Я занимаюсь разработкой корпоративных поисковых систем, а также поиском по каталогам в интернет-магазинах. Еще я разрабатываю поисковые системы с открытым кодом Apache Lucene и Apache Solr.
В этой статье я р... |
07.12.2024 | The Silent Architects of Our Genome: Unraveling the Mysteries of Non-Coding DNA | In the vast landscape of genetics, non-coding DNA often plays the role of the overlooked artist, painting the intricate details of gene expression without ever stepping into the spotlight. This seemingly redundant DNA occupies nearly half o... |
05.12.2024 | Алгоритмы и структуры данных для численных вычислений с автоматической оценкой точности | Специалист отдела перспективных исследований компании «Криптонит» Игорь Нетай на протяжении нескольких лет изучал фундаментальную проблему быстрой потери точности вычислений. Она связана с повсеместно применяемым форматом экспоненциальной з... |
04.12.2024 | Когда «тихая» ДНК громче гена: как избыточная ДНК регулирует экспрессию, ничего не делая | Мир биоинформатики полон загадок: что такое избыточная ДНК, почему она занимает половину генома, и как это вообще работает? Кому-то может показаться, что некодирующая ДНК — это просто лишний «хлам», но на деле это, как если бы в вашем коде ... |
19.11.2024 | The Art and Science of Measuring Filament Thickness and the Ulam Spiral | In the world of technology and mathematics, precision and beauty often intertwine. Two seemingly disparate topics—measuring filament thickness and the Ulam spiral—offer a glimpse into this fascinating intersection. One is a practical applic... |
19.11.2024 | Красивые картинки на скатерти Улама | Скатерть Улама и тонкая структура простоты чисел . Очень много больших картинок
Скатерть Улама
( https://ru.wikipedia.org/wiki/Скатерть_Улама https://en.wikipedia.org/wiki/Ulam_spiral )
это очень красивое и наглядное представление структуры... |
15.11.2024 | Проверяем фактор автобуса для опенсорсных проектов | Из Википедии: фактор автобуса (англ. bus factor, либо truck factor) проекта — это мера сосредоточения информации среди отдельных членов проекта; фактор показывает количество участников проекта, после потери которых (в оригинале — «попадания... |
11.11.2024 | Состояние производительности Python 3.13: Free-Threading | CPython 3.13 был выпущен две недели назад (п.п. относительно оригинальной публикации) и стал одним из наиболее сфокусированных на производительности релизов за последнее время. Пробежавшись по release notes, я заметил несколько фич, которые... |
06.11.2024 | Сверточные нейронные сети. Создание нейросети для распознавания цифр на языке программирования Python | В современном мире искусственный интеллект и машинное обучение стремительно развиваются, меняя нашу повседневную жизнь и открывая новые горизонты в различных областях. Одной из ключевых технологий, лежащих в основе этих достижений, являются... |
31.10.2024 | The Rise of AI-Powered Drone Technology in Railway Safety | In the realm of modern technology, drones are the new eyes in the sky. They hover above, capturing images with precision that rivals the best cameras. This innovation is not just for breathtaking landscapes or thrilling aerial shots. It’s m... |
30.10.2024 | Распознавание ж/д пикетных столбиков по фотографиям с беспилотника на основе PyTorch и YOLOv5 | Тенденция применения беспилотных летательных аппаратов (БПЛА) продолжает развиваться и процветать. Оснащение беспилотников камерами и навигационным оборудованием геодезического класса точности позволяет получать ортофотопланы с сантиметрово... |
24.10.2024 | Государственные перевороты: бармалеи выпрыгивают как черти из табакерки. Не хотите, дети, в Африку сыграть? | На исторических данных за 1991-2019 год покажем, как можно "увидеть" и "выцепить" признаки переворота. С помощью машинного обучения и ансамблевых модели. Ансамбли (конечно, не музыкальные), как показывает практика, – бол... |
23.10.2024 | Книга: «Causal Inference на Python. Причинно-следственные связи в IT-разработке» | Привет, Хаброжители!
Причинно-следственный анализ — одна из важнейших методологий современной науки о данных (data science), однако между теорией и практикой сохраняется большой пробел. Матеуш написал лучшую на сегодняшний день книгу, котор... |
22.10.2024 | The Rise of Automation: Simplifying Your Digital Workspace with WorkStarter | In the digital age, efficiency is king. Every second counts. Enter WorkStarter, a utility designed to streamline your Windows experience. This tool is like a personal assistant, ready to launch your favorite applications and websites the mo... |
21.10.2024 | Может ли простейшая нейросеть найти математическую закономерность в данных? | В этой небольшой статье мы научим нейросеть решать задачу умножения перестановок длины 5 (группа ) и визуализируем результаты обучения с помощью методов проекции t-SNE (и понизим размерность PCA) и алгоритма UMAP. Мы убедимся в том, что даж... |
16.10.2024 | Navigating the Digital Cinema Landscape: A DIY Movie Recommendation System | In the age of streaming, choosing a movie can feel like searching for a needle in a haystack. With countless options available, how do you find that perfect film? This article explores a DIY approach to creating a movie recommendation syste... |
15.10.2024 | The Art of Sorting: More Than Just Order | Sorting is like a magician's trick. At first glance, it seems simple. You click a button, and voilà! Everything is in order. But beneath the surface lies a complex world of algorithms and data structures. Sorting is not just about arranging... |
15.10.2024 | Рекомендатель кино или как я писал свое DIY-решение для поиска новых фильмов | Вечер. Пересматриваю «Пятницу 13». Не люблю пересматривать фильмы, даже хорошие. Но выбрать интересное кино из потока новинок сложно. Поэтому мне захотелось написать свой рекомендатор кино. Этим и займусь в выходные.
В статье покажу, что по... |
14.10.2024 | Её величество Сортировка | Сначала кажется, что сортировка - это тривиально. В Excel жмешь "Sort Smallest to Largest" и все хорошо. Ну или sorted() в питоне. Всё само делается.
Серьезное знакомство с сортировкой у меня произошло на курсах Яндекс.Практикума ... |
12.10.2024 | Линейная регрессия и её регуляризация в Scikit-learn | В этой статье мы рассмотрим модели линейной регрессии, доступные в scikit-learn. Обсудим, что такое регуляризация, на примерах Ridge, Lasso и Elastic Net, а также покажем, как эти методы можно реализовать на Python.
Создание модели линейной... |
11.10.2024 | Hacking Hardware with a Lighter: A Journey into Electromagnetic Fault Injection | In the world of hacking, creativity is key. The tools of the trade can be as simple as a lighter. Yes, a common barbecue lighter can become a powerful weapon in the hands of a skilled hacker. This article explores the fascinating realm of e... |
11.10.2024 | The Power of PL/Python: Enhancing PostgreSQL with Python Magic | In the world of databases, PostgreSQL stands tall. It’s robust, reliable, and loved by developers. But what if you could supercharge it? Enter PL/Python. This powerful extension merges the strengths of PostgreSQL with the versatility of Pyt... |
11.10.2024 | The Fusion of PostgreSQL and Python: A New Era in Database Management | In the realm of database management, PostgreSQL stands tall as a robust and versatile system. Now, with the introduction of PL/Python, it has evolved into a powerhouse that combines the best of both worlds: the reliability of SQL and the fl... |
09.10.2024 | Усиление PostgreSQL с помощью PL/Python | Привет, Хабр!
Сегодня мы прокачаем PostgreSQL, добавив в него Python. А именно — PL/Python. Это расширение позволяет писать функции на Python прямо внутри базы данных. Лично для меня это как объединение двух лучших миров: любимого PostgreSQ... |
07.10.2024 | The Art of Data Preprocessing in Machine Learning: A Crucial Step for Success | In the world of machine learning, data is the lifeblood. But raw data is often messy, like a canvas splattered with paint. Before we can create a masterpiece, we must first clean it up. This process is known as data preprocessing. It’s the ... |
07.10.2024 | Предварительная обработка данных в машинном обучении: инструкция, инструменты, полезные ресурсы для начинающих... | В статье рассказываем, зачем обрабатывать данные перед загрузкой в модель, как провести предобработку и какие инструменты использовать.
Мария Жарова
Data Scientist, Альфа-БанкЧто такое предобработка данных
Предобработка — это подготовка наб... |
26.09.2024 | Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Начало | В первой главе исследования был описан набор данных с временными рядами о погоде, который мы будем использовать для выполнения задачи прогнозирования температуры, а также были приведены шаги по его предварительной подготовке.
В данной главе... |
25.09.2024 | The Eye of Technology: How Computer Vision is Revolutionizing Medicine | In the realm of medicine, the marriage of technology and healthcare is akin to a symphony, where each note plays a crucial role in creating harmony. One of the most compelling instruments in this orchestra is computer vision (CV). This tech... |
25.09.2024 | Unlocking the Future: Affordable Data Solutions for Everyone | In a world where data reigns supreme, having the right tools is crucial. The digital landscape is evolving rapidly. Businesses and individuals alike are searching for ways to harness the power of data science and secure their information. F... |
25.09.2024 | Unlocking Potential: Affordable Tools for the Modern Professional | In today's fast-paced world, efficiency is the name of the game. Professionals need tools that empower them to work smarter, not harder. Two standout offerings have emerged recently: the Afirstsoft AI PDF Editor and the 2024 Data Science &a... |
24.09.2024 | Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава первая | После перерыва продолжаю цикл статей про одно из самых интересных направлений в статистике и науке о данных — прогнозировании временных рядов (или рядов динамики, как их первоначально называли в учебниках по эконометрике). Эта работа будет ... |
24.09.2024 | CV в медицине: как компьютерное зрение помогает лечить болезни | Компьютерное зрение, или CV, — общее название для множества технологий распознавания изображений: выделения объектов, сравнения лиц или оценки того, что происходит на снимке. Эти технологии используются не только в графических редакторах и ... |
24.09.2024 | Harness the Power of Data Science & Machine Learning from Home | TL;DR: The 2024 Data Science & Machine Learning Bundle is available for just $39.99 (reg. $269) and includes comprehensive training to build your AI and data science skills.
With most things in life, flexibility is key, and that’s espec... |
20.09.2024 | DBS Bank: Pioneering AI in Banking | In the bustling financial landscape of Asia, DBS Bank stands out as a beacon of innovation. Recently, Harvard Business School (HBS) published a case study that delves into DBS's ambitious journey with Artificial Intelligence (AI). This mark... |
20.09.2024 | Navigating the Venture Capital Landscape: Legal Strategies for Success | In the fast-paced world of venture capital (VC), the stakes are high. Investors seek to fund the next big innovation, while startups aim to turn their visions into reality. However, the road to success is fraught with risks. Understanding t... |
19.09.2024 | Топ-5 библиотек для анализа данных на Python | Python — один из самых популярных языков для анализа данных благодаря множеству удобных и эффективных библиотек. Эти инструменты помогают обрабатывать, анализировать и визуализировать данные, делая вашу работу быстрее и проще.
Преподаватель... |
18.09.2024 | The Rise of Open Source in Russia: A New Era for Machine Learning and Data Analysis | In the vast landscape of technology, open source is a beacon of collaboration. It invites innovation and democratizes access to tools that drive progress. Recently, a study by ITMO University has shed light on the state of open source in Ru... |
17.09.2024 | The Rise of AI-Driven Text Generation: A Dive into Markov Chains and Telegram Bots | In the digital age, artificial intelligence (AI) is the new frontier. It’s like a vast ocean, teeming with possibilities. Among the many tools in this ocean, Markov chains stand out as a simple yet powerful method for generating text. This ... |
17.09.2024 | ИТМО провёл исследование open source в сферах машинного обучения и анализа данных | Специалисты центра «Сильный ИИ в промышленности» при ИТМО опубликовали результаты исследования особенностей и направления развития опенсорс-сообщества в сфере машинного обучения и анализа данных в России. В лидерах российского опенсорса ока... |
16.09.2024 | Теорема о разбиении регрессоров: делаем CUPED аб-тесты в один шаг | Хай!
Пишу эту статью для тех, кто уже знаком с CUPED, но ищет больше понимания этого метода и взгляда на него с другой стороны. Здесь я не буду детально объяснять базовый алгоритм CUPED аб-тестирования: про это уже достаточно материала в се... |
16.09.2024 | Цепи Маркова в Telegram-боте | Рано или поздно я должен был начать писать статьи для хабра.
Привет, меня зовут Александр и я жёсткая самоучка в области искусственного интеллекта (ИИ). 5 лет назад я задался целью создать сильный искусственный интеллект (СИИ).
Наглядный пр... |
13.09.2024 | Пошаговое руководство по созданию синтетических данных в Python | Простое руководство для новичков: как самому генерировать данные для анализа и тестирования
Представьте: вы только что написали модель машинного обучения и вам нужно протестировать её работу в конкретном сценарии. Или вы собираетесь опублик... |
10.09.2024 | Раскрываем секреты роя: оптимизация на Python с помощью PSO | Начну с небольшой шутки:
"Знаете ли вы, что до изобретения часов людям приходилось активно ходить повсюду и спрашивать время?"
Этот незамысловатый анекдот иллюстрирует важную концепцию: информация, доступная одному члену группы, м... |
09.09.2024 | Эхо Дайджест: Железо, Python, ИИ, Raspberry Pi | Железные новостиРоссия
В Зеленограде запускается образовательная программа по аппаратному программированию на отечественном микроконтроллере MIK32 Амур для школьников 7-11 классов, направленная на подготовку будущих специалистов в радиоэлек... |
07.09.2024 | Знакомимся с линейной алгеброй в NumPy | Библиотека NumPy для Python — это основа науки о данных и биоинформатики. При этом, хоть каждому программисту Python и знакомо имя пакета для установки:
pip install numpy
и команда импорта библиотеки:
import numpy as np
в практических задач... |
30.08.2024 | Школьники и нейросети: как разработать искусственный интеллект на Python для детей | Кто сегодня не слышал о нейросетях? Таких людей практически не осталось. Популярность технологий ИИ выросла настолько, что слово «нейросеть» было объявлено словом 2023 года. В последние несколько лет узнаваемость и востребованность таких те... |
22.08.2024 | The Power of "Grok" Series: Simplifying Complex Concepts in Tech | In the vast ocean of technology literature, the "Grok" series from Piter Publishing stands out like a lighthouse. It illuminates the often murky waters of complex subjects such as algorithms, machine learning, and programming. Wit... |
21.08.2024 | Серия книг “Грокаем” от издательства “Питер” | Привет, Хаброжители!
Сегодня вышла новая книга “Грокаем алгоритмы. 2-е издание”, в связи с чем мы решили рассказать о всей серии “Грокаем”.
А заодно подарить скидку!
Чем хороши “Грокаем”? Каждая книга яркая и оставляющая след. Важная особен... |
20.08.2024 | Revolutionizing Traffic Management: The Quest for Intelligent Traffic Lights | Traffic lights are the unsung heroes of urban life. They orchestrate the flow of vehicles, yet many are stuck in the past, relying on outdated timers. This inefficiency leads to congestion, frustration, and wasted time. But what if traffic ... |
19.08.2024 | Создание оптимального алгоритма переключения светофора на перекрестке | Введение в область
Каждый из нас хоть раз в жизни сталкивался с плохой работой светофора на перекрестке: неравномерное движение трафика по нему, слишком долгие интервалы переключения и т. д. Всё это из‑за наивного способа переключения «зеле... |
17.08.2024 | Матрица Вандермонда | Введение
Александр Теофил Вандермонд (28 февраля 1735 - 1 января 1796) - французский музыкант и математик, известный благодаря своей работе в области высшей алгебры.
Главным увлечением Вандермонда длительное время была лишь музыка, но к 35-... |
15.08.2024 | Феномен Рунге | Введение
Карл Давид Тольме Рунге (30 августа 1856 - 3 января 1927) - выдающийся немецкий математик, физик и спектроскопист. Обучался в Берлинском университете, где получил степень PhD, являлся профессором математики в Ганноверском университ... |
13.08.2024 | The Rise of the Sixth Data Platform: A New Era in Data Management | In the fast-paced world of technology, data is the new oil. It fuels decisions, drives innovation, and shapes industries. As we stand on the brink of a new era, the concept of the "sixth data platform" emerges as a beacon of hope ... |
09.08.2024 | Financial Data Analysts: Making Sense of Big Data in FinTech | Share
Tweet
Share
Share
Email
Financial technology, or FinTech, data is the new gold. Companies are increasingly relying on vast amounts of data to make informed decisions, drive innovation, and maintain a competitive edge. This influx of d... |
01.08.2024 | Введение в MLflow | MLflow - это инструмент для управления жизненным циклом машинного обучения: отслеживание экспериментов, управление и деплой моделей и проектов. В этом руководстве мы посмотрим, как организовать эксперименты и запуски, оптимизировать гиперпа... |
30.07.2024 | Кто такой Python-разработчик, что делает и какие навыки необходимы? | Разработчик Python / Python developer — это программист(developer), занимающийся разработкой программного обеспечения с использованием языка программирования Python.
Python — это высокоуровневый язык, широко применимый в разных сферах: от в... |
28.07.2024 | Часть 2. Алгоритм Тарьяна для приведения нелинейной системы уравнений к вычисляемой последовательности подстановок... | Это вторая часть статьи, посвященную вопросу применения алгоритма Тарьяна для решения систем уравнений. В первой части рассматривалась проблема поиска минимального набора уравнений, из неё нам понадобится только несколько определений.
Тепер... |
27.07.2024 | Navigating the Digital Frontier: TCP/IP and Bayesian Modeling on IBM Mainframes and Python | In the world of technology, two realms stand out: the robust architecture of IBM mainframes and the fluidity of Python programming. Both have their unique languages, their own protocols, and their intricate dance of data. Let’s dive into th... |
26.07.2024 | PyMC3: байесовское моделирование и прогнозирование в Python | Привет, Хабр!
Сегодня мы рассмотрим то, как реализовать байесовское моделирование и прогнозирование с использованием замечательной библиотеки PyMC3.
Байесовские методы - подход к статистическому моделированию, который включает в себя оценку... |
25.07.2024 | DuckDB: The New Powerhouse for Data Engineering**
** | ** In the vast ocean of data management tools, DuckDB emerges as a sleek, agile vessel. This columnar database is designed for analytical workloads, making it a go-to choice for data engineers. With its recent stable release, version 1.0.0,... |
19.07.2024 | Всё что нужно знать про DuckDB | Оглавление
SQL
Copy
Prepared Statements
Functions
Extensions
PostgreSQL Extension
Parquet
Parquet Import
Parquet Export
Buena Vista
Практика
Installation
Client API Python
In-memory
Physical database
Result Conversion
Data Input
Установка в... |
19.07.2024 | Делаем новых людей за 12 строк кода: как с Python ускорить подготовку демо-стенда по HR планированию и соблюсти закон... | Привет, меня зовут Максим Бритвин, и я старший консультант-разработчик. Вот уже почти 10 лет я занимаюсь внедрением и доработкой проектов бюджетирования на платформе Oracle Hyperion, в частности интеграцией данных между Hyperion и различным... |
16.07.2024 | Бутстрап и доверительные интервалы: от теории к практике на Python | Введение
Применение
Ограничения
Схема бутстрапа
Эфронов доверительный интервал
Доверительный интервал Холла
t-процентильный доверительный интервал
Реализация на Python
Проблемы
ПримечанияВведение
Бутстрап — это вычислительный статистический... |
15.07.2024 | Использование моделей EfficientNet для классификации изображений | Искусственные нейронные сети (ИНС) — мощный инструмент в области компьютерного зрения, особенно в задачах классификации изображений. Эта область применения была одной из первых, для которой ИНС были разработаны. Например, перцептрон Розенбл... |
10.07.2024 | 10 библиотек Python для машинного обучения — подборка для начинающих | Составили список самых важных библиотек Python для машинного обучения и рассказали, для каких задач они могут быть полезны начинающим ML-инженерам и специалистам по Data Science. Собрать подборку помог Кирилл Симонов — ML-разработчик компан... |
03.07.2024 | Декодирование Витерби с TensorFlow | Привет, Хабр!
Алгоритм был предложен Эндрю Витерби в 1967 году для декодирования сигналов с кодировкой, используемой в системах связи.
Алгоритм Витерби предназначен для поиска наиболее вероятной последовательности скрытых состояний в моделя... |
01.07.2024 | Aqueduct: Как мы экономим железо для МЛ-вычислений | Привет! Меня зовут Олег Бугримов, я руковожу разработкой в команде Data Science SWAT в Авито. Мы занимаемся инженерией для машинного обучения. Одно из направлений - это оптимизация продового инференса. Наша задача чтобы модельки работали бы... |
28.06.2024 | Основы теории вероятностей для будущих программистов и дата-аналитиков | Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.
Вместе с Ильей Котовым, спе... |
27.06.2024 | Разделяй и запускай: делим тестовый стенд между департаментами | Промышленное математическое программирование - тема раскрученная в академической среде для стандартизированных случаев, но детали реальных внедрений раскрываются редко и спустя много лет.
В настоящей статье делюсь опытом разработки и внедре... |
25.06.2024 | Книга: «Тюнинг систем: экспериментирование для инженеров от A/B-тестирования до байесовской оптимизации» | Привет, Хаброжители!
Работает ли программа так, как следует? Изменения сделали систему лучше или хуже? Стоит ли заниматься повышением производительности вместо разработки нового функционала? На подобные вопросы можно ответить только с помощ... |
21.06.2024 | Он победил LLM RAG: реализуем BM25+ с самых азов | Привет, меня зовут Борис. Я автор телеграм канала Борис опять. Периодически мне на глаза попадается что-то интересное и я глубоко в этом закапываюсь. В данном случае это алгоритм поиска BM25+.
Статья началась с того, что я наткнулся на гром... |
19.06.2024 | «Как искусственные нейросети помогают в поиске любви: опыт использования для фильтрации анкет в дейтинг-приложении... | Девушка мечты ("представление" YandexART)
Заметили сколько новостей и статей начало выходить с упоминанием нейросетей и дейтинг приложений в одном тексте? Возможно научить нейросеть фильтровать анкеты в дейтинг сервисе? Помогает э... |