Edit

Papers With Code

https://paperswithcode.com/

Last activity: 14.11.2024

Active

Categories: InformationITLearnResearchScience

Papers With Code highlights trending Machine Learning research and the code to implement it.

Website visits

1.9M /mo.

Mentions

175

Location: United Kingdom, England, London

Twitter

Medium

Mentions in press and media 175

Date	Title	Description
14.11.2024	Сравнение бенчмарков LLM для разработки программного обеспечения	В этой статье мы сравним различные бенчмарки, которые помогают ранжировать крупные языковые модели для задач разработки программного обеспечения.Серия публикаций о бенчмаркинге LLM Прочтите все остальные статьи из серии Symflower об оценке ...
12.11.2024	Qwen2.5-Coder just changed the game for AI programming—and it’s free	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Alibaba Cloud has released Qwen2.5-Coder, a new AI coding assistant that has already become the second most popul...
11.11.2024	AI’s math problem: FrontierMath benchmark shows how far technology still has to go	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Artificial intelligence systems may be good at generating text, recognizing images, and even solving basic math p...
08.11.2024	Понимает ли Vision Llama импрессионистов?	Всем привет, меня зовут Арсений, я Data Scientist в компании Raft, и сегодня я расскажу вам про Visual Language Models (VLM). Большие языковые модели уже стали частью нашей жизни и мы применяем их, чтобы упростить современную рутину, а так ...
03.11.2024	The Digital Pulse: A Week in Tech and Gaming Innovations	In the fast-paced world of technology, each week brings a fresh wave of news, innovations, and reflections. This week, we dive into the heart of data centers, the legacy of digital libraries, and the cutting-edge developments in gaming AI. ...
03.11.2024	Нейросеть для симуляции CS: GO	В начале октября вышла модель DIAMOND, работающая в режиме игрового движка. Она эмулирует карту Dust 2 в игре CS: GO. По сути модель состоит из двух частей: модели, которая учитывает состояние игрового мира и диффузионной модели, генерирующ...
01.11.2024	AI on your smartphone? Hugging Face’s SmolLM2 brings powerful models to the palm of your hand	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Hugging Face today has released SmolLM2, a new family of compact language models that achieve impressive performa...
01.11.2024	5 Generative AI Trends to Watch in 2025	Generative AI is as trendy as it has ever been. This year, research into AI was awarded Nobel Prizes, and the largest tech companies in the world pumped AI into as many products as possible. The U.S. government promoted AI as a driver in cr...
31.10.2024	The Rise of Open-Source Text-to-Speech Solutions: A New Era in Voice Synthesis	In the world of technology, the voice is a powerful tool. It conveys emotion, intent, and information. Text-to-speech (TTS) technology has evolved dramatically, transforming how we interact with machines. Today, open-source solutions are at...
30.10.2024	Text-to-speech. Анализ открытых решений синтеза речи	Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в пользование результаты своих трудов (спасибо ...
16.10.2024	Искусство аугментации: как улучшить модели компьютерного зрения без сбора новых данных	Представьте, что вы разрабатываете модель компьютерного зрения для распознавания кошек на фотографиях. Чем больше разных фото кошек вы покажете модели, тем лучше она будет справляться с задачей. Но что делать, если у вас не хватает фотограф...
06.10.2024	Kaggle для футболистов: Классификация событий на футбольном поле	Всем привет! В конце 2022 года закончилось соревнование DFL - Bundesliga Data Shootout. Так как мне интересен футбол и в целом спортивная аналитика, то я решил поучаствовать в этом соревновании. Целью данной статьи является описание моего п...
03.10.2024	Тыкай и кидай голосовухи: как ускорить сбор данных для мультимодальности	Привет! Мы собираем много разных данных и часто перед заказчиком стоит большая описательная задача в области задач компьютерного зрения: детально и максимально подробно описывать всё, что присутствует на изображении или видео. В деталях опи...
25.09.2024	The Crucial Role of LLM Benchmarks in AI Development	In the rapidly evolving landscape of artificial intelligence, large language models (LLMs) have emerged as the backbone of numerous applications. From chatbots to content generation, their impact is profound. However, with great power comes...
25.09.2024	Ai2’s new Molmo open source AI models beat GPT-4o, Claude on some benchmarks	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More The Allen Institute for AI (Ai2) today unveiled Molmo, an open-source family of state-of-the-art multimodal AI mo...
24.09.2024	Полный гид по бенчмаркам LLM	В последние годы большие языковые модели (large language model, LLM) совершили революцию в мире искусственного интеллекта, став фундаментом для множества различных сфер, от чат-ботов до генерации контента. Однако такой прогресс несёт с собо...
23.09.2024	Самые популярные LLM бенчмарки	Зачем использовать бенчмарки для оценки LLM? Бенчмарки LLM помогают оценивать точность больших языковых моделей, обеспечивая стандартизированную процедуру измерения метрик выполнения различных задач. Бенчмарки содержат все структуры и данны...
19.09.2024	Microsoft’s GRIN-MoE AI model takes on coding and math, beating competitors in key benchmarks	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Microsoft has unveiled a groundbreaking artificial intelligence model, GRIN-MoE (Gradient-Informed Mixture-of-Exp...
19.09.2024	Применение LayoutXLM для извлечения сущностей из чеков	Немного о том, как устроена модель и с какими данными она работаетПодготовка данных для модели Первым делом требуется подготовить данные для прямого прохода (т.н. inference – тот процесс, который мы делаем, когда используем обученную модель...
19.09.2024	Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM...	Привет, Хабр! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Почти всегда при адаптации LLM-моделей встает вопрос нехватки ресурсов на проверку гипотез. Обычно у меня есть собственное рабочее время и две карточки GPU, а р...
04.09.2024	Как Яндекс создавал новую end2end-модель генерации коротких видео	Приложение Шедеврум начало использовать бета‑версию end2end‑модели YandexART (Vi). Она позволяет создавать пятисекундные видео по текстовому запросу и учитывает взаимосвязь между кадрами, делая видео более связными и плавными, чем при испол...
29.08.2024	Big Tech's Bold Bet on Local News: A Lifeline for Journalism	In a world where newsrooms are closing like autumn leaves falling from trees, big tech companies are stepping in with a lifeline. Google, in collaboration with California lawmakers and news organizations, has announced a groundbreaking agre...
26.08.2024	DeepMind and UC Berkeley shows how to make the most of LLM inference-time compute	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Given the high costs and slow speed of training large language models (LLMs), there is an ongoing discussion abou...
23.08.2024	Пайплайн распознавания транспортных средств: как это работает	Привет, Хабр! С вами Анастасия Белозерова, руководитель исследовательских проектов в области транспорта в VisionLabs. В прошлом посте я рассказала, какие задачи можно решить с помощью видеоаналитики. А сегодня объясню, как устроен наш пайпл...
21.08.2024	Повысить разрешение или улучшить качество генераций? Зачем выбирать, когда есть KandiSuperRes Flash	В апреле этого года мы выпустили модель Kandinsky 3.1, которая поддерживает много различных режимов, в том числе и возможность генерировать изображения в 4К с помощью диффузионной модели повышения разрешения KandiSuperRes. Подробнее про арх...
12.08.2024	Как оживить Кандинский матрицами вращений для генерации видео — модель Splitter Next (часть 3-я)	В первой части, был показан способ генерации видео за счет влияния на текстовый эмбеддинг изменениями от эмбеддингов кадров другого видео через матрицы вращений. Во второй части были показаны первичные подходы и реализации по генерации виде...
09.08.2024	Transfer learning: подробный гайд для начинающих	Трансферное обучение, или Transfer Learning (TL) — это метод в машинном обучении, при котором модель, обученная для одной задачи, переиспользуется для другой, связанной задачи. Представим, что человек умеет играть на гитаре и хочет освоить ...
08.08.2024	Alibaba claims no. 1 spot in AI math models with Qwen2-Math	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More If you haven’t heard of “Qwen2” it’s understandable, but that should all change starting today with a surprising ...
31.07.2024	Google’s tiny AI model ‘Gemma 2 2B’ challenges tech giants in surprising upset	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Google has just unveiled Gemma 2 2B, a compact yet powerful artificial intelligence model that rivals industry le...
26.07.2024	Meta's Llama 3.1: A Game Changer in Open AI Models	** In the ever-evolving landscape of artificial intelligence, Meta has thrown down the gauntlet with the release of Llama 3.1. This new model is not just another entry in the crowded field of AI; it’s a bold statement about the future of op...
23.07.2024	The first GPT-4-class AI model anyone can download has arrived: Llama 405B	Enlarge Benj Edwards / Getty Images reader comments 158 In the AI world, there's a buzz in the air about a new AI language model released Tuesday by Meta: Llama 3.1 405B. The reason? It's potentially the first time anyone can download a GPT...
18.07.2024	OpenAI launches GPT-4o mini, which will replace GPT-3.5 in ChatGPT	Enlarge Benj Edwards reader comments 32 On Thursday, OpenAI announced the launch of GPT-4o mini, a new, smaller version of its latest GPT-4o AI language model that will replace GPT-3.5 Turbo in ChatGPT, reports CNBC and Bloomberg. It will b...
16.07.2024	Какой трансформер в океане плавает быстрее всех? Тестируем скорость нейросетей для видео-энкодеров	Одно из направлений работы нашей команды компьютерного зрения Vision RnD в SberDevices — распознавание жестового языка. Об этой задаче и о том, как мы ее решаем, мы уже писали на Хабре тут и тут (а еще тут и тут). Некоторое время назад пере...
09.07.2024	Искусство общения с LLM: Гайд по техникам Prompt Engineering	Привет, Хабр! Меня зовут Никита Кулин, ML-Engineer NLP моделей. Это мой первый пост, поэтому буду рад любой обратной связи!Интро Большие языковые модели (LLM или БЯМ) становятся все более распространенными в производственных средах, посколь...
20.06.2024	Anthropic introduces Claude 3.5 Sonnet, matching GPT-4o on benchmarks	Enlarge Anthropic / Benj Edwards reader comments 43 On Thursday, Anthropic announced Claude 3.5 Sonnet, its latest AI language model and the first in a new series of "3.5" models that build upon Claude 3, launched in March. Claude...
11.06.2024	‘Embarrassingly simple’ probe finds AI in medical image diagnosis ‘worse than random’	It's time to celebrate the incredible women leading the way in AI! Nominate your inspiring leaders for VentureBeat’s Women in AI Awards today before June 18. Learn More Large language models (LLMs) and large multimodal models (LMMs) are inc...
01.06.2024	Архитектура RAG: часть вторая — Advanced RAG	С момента написания моей прошлой статьи прошло не так много времени, но прогрес не стоит на месте и произошло несколько важных изменений. Здесь я не буду рассматривать основы - почитайте оригинальную статью. Контекст Итак, первое важное изм...
31.05.2024	Reformer на TRAX?	Что такое Reformer и почему он круче Transformer’a? Давайте предварительно начнем с того, что же такой Reformer и почему благодаря ему мы можем рассчитывать на расширение контекстов вплоть до десятков тысяч слов. В классической архитектуре ...
31.05.2024	Как защититься от кражи нейронной сети: устойчивые цифровые водяные знаки	Привет, Хабр! Меня зовут Миша Паутов, я аспирант Сколтеха и научный сотрудник группы Доверенные и безопасные интеллектуальные системы Института AIRI. Совсем недавно мы вместе с коллегами предложили новый метод создания цифровых водяных знак...
16.05.2024	LLM field landscape	Привет, Хабр! TL;DR Это обзор на актуальные концепты, задачи, проблемы и исследования, связанные с Large Language Models (LLM) и Language Modeling (LM). Минимальные пререквизиты для чтения обзора: Вы имеете представление об NLP - вам знаком...
24.04.2024	Snowflake releases a flagship generative AI model of its own	All-around, highly generalizable generative AI models were the name of the game once, and they arguably still are. But increasingly, as cloud vendors large and small join the generative AI fray, we’re seeing a new crop of models focused on ...
22.04.2024	Meta's Llama 3 AI Model Takes the Lead in the AI Race	Meta's latest release of the Llama 3 AI model is making waves in the tech world, challenging competitors like OpenAI and Google. With its open-weights design and impressive parameter sizes, Llama 3 is set to revolutionize text composition, ...
19.04.2024	Meta* выпустила Llama 3 - самую мощную языковую модель с открытым исходным кодом	Эта языковая модель оценивается по тому, сколько входных токенов отправляется на вход и сколько выходных токенов генерируется. Кроме того, скоро вы сможете протестировать мультимодальный Meta AI на смарт-очках Ray-Ban от Meta. Еще больше ин...
18.04.2024	LLMs keep leaping with Llama 3, Meta’s newest open-weights AI model	Enlarge Getty Images \| Benj Edwards reader comments 15 On Thursday, Meta unveiled early versions of its Llama 3 open-weights AI model that can be used to power text composition, code generation, or chatbots. It also announced that its Meta ...
18.04.2024	Llama 3 launches alongside new stand-alone Meta AI chatbot	Discover how companies are responsibly integrating AI in production. This invite-only event in SF will explore the intersection of technology and business. Find out how you can attend here. It’s been anticipated for a while now, but today i...
15.04.2024	Использование LLM в автоматизации рутинных задач	Использование мультимодальной модели для навигации в браузере Всем привет! На связи Георгий Бредис, Deep Learning Engineer из команды Intelligent Document Processing в SberDevices. Наша команда занимается задачами автоматизации бизнес-проце...
12.04.2024	INFINIQ's AI Model Achieves Top Performance in Few-Shot Object Detection	SAN JOSE, Calif., April 12, 2024 /PRNewswire/ -- INFINIQ, a leading South Korean AI platform services company, announced a breakthrough in few-shot object detection with the publication of their research paper, "Re-scoring using Image-...
11.04.2024	Распознавание лиц на микрокомпьютерах	В последние годы появляется всё больше технологий с использованием Computer Vision: это и беспилотные автомобили, и Face ID в телефоне, и умные камеры, способные фиксировать утечку теплоизоляции крыши. Кто-то прогресс приветствует, кто-то н...
04.04.2024	Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту	Введение В 2023 году мы все наблюдали очень большой прогресс в области создания языковых, мультимодальных и генеративных моделей. Этот прогресс коснулся и привычной нам модальности изображений (Kandinsky 2.1, 2.2, 3.0, Stable Diffusion XL, ...
02.04.2024	Task contamination, интриги, расследования — почему one-shot и zero-shot заподозрили в загрязнении	Почти детективное расследование провели в Калифорнийском университете. Авторы взяли 12 разных LLM, включая GPT-3, и проверили их на датасетах, созданных в разное время — до и после обучения моделей. Обнаруженные артефакты указывают на то, ч...
02.04.2024	Мы так и не смогли защитить свою модель машинного обучения от состязательных атак. Пока	Наша команда разработчиков Исследовательского центра доверенного искусственного интеллекта ИСП РАН первые два года занималась построением сетевой системы обнаружения вторжений, основанной на применении методов машинного обучения. А в послед...
30.03.2024	Attention is Not All You Need: как менялась архитектура трансформера	С момента выхода оригинальной статьи про трансформер прошло уже больше 7 лет, и эта архитектура перевернула весь DL: начав с NLP она теперь применяется везде, включая генерацию картинок. Но та ли это архитектура или уже нет? В этой статье я...
28.03.2024	Мечтают ли компьютеры строить дома? или Как заставить нейросети определять ремонт в квартирах и улучшать объявления...	Как для большинства выглядит процесс постройки дома? Котлован, песок, цемент, какие-то блоки, снующие люди и техника, шум, пыль на пару лет и вот, дом готов. На самом деле всё давно не так. Точнее, так, но это, как говорится, frontend. Но с...
27.03.2024	With Quiet-STaR, language models learn to think before speaking	Join us in Atlanta on April 10th and explore the landscape of security workforce. We will explore the vision, benefits, and use cases of AI for security teams. Request an invite here. Humans are gifted with the ability to reason: “if” and “...
20.03.2024	Методы глубокого хэширования нового поколения	В последние годы наблюдается значительный рост объема данных, которые генерируются и сохраняются в различных форматах и большом масштабе. Одним из ключевых направлений в этой области является глубокое хеширование, которое обещает обеспечить...
11.03.2024	Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась	Удлиняем и крутим - RoPEBert Привет, Хабр! Если вы интересуетесь NLP или просто современными DL моделями, то приглашаю вас узнать, как можно, имея всего лишь одну A100, около 30 гигабайтов текста и несколько дней обучения, решить проблему о...
06.03.2024	Портретная гармонизация изображений	Привет! В данной публикации команда RnD CV из SberDevices познакомит вас с нашим подходом к решению задачи повышения степени реалистичности портретных изображений (по-научному — портретной гармонизации изображений). Мы провели ряд исследова...
04.03.2024	Anthropic unveils Claude 3, surpassing GPT-4 and Gemini Ultra in benchmark tests	Anthropic, a leading artificial intelligence startup, unveiled its Claude 3 series of AI models today, designed to meet the diverse needs of enterprise customers with a balance of intelligence, speed and cost efficiency. The lineup includes...
04.03.2024	The AI wars heat up with Claude 3, claimed to have “near-human” abilities	Enlarge / The Anthropic Claude 3 logo. Anthropic reader comments 109 On Monday, Anthropic released Claude 3, a family of three AI language models similar to those that power ChatGPT. Anthropic claims the models set new industry benchmarks a...
13.02.2024	Распознавание и перевод жестовых языков: обзор подходов	Введение Всем привет! В статье «Slovo и русский жестовый язык» мы рассказывали, как решаем задачу распознавания изолированных жестов, в статье «Русский жестовый язык: первое место в американском бенчмарке» делились результатами решения, а в...
03.02.2024	YOLO-World: распознавание произвольного числа объектов с высокой точностью и скоростью	Всем привет! Буквально несколько дней назад была представлена новая модель семейства Yolo. Ее основная фишка заключается в том, что в отличие от своих старших братьев, она способна распознавать на изображении фактически любые объекты (котор...
02.02.2024	Обзор по LLM	В прошлом году(2023) в мире больших языковых моделей(LLM) произошло много нового и интересного. В новостях появились фразы о гонке искусственных интеллектов, а многие именитые IT компании включились в эту гонку. В этой статье вместе рассмот...
29.01.2024	Meta releases ‘Code Llama 70B’, an open-source behemoth to rival private AI development	Meta AI, the company that brought you Llama 2, the gargantuan language model that can generate anything from tweets to essays, has just released a new and improved version of its code generation model, Code Llama 70B. This updated model can...
07.01.2024	Изучаем SQL в 2024 году	SQL — декларативный язык программирования, применяемый для создания, модификации и управления данными в реляционной базе данных, управляемой соответствующей системой управления базами данных. -Является, прежде всего, информационно-логически...
20.12.2023	Как дообучать огромные модели с максимальным качеством и минимальными затратами? LoRA	paper link hf implementation Для ответа на вопрос в заголовке - погрузимся в статью. Статья уже была частично разобрана в статье на Хабре, я же хочу погрузиться в статью более глубоко. Ближе к концу статьи начнет появляться не совсем тривиа...
12.12.2023	This New AI Breakthrough Reads Minds And Turns Them Into Text	Jace Dela Cruz, Tech Times 12 December 2023, 05:12 am
11.12.2023	Meta unveils Audiobox, an AI that clones voices and generates ambient sounds	Join leaders in San Francisco on January 10 for an exclusive night of networking, insights, and conversation. Request an invite here. Voice cloning is one of the areas rapidly emerging thanks to generative AI. The term refers to replicating...
09.12.2023	AI Challenge 2023: нейросети, кардиограммы и молодые умы	Церемония награждения победителей AI Challenge Привет, Хабр! Мы - Константин Егоров, Иван Свиридов и Николай Романенко, сотрудники Лаборатории искусственного интеллекта Сбера. В этом году наша команда участвовала в качестве экспертов и моде...
06.12.2023	Google’s AI chatbot Bard gets a big upgrade with Gemini, Google’s next-gen AI model	Google Bard, the company’s generative AI chatbot and ChatGPT rival, is getting an update today that the company claims will significantly enhance its capabilities. The company says Bard will now be powered by Gemini, Google’s newest and mos...
05.12.2023	AI Systems Are More Prone to Malicious Attacks Than Previously Believed, Study Finds	Jace Dela Cruz, Tech Times 05 December 2023, 04:12 am Artificial intelligence (AI) systems may be more susceptible to targeted malicious attacks than previously believed, according to a recent study. The research highlights the prevalence o...
04.12.2023	MLOps, часть III: критерии выбора инструментов и возможности Open Source	Машинное обучение так или иначе уже применяется в компаниях самых разных масштабов и направлений деятельности. Однако для выстраивания зрелой ML-инфраструктуры и перехода к эффективным MLOps-практикам требуется понимание: с чего начать, на ...
04.12.2023	Даже если случайно переставить буквы в словах, GPT-4 понимает текст	Цветом выделена токенизация Для представления внутри трансформеров слова или их небольшие части преобразуются в токены. Кажется, что если перемешать в каждом слове буквы, то языковая модель на трансформерах потеряет всякую способность поним...
01.12.2023	GigaChat и русский жестовый язык	Всем привет! Меня зовут Капитанов Александр, я отвечаю за направление компьютерного зрения в SberDevices. В этой статье я расскажу о том, как моя команда Vision RnD разработала серию моделей SignFlow, обеспечивающих перевод жестового языка ...
30.11.2023	Что общего между раком крови, лазерами и нейронными сетями?	Доброго времени суток, дорогой Habr, надеюсь вы успели заскучать после 3-х месяцев паузы (ссылка на прошлую статью). На связи снова Николай Иванов и сегодня вы узнаете, что общего между раком крови, лазерами и машинным обучением. В этой ста...
14.11.2023	Русский жестовый язык: первое место в американском бенчмарке	Нейросети для распознавания жестового языка, созданные командой компьютерного зрения RnD CV в SberDevices научились лучше всех в мире распознавать американский жестовый язык! Такой результат был достигнут благодаря нашему датасету русского ...
27.10.2023	От Style Transfer до диффузии: эволюция визуальных эффектов на смартфонах Когда-то 3D-маски онлайн были прорывом Классической стилизацией никого не удивишь, даешь нейросети Надеваем маску при помощ...	Четыре года я занимаюсь разработкой различных спецэффектов для фото и видео в мобильных приложениях. Вроде бы это локальная и как бы несерьезная тема, но одну только плачущую маску в Snapchat посмотрели 9 млрд раз. Такие штуки пользуются бе...
27.10.2023	Объясняем простым языком, что такое трансформеры	Облако предлагает много возможностей для развития ИИ. С помощью облачных вычислений проще масштабировать ML-модели, повышать точность обучения и предоставлять данные удаленно пользователям. Однако масштабное развертывание ML-моделей требует...
10.10.2023	LLaMA 2, RWKV, Santacoder и другие LLM на iOS	Однажды я решил изучить язык Swift и разработать свое первое приложение для iOS. Для этого я решил создать реальный проект, который заключался в оптимизации нашумевшего LLaMA.cpp под iOS. Я поставил перед собой задачу обеспечить запуск 3B и...
21.09.2023	NVIDIA's Meteoric Rise Threatens Google's Empire	In this photo illustration, the logo of NVIDIA is seen displayed on a mobile phone screen with AI ... [+] (artificial intelligence) written in the background. (Photo Illustration by Idrees Abbas/SOPA Images/LightRocket via Getty Images)SOPA...
19.09.2023	Telling AI model to “take a deep breath” causes math scores to soar in study	Enlarge Getty Images reader comments 93 with Google DeepMind researchers recently developed a technique to improve math ability in AI language models like ChatGPT by using other AI models to improve prompting—the written instructions that t...
15.08.2023	Model soups: альтернатива ансамблированию при файнтюнинге моделей	Если зайти на Papers With Code и посмотреть на лидерборд для image classification на ImageNet (а также различных его вариациях), то можно обнаружить в топ-5 модель с незамысловатым названием model soups. В этой статье мы разберемся с тем, ч...
11.08.2023	Распределённое обучение с PyTorch на кластере для тех, кто спешит	Глубокие модели становятся всё больше и всё реже помещаются на один компьютер. Решением этой проблемы может быть распределённое обучение, когда используются ресурсы нескольких вычислительных узлов. Представляю вниманию хабрассобщества перев...
02.08.2023	MiVOLO: новая State-of-the-Art нейросеть с открытым исходным кодом для определения пола и возраста по фотографии	Привет, Хабр! Хочу рассказать вам нашу историю о том, как изначально рутинная рабочая задача закончилась созданием открытой В области технологий, науки и исследований, термин применяется для обозначения наиболее современных и точных подходо...
02.08.2023	Как сделать контекстное окно на 100K в большой языковой модели: обо всех фокусах в одном посте	От переводчика: выражаю огромную искреннюю благодарность Дмитрию Малову @malovdmitrijза консультации по ходу этого перевода, помощь в подборе формулировок, пояснение рисунков и незаменимую человеческую поддержку. tldr; в статье рассмотрены ...
28.07.2023	Google’s RT-2 AI model brings us one step closer to WALL-E	Enlarge / A Google robot controlled by RT-2. Google reader comments 11 with On Friday, Google DeepMind announced Robotic Transformer 2 (RT-2), a "first-of-its-kind" vision-language-action (VLA) model that uses data scraped from th...
11.07.2023	New ChatGPT rival, Claude 2, launches for open beta testing	Enlarge Anthropic reader comments 23 with On Tuesday, Anthropic introduced Claude 2, a large language model (LLM) similar to ChatGPT that can craft code, analyze text, and write compositions. Unlike the original version of Claude launched i...
10.07.2023	Генерируй, дискриминируй. Как мы ускорили доменную адаптацию GAN для генерации лиц в пять тысяч раз	Всем привет! Меня зовут Айбек Аланов. Я — аспирант ВШЭ, а также научный сотрудник группы «Вероятностные методы машинного обучения» AIRI. Сегодня мне хотелось бы поделиться с вами успехами, которых добилась наша научная группа в вопросе адап...
07.07.2023	VOT Challenge: как мы поучаствовали в соревнованиях по компьютерному зрению	Привет, хабристы. В этой короткой заметке мы хотим рассказать о нашем опыте участия в конкурсе по компьютерному зрению - VOT Challenge 2023, посвященном трекингу объектов на видео. Порефлексируем об ошибках, которые мы допустили и зачем воо...
20.06.2023	Матирование изображений, или как получить фотореалистичный передний план	В последнее время в области компьютерного зрения произошло много революционных событий, но есть ряд классических задач, решение которых остается актуальным. Одна из них — матирование, которое применяется для редактирования изображений и вид...
02.06.2023	Ускоряем процесс разметки с помощью интерактивной сегментации	Всем привет! Сегодня поговорим про задачу интерактивной сегментации на основе кликов (click-based) и как она может ускорить процесс разметки данных для различных типов сегментации. Сегментационные модели применяются в распознавании событий ...
16.05.2023	Как нейросеть достопримечательности на фотокарточках распознавала	Введение Всем привет. Это мой первый пост и первый обзор на работу. В двух словах опишу, чем это я тут занимался. Цель проекта заключалась в распознавании достопримечательностей на фотографиях при помощи машинного обучения, а именно свёрточ...
27.04.2023	EasyPortrait — портретная сегментация и анализ лиц	EasyPortrait Dataset Всем привет! Наверняка, кто-то из вас уже пользовался сервисом видеоконференций SberJazz. Мы в нашей RnD команде решили помочь ребятам с задачей замены фона, для чего создали подходящий датасет и провели ряд исследовани...
03.04.2023	Большие языковые модели как новый инструмент в научной работе	На волне хайпа вокруг ИИ высказываются все и вся, чем-то напоминая мне ситуацию вокруг Биткойна, когда вроде бы уважаемые люди вдруг начали говорить про него прямо противоположные вещи (криптовалюты это полезно - ИИ это полезно / запретить ...
21.03.2023	Полезные материалы по Data Science и машинному обучению, которые помогут пройти сквозь джунгли из терминов	Привет, Хабр! Меня зовут Ефим, я MLOps-инженер в Selectel. В прошлом был автоматизатором, ML-инженером, дата-аналитиком и дата-инженером — и уже несколько лет падаю в пропасть машинного обучения и Data Science. Это буквально необъятная сфер...
20.03.2023	Стартап Adept привлек $350 млн на разработку "универсального ИИ-ассистента" общего назначения	Технологический стартап Adept, занимающийся разработкой универсального ИИ-инструмента для автоматизации различных рабочих и персональных задач, привлек 350 миллионов долларов в рамках раунда финансирования серии B. Помимо венчурных фирм, св...
18.03.2023	GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато	В этой статье мы разберем новые удивительные способности последней языковой модели из семейства GPT (от понимания мемов до программирования), немного покопаемся у нее под капотом, а также попробуем понять – насколько близко искусственный ин...
18.03.2023	GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато	В этой статье мы разберем новые удивительные способности последней языковой модели из семейства GPT (от понимания мемов до программирования), немного покопаемся у нее под капотом, а также попробуем понять – насколько близко искусственный ин...
18.03.2023	GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато	В этой статье мы разберем новые удивительные способности последней языковой модели из семейства GPT (от понимания мемов до программирования), немного покопаемся у нее под капотом, а также попробуем понять – насколько близко искусственный ин...
14.03.2023	Медицинские датасеты для машинного обучения: цели, типы и способы применения	Международная система здравоохранения ежедневно генерирует множество медицинских данных, которые (по крайней мере, теоретически) можно использовать для машинного обучения. В любой отрасли данные считаются ценным ресурсом, который помогает к...
26.02.2023	О «раздутом пузыре» нейросетей	На днях я наткнулся на одно любопытное видео: Моей первой реакцией было Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще? отрицание и усталость, потому что всё это я уже слышу с ра...

Papers With Code

Mentions in press and media 175

Reviews 0