Date | Title | Description |
14.11.2024 | Сравнение бенчмарков LLM для разработки программного обеспечения | В этой статье мы сравним различные бенчмарки, которые помогают ранжировать крупные языковые модели для задач разработки программного обеспечения.Серия публикаций о бенчмаркинге LLM
Прочтите все остальные статьи из серии Symflower об оценке ... |
12.11.2024 | Qwen2.5-Coder just changed the game for AI programming—and it’s free | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Alibaba Cloud has released Qwen2.5-Coder, a new AI coding assistant that has already become the second most popul... |
11.11.2024 | AI’s math problem: FrontierMath benchmark shows how far technology still has to go | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Artificial intelligence systems may be good at generating text, recognizing images, and even solving basic math p... |
08.11.2024 | Понимает ли Vision Llama импрессионистов? | Всем привет, меня зовут Арсений, я Data Scientist в компании Raft, и сегодня я расскажу вам про Visual Language Models (VLM).
Большие языковые модели уже стали частью нашей жизни и мы применяем их, чтобы упростить современную рутину, а так ... |
03.11.2024 | The Digital Pulse: A Week in Tech and Gaming Innovations | In the fast-paced world of technology, each week brings a fresh wave of news, innovations, and reflections. This week, we dive into the heart of data centers, the legacy of digital libraries, and the cutting-edge developments in gaming AI. ... |
03.11.2024 | Нейросеть для симуляции CS: GO | В начале октября вышла модель DIAMOND, работающая в режиме игрового движка. Она эмулирует карту Dust 2 в игре CS: GO. По сути модель состоит из двух частей: модели, которая учитывает состояние игрового мира и диффузионной модели, генерирующ... |
01.11.2024 | AI on your smartphone? Hugging Face’s SmolLM2 brings powerful models to the palm of your hand | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Hugging Face today has released SmolLM2, a new family of compact language models that achieve impressive performa... |
01.11.2024 | 5 Generative AI Trends to Watch in 2025 | Generative AI is as trendy as it has ever been.
This year, research into AI was awarded Nobel Prizes, and the largest tech companies in the world pumped AI into as many products as possible. The U.S. government promoted AI as a driver in cr... |
31.10.2024 | The Rise of Open-Source Text-to-Speech Solutions: A New Era in Voice Synthesis | In the world of technology, the voice is a powerful tool. It conveys emotion, intent, and information. Text-to-speech (TTS) technology has evolved dramatically, transforming how we interact with machines. Today, open-source solutions are at... |
30.10.2024 | Text-to-speech. Анализ открытых решений синтеза речи | Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в пользование результаты своих трудов (спасибо ... |
16.10.2024 | Искусство аугментации: как улучшить модели компьютерного зрения без сбора новых данных | Представьте, что вы разрабатываете модель компьютерного зрения для распознавания кошек на фотографиях. Чем больше разных фото кошек вы покажете модели, тем лучше она будет справляться с задачей. Но что делать, если у вас не хватает фотограф... |
06.10.2024 | Kaggle для футболистов: Классификация событий на футбольном поле | Всем привет! В конце 2022 года закончилось соревнование DFL - Bundesliga Data Shootout. Так как мне интересен футбол и в целом спортивная аналитика, то я решил поучаствовать в этом соревновании. Целью данной статьи является описание моего п... |
03.10.2024 | Тыкай и кидай голосовухи: как ускорить сбор данных для мультимодальности | Привет! Мы собираем много разных данных и часто перед заказчиком стоит большая описательная задача в области задач компьютерного зрения: детально и максимально подробно описывать всё, что присутствует на изображении или видео.
В деталях опи... |
25.09.2024 | The Crucial Role of LLM Benchmarks in AI Development | In the rapidly evolving landscape of artificial intelligence, large language models (LLMs) have emerged as the backbone of numerous applications. From chatbots to content generation, their impact is profound. However, with great power comes... |
25.09.2024 | Ai2’s new Molmo open source AI models beat GPT-4o, Claude on some benchmarks | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
The Allen Institute for AI (Ai2) today unveiled Molmo, an open-source family of state-of-the-art multimodal AI mo... |
24.09.2024 | Полный гид по бенчмаркам LLM | В последние годы большие языковые модели (large language model, LLM) совершили революцию в мире искусственного интеллекта, став фундаментом для множества различных сфер, от чат-ботов до генерации контента. Однако такой прогресс несёт с собо... |
23.09.2024 | Самые популярные LLM бенчмарки | Зачем использовать бенчмарки для оценки LLM?
Бенчмарки LLM помогают оценивать точность больших языковых моделей, обеспечивая стандартизированную процедуру измерения метрик выполнения различных задач.
Бенчмарки содержат все структуры и данны... |
19.09.2024 | Microsoft’s GRIN-MoE AI model takes on coding and math, beating competitors in key benchmarks | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Microsoft has unveiled a groundbreaking artificial intelligence model, GRIN-MoE (Gradient-Informed Mixture-of-Exp... |
19.09.2024 | Применение LayoutXLM для извлечения сущностей из чеков | Немного о том, как устроена модель и с какими данными она работаетПодготовка данных для модели
Первым делом требуется подготовить данные для прямого прохода (т.н. inference – тот процесс, который мы делаем, когда используем обученную модель... |
19.09.2024 | Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM... | Привет, Хабр! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Почти всегда при адаптации LLM-моделей встает вопрос нехватки ресурсов на проверку гипотез. Обычно у меня есть собственное рабочее время и две карточки GPU, а р... |
04.09.2024 | Как Яндекс создавал новую end2end-модель генерации коротких видео | Приложение Шедеврум начало использовать бета‑версию end2end‑модели YandexART (Vi). Она позволяет создавать пятисекундные видео по текстовому запросу и учитывает взаимосвязь между кадрами, делая видео более связными и плавными, чем при испол... |
29.08.2024 | Big Tech's Bold Bet on Local News: A Lifeline for Journalism | In a world where newsrooms are closing like autumn leaves falling from trees, big tech companies are stepping in with a lifeline. Google, in collaboration with California lawmakers and news organizations, has announced a groundbreaking agre... |
26.08.2024 | DeepMind and UC Berkeley shows how to make the most of LLM inference-time compute | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Given the high costs and slow speed of training large language models (LLMs), there is an ongoing discussion abou... |
23.08.2024 | Пайплайн распознавания транспортных средств: как это работает | Привет, Хабр! С вами Анастасия Белозерова, руководитель исследовательских проектов в области транспорта в VisionLabs. В прошлом посте я рассказала, какие задачи можно решить с помощью видеоаналитики. А сегодня объясню, как устроен наш пайпл... |
21.08.2024 | Повысить разрешение или улучшить качество генераций? Зачем выбирать, когда есть KandiSuperRes Flash | В апреле этого года мы выпустили модель Kandinsky 3.1, которая поддерживает много различных режимов, в том числе и возможность генерировать изображения в 4К с помощью диффузионной модели повышения разрешения KandiSuperRes. Подробнее про арх... |
12.08.2024 | Как оживить Кандинский матрицами вращений для генерации видео — модель Splitter Next (часть 3-я) | В первой части, был показан способ генерации видео за счет влияния на текстовый эмбеддинг изменениями от эмбеддингов кадров другого видео через матрицы вращений. Во второй части были показаны первичные подходы и реализации по генерации виде... |
09.08.2024 | Transfer learning: подробный гайд для начинающих | Трансферное обучение, или Transfer Learning (TL) — это метод в машинном обучении, при котором модель, обученная для одной задачи, переиспользуется для другой, связанной задачи.
Представим, что человек умеет играть на гитаре и хочет освоить ... |
08.08.2024 | Alibaba claims no. 1 spot in AI math models with Qwen2-Math | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
If you haven’t heard of “Qwen2” it’s understandable, but that should all change starting today with a surprising ... |
31.07.2024 | Google’s tiny AI model ‘Gemma 2 2B’ challenges tech giants in surprising upset | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Google has just unveiled Gemma 2 2B, a compact yet powerful artificial intelligence model that rivals industry le... |
26.07.2024 | Meta's Llama 3.1: A Game Changer in Open AI Models**
** | ** In the ever-evolving landscape of artificial intelligence, Meta has thrown down the gauntlet with the release of Llama 3.1. This new model is not just another entry in the crowded field of AI; it’s a bold statement about the future of op... |
23.07.2024 | The first GPT-4-class AI model anyone can download has arrived: Llama 405B | Enlarge
Benj Edwards / Getty Images reader comments 158
In the AI world, there's a buzz in the air about a new AI language model released Tuesday by Meta: Llama 3.1 405B. The reason? It's potentially the first time anyone can download a GPT... |
18.07.2024 | OpenAI launches GPT-4o mini, which will replace GPT-3.5 in ChatGPT | Enlarge
Benj Edwards reader comments 32
On Thursday, OpenAI announced the launch of GPT-4o mini, a new, smaller version of its latest GPT-4o AI language model that will replace GPT-3.5 Turbo in ChatGPT, reports CNBC and Bloomberg. It will b... |
16.07.2024 | Какой трансформер в океане плавает быстрее всех? Тестируем скорость нейросетей для видео-энкодеров | Одно из направлений работы нашей команды компьютерного зрения Vision RnD в SberDevices — распознавание жестового языка. Об этой задаче и о том, как мы ее решаем, мы уже писали на Хабре тут и тут (а еще тут и тут). Некоторое время назад пере... |
09.07.2024 | Искусство общения с LLM: Гайд по техникам Prompt Engineering | Привет, Хабр! Меня зовут Никита Кулин, ML-Engineer NLP моделей. Это мой первый пост, поэтому буду рад любой обратной связи!Интро
Большие языковые модели (LLM или БЯМ) становятся все более распространенными в производственных средах, посколь... |
20.06.2024 | Anthropic introduces Claude 3.5 Sonnet, matching GPT-4o on benchmarks | Enlarge
Anthropic / Benj Edwards reader comments 43
On Thursday, Anthropic announced Claude 3.5 Sonnet, its latest AI language model and the first in a new series of "3.5" models that build upon Claude 3, launched in March. Claude... |
11.06.2024 | ‘Embarrassingly simple’ probe finds AI in medical image diagnosis ‘worse than random’ | It's time to celebrate the incredible women leading the way in AI! Nominate your inspiring leaders for VentureBeat’s Women in AI Awards today before June 18. Learn More
Large language models (LLMs) and large multimodal models (LMMs) are inc... |
01.06.2024 | Архитектура RAG: часть вторая — Advanced RAG | С момента написания моей прошлой статьи прошло не так много времени, но прогрес не стоит на месте и произошло несколько важных изменений. Здесь я не буду рассматривать основы - почитайте оригинальную статью. Контекст
Итак, первое важное изм... |
31.05.2024 | Reformer на TRAX? | Что такое Reformer и почему он круче Transformer’a?
Давайте предварительно начнем с того, что же такой Reformer и почему благодаря ему мы можем рассчитывать на расширение контекстов вплоть до десятков тысяч слов.
В классической архитектуре ... |
31.05.2024 | Как защититься от кражи нейронной сети: устойчивые цифровые водяные знаки | Привет, Хабр! Меня зовут Миша Паутов, я аспирант Сколтеха и научный сотрудник группы Доверенные и безопасные интеллектуальные системы Института AIRI. Совсем недавно мы вместе с коллегами предложили новый метод создания цифровых водяных знак... |
16.05.2024 | LLM field landscape | Привет, Хабр!
TL;DR
Это обзор на актуальные концепты, задачи, проблемы и исследования, связанные с Large Language Models (LLM) и Language Modeling (LM).
Минимальные пререквизиты для чтения обзора:
Вы имеете представление об NLP - вам знаком... |
24.04.2024 | Snowflake releases a flagship generative AI model of its own | All-around, highly generalizable generative AI models were the name of the game once, and they arguably still are. But increasingly, as cloud vendors large and small join the generative AI fray, we’re seeing a new crop of models focused on ... |
22.04.2024 | Meta's Llama 3 AI Model Takes the Lead in the AI Race | Meta's latest release of the Llama 3 AI model is making waves in the tech world, challenging competitors like OpenAI and Google. With its open-weights design and impressive parameter sizes, Llama 3 is set to revolutionize text composition, ... |
19.04.2024 | Meta* выпустила Llama 3 - самую мощную языковую модель с открытым исходным кодом | Эта языковая модель оценивается по тому, сколько входных токенов отправляется на вход и сколько выходных токенов генерируется.
Кроме того, скоро вы сможете протестировать мультимодальный Meta AI на смарт-очках Ray-Ban от Meta.
Еще больше ин... |
18.04.2024 | LLMs keep leaping with Llama 3, Meta’s newest open-weights AI model | Enlarge
Getty Images | Benj Edwards reader comments 15
On Thursday, Meta unveiled early versions of its Llama 3 open-weights AI model that can be used to power text composition, code generation, or chatbots. It also announced that its Meta ... |
18.04.2024 | Llama 3 launches alongside new stand-alone Meta AI chatbot | Discover how companies are responsibly integrating AI in production. This invite-only event in SF will explore the intersection of technology and business. Find out how you can attend here.
It’s been anticipated for a while now, but today i... |
15.04.2024 | Использование LLM в автоматизации рутинных задач | Использование мультимодальной модели для навигации в браузере
Всем привет!
На связи Георгий Бредис, Deep Learning Engineer из команды Intelligent Document Processing в SberDevices. Наша команда занимается задачами автоматизации бизнес-проце... |
12.04.2024 | INFINIQ's AI Model Achieves Top Performance in Few-Shot Object Detection | SAN JOSE, Calif., April 12, 2024 /PRNewswire/ -- INFINIQ, a leading South Korean AI platform services company, announced a breakthrough in few-shot object detection with the publication of their research paper, "Re-scoring using Image-... |
11.04.2024 | Распознавание лиц на микрокомпьютерах | В последние годы появляется всё больше технологий с использованием Computer Vision: это и беспилотные автомобили, и Face ID в телефоне, и умные камеры, способные фиксировать утечку теплоизоляции крыши. Кто-то прогресс приветствует, кто-то н... |
04.04.2024 | Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту | Введение
В 2023 году мы все наблюдали очень большой прогресс в области создания языковых, мультимодальных и генеративных моделей. Этот прогресс коснулся и привычной нам модальности изображений (Kandinsky 2.1, 2.2, 3.0, Stable Diffusion XL, ... |
02.04.2024 | Task contamination, интриги, расследования — почему one-shot и zero-shot заподозрили в загрязнении | Почти детективное расследование провели в Калифорнийском университете. Авторы взяли 12 разных LLM, включая GPT-3, и проверили их на датасетах, созданных в разное время — до и после обучения моделей. Обнаруженные артефакты указывают на то, ч... |
02.04.2024 | Мы так и не смогли защитить свою модель машинного обучения от состязательных атак. Пока | Наша команда разработчиков Исследовательского центра доверенного искусственного интеллекта ИСП РАН первые два года занималась построением сетевой системы обнаружения вторжений, основанной на применении методов машинного обучения. А в послед... |
30.03.2024 | Attention is Not All You Need: как менялась архитектура трансформера | С момента выхода оригинальной статьи про трансформер прошло уже больше 7 лет, и эта архитектура перевернула весь DL: начав с NLP она теперь применяется везде, включая генерацию картинок. Но та ли это архитектура или уже нет? В этой статье я... |
28.03.2024 | Мечтают ли компьютеры строить дома? или Как заставить нейросети определять ремонт в квартирах и улучшать объявления... | Как для большинства выглядит процесс постройки дома? Котлован, песок, цемент, какие-то блоки, снующие люди и техника, шум, пыль на пару лет и вот, дом готов. На самом деле всё давно не так. Точнее, так, но это, как говорится, frontend. Но с... |
27.03.2024 | With Quiet-STaR, language models learn to think before speaking | Join us in Atlanta on April 10th and explore the landscape of security workforce. We will explore the vision, benefits, and use cases of AI for security teams. Request an invite here.
Humans are gifted with the ability to reason: “if” and “... |
20.03.2024 | Методы глубокого хэширования нового поколения | В последние годы наблюдается значительный рост объема данных, которые генерируются и сохраняются в различных форматах и большом масштабе. Одним из ключевых направлений в этой области является глубокое хеширование, которое обещает обеспечить... |
11.03.2024 | Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась | Удлиняем и крутим - RoPEBert
Привет, Хабр! Если вы интересуетесь NLP или просто современными DL моделями, то приглашаю вас узнать, как можно, имея всего лишь одну A100, около 30 гигабайтов текста и несколько дней обучения, решить проблему о... |
06.03.2024 | Портретная гармонизация изображений | Привет! В данной публикации команда RnD CV из SberDevices познакомит вас с нашим подходом к решению задачи повышения степени реалистичности портретных изображений (по-научному — портретной гармонизации изображений). Мы провели ряд исследова... |
04.03.2024 | Anthropic unveils Claude 3, surpassing GPT-4 and Gemini Ultra in benchmark tests | Anthropic, a leading artificial intelligence startup, unveiled its Claude 3 series of AI models today, designed to meet the diverse needs of enterprise customers with a balance of intelligence, speed and cost efficiency. The lineup includes... |
04.03.2024 | The AI wars heat up with Claude 3, claimed to have “near-human” abilities | Enlarge / The Anthropic Claude 3 logo.
Anthropic reader comments 109
On Monday, Anthropic released Claude 3, a family of three AI language models similar to those that power ChatGPT. Anthropic claims the models set new industry benchmarks a... |
13.02.2024 | Распознавание и перевод жестовых языков: обзор подходов | Введение
Всем привет! В статье «Slovo и русский жестовый язык» мы рассказывали, как решаем задачу распознавания изолированных жестов, в статье «Русский жестовый язык: первое место в американском бенчмарке» делились результатами решения, а в... |
03.02.2024 | YOLO-World: распознавание произвольного числа объектов с высокой точностью и скоростью | Всем привет! Буквально несколько дней назад была представлена новая модель семейства Yolo. Ее основная фишка заключается в том, что в отличие от своих старших братьев, она способна распознавать на изображении фактически любые объекты (котор... |
02.02.2024 | Обзор по LLM | В прошлом году(2023) в мире больших языковых моделей(LLM) произошло много нового и интересного. В новостях появились фразы о гонке искусственных интеллектов, а многие именитые IT компании включились в эту гонку. В этой статье вместе рассмот... |
29.01.2024 | Meta releases ‘Code Llama 70B’, an open-source behemoth to rival private AI development | Meta AI, the company that brought you Llama 2, the gargantuan language model that can generate anything from tweets to essays, has just released a new and improved version of its code generation model, Code Llama 70B. This updated model can... |
07.01.2024 | Изучаем SQL в 2024 году | SQL — декларативный язык программирования, применяемый для создания, модификации и управления данными в реляционной базе данных, управляемой соответствующей системой управления базами данных.
-Является, прежде всего, информационно-логически... |
20.12.2023 | Как дообучать огромные модели с максимальным качеством и минимальными затратами? LoRA | paper link
hf implementation
Для ответа на вопрос в заголовке - погрузимся в статью.
Статья уже была частично разобрана в статье на Хабре, я же хочу погрузиться в статью более глубоко. Ближе к концу статьи начнет появляться не совсем тривиа... |
12.12.2023 | This New AI Breakthrough Reads Minds And Turns Them Into Text | Jace Dela Cruz, Tech Times 12 December 2023, 05:12 am |
11.12.2023 | Meta unveils Audiobox, an AI that clones voices and generates ambient sounds | Join leaders in San Francisco on January 10 for an exclusive night of networking, insights, and conversation. Request an invite here.
Voice cloning is one of the areas rapidly emerging thanks to generative AI. The term refers to replicating... |
09.12.2023 | AI Challenge 2023: нейросети, кардиограммы и молодые умы | Церемония награждения победителей AI Challenge
Привет, Хабр!
Мы - Константин Егоров, Иван Свиридов и Николай Романенко, сотрудники Лаборатории искусственного интеллекта Сбера. В этом году наша команда участвовала в качестве экспертов и моде... |
06.12.2023 | Google’s AI chatbot Bard gets a big upgrade with Gemini, Google’s next-gen AI model | Google Bard, the company’s generative AI chatbot and ChatGPT rival, is getting an update today that the company claims will significantly enhance its capabilities. The company says Bard will now be powered by Gemini, Google’s newest and mos... |
05.12.2023 | AI Systems Are More Prone to Malicious Attacks Than Previously Believed, Study Finds | Jace Dela Cruz, Tech Times 05 December 2023, 04:12 am
Artificial intelligence (AI) systems may be more susceptible to targeted malicious attacks than previously believed, according to a recent study.
The research highlights the prevalence o... |
04.12.2023 | MLOps, часть III: критерии выбора инструментов и возможности Open Source | Машинное обучение так или иначе уже применяется в компаниях самых разных масштабов и направлений деятельности. Однако для выстраивания зрелой ML-инфраструктуры и перехода к эффективным MLOps-практикам требуется понимание: с чего начать, на ... |
04.12.2023 | Даже если случайно переставить буквы в словах, GPT-4 понимает текст | Цветом выделена токенизация
Для представления внутри трансформеров слова или их небольшие части преобразуются в токены. Кажется, что если перемешать в каждом слове буквы, то языковая модель на трансформерах потеряет всякую способность поним... |
01.12.2023 | GigaChat и русский жестовый язык | Всем привет! Меня зовут Капитанов Александр, я отвечаю за направление компьютерного зрения в SberDevices. В этой статье я расскажу о том, как моя команда Vision RnD разработала серию моделей SignFlow, обеспечивающих перевод жестового языка ... |
30.11.2023 | Что общего между раком крови, лазерами и нейронными сетями? | Доброго времени суток, дорогой Habr, надеюсь вы успели заскучать после 3-х месяцев паузы (ссылка на прошлую статью). На связи снова Николай Иванов и сегодня вы узнаете, что общего между раком крови, лазерами и машинным обучением. В этой ста... |
14.11.2023 | Русский жестовый язык: первое место в американском бенчмарке | Нейросети для распознавания жестового языка, созданные командой компьютерного зрения RnD CV в SberDevices научились лучше всех в мире распознавать американский жестовый язык!
Такой результат был достигнут благодаря нашему датасету русского ... |
27.10.2023 | От Style Transfer до диффузии: эволюция визуальных эффектов на смартфонах
Когда-то 3D-маски онлайн были прорывом
Классической стилизацией никого не удивишь, даешь нейросети
Надеваем маску при помощ... | Четыре года я занимаюсь разработкой различных спецэффектов для фото и видео в мобильных приложениях. Вроде бы это локальная и как бы несерьезная тема, но одну только плачущую маску в Snapchat посмотрели 9 млрд раз. Такие штуки пользуются бе... |
27.10.2023 | Объясняем простым языком, что такое трансформеры | Облако предлагает много возможностей для развития ИИ. С помощью облачных вычислений проще масштабировать ML-модели, повышать точность обучения и предоставлять данные удаленно пользователям. Однако масштабное развертывание ML-моделей требует... |
10.10.2023 | LLaMA 2, RWKV, Santacoder и другие LLM на iOS | Однажды я решил изучить язык Swift и разработать свое первое приложение для iOS. Для этого я решил создать реальный проект, который заключался в оптимизации нашумевшего LLaMA.cpp под iOS. Я поставил перед собой задачу обеспечить запуск 3B и... |
21.09.2023 | NVIDIA's Meteoric Rise Threatens Google's Empire | In this photo illustration, the logo of NVIDIA is seen displayed on a mobile phone screen with AI ... [+] (artificial intelligence) written in the background. (Photo Illustration by Idrees Abbas/SOPA Images/LightRocket via Getty Images)SOPA... |
19.09.2023 | Telling AI model to “take a deep breath” causes math scores to soar in study | Enlarge
Getty Images reader comments 93 with
Google DeepMind researchers recently developed a technique to improve math ability in AI language models like ChatGPT by using other AI models to improve prompting—the written instructions that t... |
15.08.2023 | Model soups: альтернатива ансамблированию при файнтюнинге моделей | Если зайти на Papers With Code и посмотреть на лидерборд для image classification на ImageNet (а также различных его вариациях), то можно обнаружить в топ-5 модель с незамысловатым названием model soups.
В этой статье мы разберемся с тем, ч... |
11.08.2023 | Распределённое обучение с PyTorch на кластере для тех, кто спешит | Глубокие модели становятся всё больше и всё реже помещаются на один компьютер. Решением этой проблемы может быть распределённое обучение, когда используются ресурсы нескольких вычислительных узлов.
Представляю вниманию хабрассобщества перев... |
02.08.2023 | MiVOLO: новая State-of-the-Art нейросеть с открытым исходным кодом для определения пола и возраста по фотографии | Привет, Хабр!
Хочу рассказать вам нашу историю о том, как изначально рутинная рабочая задача закончилась созданием открытой В области технологий, науки и исследований, термин применяется для обозначения наиболее современных и точных подходо... |
02.08.2023 | Как сделать контекстное окно на 100K в большой языковой модели: обо всех фокусах в одном посте | От переводчика: выражаю огромную искреннюю благодарность Дмитрию Малову @malovdmitrijза консультации по ходу этого перевода, помощь в подборе формулировок, пояснение рисунков и незаменимую человеческую поддержку.
tldr; в статье рассмотрены ... |
28.07.2023 | Google’s RT-2 AI model brings us one step closer to WALL-E | Enlarge / A Google robot controlled by RT-2.
Google reader comments 11 with
On Friday, Google DeepMind announced Robotic Transformer 2 (RT-2), a "first-of-its-kind" vision-language-action (VLA) model that uses data scraped from th... |
11.07.2023 | New ChatGPT rival, Claude 2, launches for open beta testing | Enlarge
Anthropic reader comments 23 with
On Tuesday, Anthropic introduced Claude 2, a large language model (LLM) similar to ChatGPT that can craft code, analyze text, and write compositions. Unlike the original version of Claude launched i... |
10.07.2023 | Генерируй, дискриминируй. Как мы ускорили доменную адаптацию GAN для генерации лиц в пять тысяч раз | Всем привет! Меня зовут Айбек Аланов. Я — аспирант ВШЭ, а также научный сотрудник группы «Вероятностные методы машинного обучения» AIRI. Сегодня мне хотелось бы поделиться с вами успехами, которых добилась наша научная группа в вопросе адап... |
07.07.2023 | VOT Challenge: как мы поучаствовали в соревнованиях по компьютерному зрению | Привет, хабристы. В этой короткой заметке мы хотим рассказать о нашем опыте участия в конкурсе по компьютерному зрению - VOT Challenge 2023, посвященном трекингу объектов на видео. Порефлексируем об ошибках, которые мы допустили и зачем воо... |
20.06.2023 | Матирование изображений, или как получить фотореалистичный передний план | В последнее время в области компьютерного зрения произошло много революционных событий, но есть ряд классических задач, решение которых остается актуальным. Одна из них — матирование, которое применяется для редактирования изображений и вид... |
02.06.2023 | Ускоряем процесс разметки с помощью интерактивной сегментации | Всем привет! Сегодня поговорим про задачу интерактивной сегментации на основе кликов (click-based) и как она может ускорить процесс разметки данных для различных типов сегментации. Сегментационные модели применяются в распознавании событий ... |
16.05.2023 | Как нейросеть достопримечательности на фотокарточках распознавала | Введение
Всем привет. Это мой первый пост и первый обзор на работу. В двух словах опишу, чем это я тут занимался.
Цель проекта заключалась в распознавании достопримечательностей на фотографиях при помощи машинного обучения, а именно свёрточ... |
27.04.2023 | EasyPortrait — портретная сегментация и анализ лиц | EasyPortrait Dataset
Всем привет! Наверняка, кто-то из вас уже пользовался сервисом видеоконференций SberJazz. Мы в нашей RnD команде решили помочь ребятам с задачей замены фона, для чего создали подходящий датасет и провели ряд исследовани... |
03.04.2023 | Большие языковые модели как новый инструмент в научной работе | На волне хайпа вокруг ИИ высказываются все и вся, чем-то напоминая мне ситуацию вокруг Биткойна, когда вроде бы уважаемые люди вдруг начали говорить про него прямо противоположные вещи (криптовалюты это полезно - ИИ это полезно / запретить ... |
21.03.2023 | Полезные материалы по Data Science и машинному обучению, которые помогут пройти сквозь джунгли из терминов | Привет, Хабр! Меня зовут Ефим, я MLOps-инженер в Selectel. В прошлом был автоматизатором, ML-инженером, дата-аналитиком и дата-инженером — и уже несколько лет падаю в пропасть машинного обучения и Data Science. Это буквально необъятная сфер... |
20.03.2023 | Стартап Adept привлек $350 млн на разработку "универсального ИИ-ассистента" общего назначения | Технологический стартап Adept, занимающийся разработкой универсального ИИ-инструмента для автоматизации различных рабочих и персональных задач, привлек 350 миллионов долларов в рамках раунда финансирования серии B. Помимо венчурных фирм, св... |
18.03.2023 | GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато | В этой статье мы разберем новые удивительные способности последней языковой модели из семейства GPT (от понимания мемов до программирования), немного покопаемся у нее под капотом, а также попробуем понять – насколько близко искусственный ин... |
18.03.2023 | GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато | В этой статье мы разберем новые удивительные способности последней языковой модели из семейства GPT (от понимания мемов до программирования), немного покопаемся у нее под капотом, а также попробуем понять – насколько близко искусственный ин... |
18.03.2023 | GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато | В этой статье мы разберем новые удивительные способности последней языковой модели из семейства GPT (от понимания мемов до программирования), немного покопаемся у нее под капотом, а также попробуем понять – насколько близко искусственный ин... |
14.03.2023 | Медицинские датасеты для машинного обучения: цели, типы и способы применения | Международная система здравоохранения ежедневно генерирует множество медицинских данных, которые (по крайней мере, теоретически) можно использовать для машинного обучения. В любой отрасли данные считаются ценным ресурсом, который помогает к... |
26.02.2023 | О «раздутом пузыре» нейросетей | На днях я наткнулся на одно любопытное видео:
Моей первой реакцией было Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще? отрицание и усталость, потому что всё это я уже слышу с ра... |