Date | Title | Description |
22.08.2024 | От промптов к дообучению: четыре уровня адаптации open-source моделей | Привет, Хабр! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Ко мне часто приходят задачи, где нужно использовать open-source LLM. Сразу же встает вопрос: а как адаптировать имеющуюся модель под конкретный кейс?
Мы выделя... |
02.08.2024 | Google’s AI comeback: New Gemini models dethrone OpenAI in shocking upset | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
In a stunning reversal of fortune, Google has catapulted itself from a series of embarrassing AI missteps to the ... |
01.08.2024 | Google Gemini 1.5 Pro leaps ahead in AI race, challenging GPT-4o | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Google launched its latest artificial intelligence powerhouse, Gemini 1.5 Pro, today, making the experimental “ve... |
31.07.2024 | Google’s tiny AI model ‘Gemma 2 2B’ challenges tech giants in surprising upset | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Google has just unveiled Gemma 2 2B, a compact yet powerful artificial intelligence model that rivals industry le... |
24.07.2024 | Установка LLM на скромном VPS | «Я тебя завалю, если ещё раз упомянешь AI», — писал автор нашумевшей статьи. В самом деле, хайп вокруг ИИ всем надоел. Но мы всё-таки рискнём поговорить о том, какую LLM поставить на своём сервере и зачем.
Сразу упомянем, что на серверах RU... |
23.07.2024 | AI arms race escalates: OpenAI offers free GPT-4o Mini fine-tuning to counter Meta’s Llama 3.1 release | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
OpenAI has intensified the AI arms race by announcing free fine-tuning for its GPT-4o Mini model, just hours afte... |
16.07.2024 | Anthropic unleashes Claude on Android: Can it dethrone ChatGPT? | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Anthropic, the artificial intelligence company behind the popular Claude chatbot, announced today the launch of i... |
28.06.2024 | LMSYS launches ‘Multimodal Arena’: GPT-4 tops leaderboard, but AI still can’t out-see humans | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
LMSYS organization ... |
26.06.2024 | Hugging Face’s updated leaderboard shakes up the AI evaluation game | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
In a move that coul... |
25.06.2024 | Anthropic’s Claude 3.5 Sonnet surges to top of AI rankings, challenging industry giants | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
Anthropic’s new AI ... |
16.06.2024 | Nvidia представила открытую LLM модель Nemotron-4 340B | Сравнение Nemotron-4 340B с GPT-4-1106
На данный момент самая крупная, после DeepSeek-V2 236B, открытая LLM модель размером 340B. По тестам сравнения человеком как выигрывает у GPT-4-1106 (вышла в ноябре 2023), так и проигрывает, но чаще со... |
14.06.2024 | Nvidia’s ‘Nemotron-4 340B’ model redefines synthetic data generation, rivals GPT-4 | It's time to celebrate the incredible women leading the way in AI! Nominate your inspiring leaders for VentureBeat’s Women in AI Awards today before June 18. Learn More
Nvidia has once again solidified its position as the undisputed leader ... |
10.06.2024 | Гайд по ICLR 2024: тренды и лучшие доклады | Привет! Меня зовут Света Маргасова, и я руковожу бригадой моделей с внешней информацией в Яндексе. В этом году в большой компании коллег впервые побывала на конференции ICLR (Learning Representations (ICLR) — обучение представлений), котора... |
30.05.2024 | Обзор новых Open Source LLM. Или как локально запустить аналог ChatGPT | На прошедшей неделе вышло сразу несколько новых Open Source LLM. Разбираемся, что в них особенного, а также как и зачем их запускать локально. Статья будет полезна тем, у кого мало опыта в работе с локальными большими языковыми моделями.
За... |
16.05.2024 | LLM field landscape | Привет, Хабр!
TL;DR
Это обзор на актуальные концепты, задачи, проблемы и исследования, связанные с Large Language Models (LLM) и Language Modeling (LM).
Минимальные пререквизиты для чтения обзора:
Вы имеете представление об NLP - вам знаком... |
15.05.2024 | Что может новая модель GPT-4o ? | Вот чем GPT-4o отличается от предыдущих моделей.
фрагмент на русском с презентации GPT-4o
Как можно использовать модель ?
OpenAI показала на презентации несколько вариантов использования возможностей новой модели. Вот некоторые из них.
Обща... |
07.05.2024 | GPT2 Chatbot вернулся? | Таинственный gpt2-chatbot вернулся спустя неделю после внезапного исчезновения. Однако, теперь он "раздвоился": "im-a-good-gpt2-chatbot" и "im-also-a-good-gpt2-chatbot" (отсылка на твит Сэма Альтмана). По утвер... |
02.05.2024 | gpt2-chatbot превзошла GPT-4 и исчезла: новый проект OpenAI или скрытое тестирование GPT-5? | 27 апреля на сайте LMSYS Chatbot Arena появилась новая модель под названием gpt2-chatbot. Она показала подозрительно хорошие результаты и, судя по реакции тех, кто успел её протестировать, превосходит Gpt-4 и последние версии Opus и Llama 3... |
01.05.2024 | GPT2: Что это за таинственный чатбот с ИИ? | Создал ли OpenAI эту новую модель? Это действительно GPT-4.5 или GPT-5?
Даже когда она была еще доступна, она была медленной и сильно ограниченной по скорости - вы получали только 8 попыток.
Купить рекламу Отключить
Это GPT-5?
Широко распро... |
29.04.2024 | Mysterious ‘gpt2-chatbot’ AI model baffles experts: A breakthrough or mere hype? | Discover how companies are responsibly integrating AI in production. This invite-only event in SF will explore the intersection of technology and business. Find out how you can attend here.
Update Tuesday April 30, 4:48 pm ET: A verified ac... |
09.04.2024 | Задача Эйнштейна — большой тест LLM нейросетей на логическое мышление | Я был вдохновлен ранее вышедшей статьей автора MikeMSN - "Задача Эйнштейна. ChatGPT, YaGPT2, Gigachat, Mistral Large" и решил провести большой тест наиболее популярных LLM нейросетей. Использовал для этого сайт Chatbot Arena, а та... |
08.04.2024 | Объединить большие языковые модели реально с помощью mergekit? | Искусственный интеллект развивается, используя подход, аналогичный коллективному интеллекту людей. Вместо одной мощной системы, разработчики создают много маленьких систем с разными специализациями, которые взаимодействуют между собой.
Сейч... |
01.02.2024 | Google Bard Adds Imagen 2 Image Generation and Takes Gemini Pro Model Global | Google Bard Adds Imagen 2 Image Generation and Takes Gemini Pro Model Global
Eric Hal Schwartz on February 1, 2024 at 12:00 pm
Google Bard has added a new image creation tool powered by Google’s Imagen 2 text-to-image model in an update tha... |
13.12.2023 | Turing test on steroids: Chatbot Arena crowdsources ratings for 45 AI models | Enlarge / A Rock'em Sock'em AI model battle.
CSA Images reader comments 16
Further ReadingRound 2: We test the new Gemini-powered Bard against ChatGPTAs the AI landscape has expanded to include dozens of distinct large language models (LLMs... |
03.10.2023 | Как на собеседовании не зависнуть на вопросе: «Какие твои знания нам пригодятся?». Думаем сами и с помощью ИИ | Без ответа на этот вопрос хотя бы самому себе не выйдет презентовать себя на собеседовании, составить план развития карьеры на 5 лет или вырасти в должности. А для ответа нужно четко понимать: в чем я уже крут, а где нужно подтянуть скиллы.... |
16.05.2023 | Тестируем новые языковые модели. WizardLM | Ещё до выхода «утёкшего» внутреннего документа от Google стало ясно, что намерение OpenAI закрыть всю техническую информацию по моделям GPT-3.5 и GPT-4 вызывает у сообщества ещё больше желания иметь доступную открытую реализацию модели. Нед... |
27.04.2023 | Chatbot Arena: Evaluate AI language models | Related Posts
Felvin: Create AI-powered customer service bots to quickly respond to inquiries Chatty Cat: AI Chatbot for WhatsApp Productivity with Real-Time Responses Something: Conversational AI chatbot for safe and useful insights Comnta... |
22.04.2023 | Vicuna, Stable Diffusion и другие нейронки на винде без боли | Привет всем, хочу поделиться своим сборником всяких портабелек нейронок разного пошиба для винды, где уже всё установлено и надо приложить минимальные усилия, чтобы всё это запустить. Вообще все эти штуки я собирал и делал для себя, но когд... |
05.04.2023 | Веса Vicuna опубликованы. Теперь можно поиграться с самой продвинутой ChatGPT-like моделью на домашнем компьютере | Друзья, это наконец случилось. В предыдущей новости были ссылочки на демо Викуньки, но вчера ночью опубликовали саму модель. Сегодня её уже квантировали до 4 бит и сконвертировали в формат ggml (Georgi Gerganov Machine Learning, полагаю), а... |