Edit

Chat Arena

https://chat.lmsys.org/

Last activity: 22.08.2024

Active - Reference to LMArena,

Website visits

334.1K /mo.

Mentions

Mentions in press and media 29

Date	Title	Description
22.08.2024	От промптов к дообучению: четыре уровня адаптации open-source моделей	Привет, Хабр! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Ко мне часто приходят задачи, где нужно использовать open-source LLM. Сразу же встает вопрос: а как адаптировать имеющуюся модель под конкретный кейс? Мы выделя...
02.08.2024	Google’s AI comeback: New Gemini models dethrone OpenAI in shocking upset	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More In a stunning reversal of fortune, Google has catapulted itself from a series of embarrassing AI missteps to the ...
01.08.2024	Google Gemini 1.5 Pro leaps ahead in AI race, challenging GPT-4o	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Google launched its latest artificial intelligence powerhouse, Gemini 1.5 Pro, today, making the experimental “ve...
31.07.2024	Google’s tiny AI model ‘Gemma 2 2B’ challenges tech giants in surprising upset	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Google has just unveiled Gemma 2 2B, a compact yet powerful artificial intelligence model that rivals industry le...
24.07.2024	Установка LLM на скромном VPS	«Я тебя завалю, если ещё раз упомянешь AI», — писал автор нашумевшей статьи. В самом деле, хайп вокруг ИИ всем надоел. Но мы всё-таки рискнём поговорить о том, какую LLM поставить на своём сервере и зачем. Сразу упомянем, что на серверах RU...
23.07.2024	AI arms race escalates: OpenAI offers free GPT-4o Mini fine-tuning to counter Meta’s Llama 3.1 release	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More OpenAI has intensified the AI arms race by announcing free fine-tuning for its GPT-4o Mini model, just hours afte...
16.07.2024	Anthropic unleashes Claude on Android: Can it dethrone ChatGPT?	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Anthropic, the artificial intelligence company behind the popular Claude chatbot, announced today the launch of i...
28.06.2024	LMSYS launches ‘Multimodal Arena’: GPT-4 tops leaderboard, but AI still can’t out-see humans	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More LMSYS organization ...
26.06.2024	Hugging Face’s updated leaderboard shakes up the AI evaluation game	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More In a move that coul...
25.06.2024	Anthropic’s Claude 3.5 Sonnet surges to top of AI rankings, challenging industry giants	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More Anthropic’s new AI ...
16.06.2024	Nvidia представила открытую LLM модель Nemotron-4 340B	Сравнение Nemotron-4 340B с GPT-4-1106 На данный момент самая крупная, после DeepSeek-V2 236B, открытая LLM модель размером 340B. По тестам сравнения человеком как выигрывает у GPT-4-1106 (вышла в ноябре 2023), так и проигрывает, но чаще со...
14.06.2024	Nvidia’s ‘Nemotron-4 340B’ model redefines synthetic data generation, rivals GPT-4	It's time to celebrate the incredible women leading the way in AI! Nominate your inspiring leaders for VentureBeat’s Women in AI Awards today before June 18. Learn More Nvidia has once again solidified its position as the undisputed leader ...
10.06.2024	Гайд по ICLR 2024: тренды и лучшие доклады	Привет! Меня зовут Света Маргасова, и я руковожу бригадой моделей с внешней информацией в Яндексе. В этом году в большой компании коллег впервые побывала на конференции ICLR (Learning Representations (ICLR) — обучение представлений), котора...
30.05.2024	Обзор новых Open Source LLM. Или как локально запустить аналог ChatGPT	На прошедшей неделе вышло сразу несколько новых Open Source LLM. Разбираемся, что в них особенного, а также как и зачем их запускать локально. Статья будет полезна тем, у кого мало опыта в работе с локальными большими языковыми моделями. За...
16.05.2024	LLM field landscape	Привет, Хабр! TL;DR Это обзор на актуальные концепты, задачи, проблемы и исследования, связанные с Large Language Models (LLM) и Language Modeling (LM). Минимальные пререквизиты для чтения обзора: Вы имеете представление об NLP - вам знаком...
15.05.2024	Что может новая модель GPT-4o ?	Вот чем GPT-4o отличается от предыдущих моделей. фрагмент на русском с презентации GPT-4o Как можно использовать модель ? OpenAI показала на презентации несколько вариантов использования возможностей новой модели. Вот некоторые из них. Обща...
07.05.2024	GPT2 Chatbot вернулся?	Таинственный gpt2-chatbot вернулся спустя неделю после внезапного исчезновения. Однако, теперь он "раздвоился": "im-a-good-gpt2-chatbot" и "im-also-a-good-gpt2-chatbot" (отсылка на твит Сэма Альтмана). По утвер...
02.05.2024	gpt2-chatbot превзошла GPT-4 и исчезла: новый проект OpenAI или скрытое тестирование GPT-5?	27 апреля на сайте LMSYS Chatbot Arena появилась новая модель под названием gpt2-chatbot. Она показала подозрительно хорошие результаты и, судя по реакции тех, кто успел её протестировать, превосходит Gpt-4 и последние версии Opus и Llama 3...
01.05.2024	GPT2: Что это за таинственный чатбот с ИИ?	Создал ли OpenAI эту новую модель? Это действительно GPT-4.5 или GPT-5? Даже когда она была еще доступна, она была медленной и сильно ограниченной по скорости - вы получали только 8 попыток. Купить рекламу Отключить Это GPT-5? Широко распро...
29.04.2024	Mysterious ‘gpt2-chatbot’ AI model baffles experts: A breakthrough or mere hype?	Discover how companies are responsibly integrating AI in production. This invite-only event in SF will explore the intersection of technology and business. Find out how you can attend here. Update Tuesday April 30, 4:48 pm ET: A verified ac...
09.04.2024	Задача Эйнштейна — большой тест LLM нейросетей на логическое мышление	Я был вдохновлен ранее вышедшей статьей автора MikeMSN - "Задача Эйнштейна. ChatGPT, YaGPT2, Gigachat, Mistral Large" и решил провести большой тест наиболее популярных LLM нейросетей. Использовал для этого сайт Chatbot Arena, а та...
08.04.2024	Объединить большие языковые модели реально с помощью mergekit?	Искусственный интеллект развивается, используя подход, аналогичный коллективному интеллекту людей. Вместо одной мощной системы, разработчики создают много маленьких систем с разными специализациями, которые взаимодействуют между собой. Сейч...
01.02.2024	Google Bard Adds Imagen 2 Image Generation and Takes Gemini Pro Model Global	Google Bard Adds Imagen 2 Image Generation and Takes Gemini Pro Model Global Eric Hal Schwartz on February 1, 2024 at 12:00 pm Google Bard has added a new image creation tool powered by Google’s Imagen 2 text-to-image model in an update tha...
13.12.2023	Turing test on steroids: Chatbot Arena crowdsources ratings for 45 AI models	Enlarge / A Rock'em Sock'em AI model battle. CSA Images reader comments 16 Further ReadingRound 2: We test the new Gemini-powered Bard against ChatGPTAs the AI landscape has expanded to include dozens of distinct large language models (LLMs...
03.10.2023	Как на собеседовании не зависнуть на вопросе: «Какие твои знания нам пригодятся?». Думаем сами и с помощью ИИ	Без ответа на этот вопрос хотя бы самому себе не выйдет презентовать себя на собеседовании, составить план развития карьеры на 5 лет или вырасти в должности. А для ответа нужно четко понимать: в чем я уже крут, а где нужно подтянуть скиллы....
16.05.2023	Тестируем новые языковые модели. WizardLM	Ещё до выхода «утёкшего» внутреннего документа от Google стало ясно, что намерение OpenAI закрыть всю техническую информацию по моделям GPT-3.5 и GPT-4 вызывает у сообщества ещё больше желания иметь доступную открытую реализацию модели. Нед...
27.04.2023	Chatbot Arena: Evaluate AI language models	Related Posts Felvin: Create AI-powered customer service bots to quickly respond to inquiries Chatty Cat: AI Chatbot for WhatsApp Productivity with Real-Time Responses Something: Conversational AI chatbot for safe and useful insights Comnta...
22.04.2023	Vicuna, Stable Diffusion и другие нейронки на винде без боли	Привет всем, хочу поделиться своим сборником всяких портабелек нейронок разного пошиба для винды, где уже всё установлено и надо приложить минимальные усилия, чтобы всё это запустить. Вообще все эти штуки я собирал и делал для себя, но когд...
05.04.2023	Веса Vicuna опубликованы. Теперь можно поиграться с самой продвинутой ChatGPT-like моделью на домашнем компьютере	Друзья, это наконец случилось. В предыдущей новости были ссылочки на демо Викуньки, но вчера ночью опубликовали саму модель. Сегодня её уже квантировали до 4 бит и сконвертировали в формат ggml (Georgi Gerganov Machine Learning, полагаю), а...

Chat Arena

Mentions in press and media 29

Reviews 0