Date | Title | Description |
26.07.2024 | The Design Process: Avoiding the Trap of Form Factor | In the world of product design, the process is often overshadowed by the end result. Designers face pressure to deliver visually appealing products quickly. This urgency can lead to a dangerous pitfall: the trap of form factor. This trap oc... |
26.07.2024 | Meta's Llama 3.1: A Game Changer in Open AI Models**
** | ** In the ever-evolving landscape of artificial intelligence, Meta has thrown down the gauntlet with the release of Llama 3.1. This new model is not just another entry in the crowded field of AI; it’s a bold statement about the future of op... |
26.07.2024 | Без компромиссов. Как добиться одновременно высокого качества в редактировании и инверсии изображений с помощью StyleGAN... | Всем привет! Меня зовут Денис Бобков, я сейчас обучаюсь на совместной магистерской программе ВШЭ и ШАД под названием «Современные компьютерные науки», а также работаю исследователем в AIRI в команде Controllable Generative AI лаборатории Fu... |
26.07.2024 | Волшебный чемоданчик c инструментами создания графики для продуктового дизайнера | Всем привет! Меня зовут Гриша Ковалёв, я продуктовый дизайнер в Альфа-Банке. Люблю пробовать новые инструменты и проверять их на прочность.
Были ли у вас задачи, где нужно было подготовить графику? Например, нарисовать баннер для акции: «От... |
26.07.2024 | Stability AI показала модель Stable Video 4D для генерации новых ракурсов для видео | Stability AI показала модель машинного обучения Stable Video 4D, предназначенную для генерации новых ракурсов для видео. Нейросеть доступна бесплатно для исследователей, некоммерческих проектов и компаний с годовым доходом до миллиона долла... |
25.07.2024 | The Rise of Small Language Models: A New Era in AI Innovation**
** | ** In the bustling world of artificial intelligence, a quiet revolution is underway. Small Language Models (SLMs) are emerging as the new stars, reshaping the landscape of AI technology. These nimble models are not just smaller versions of ... |
25.07.2024 | North America Dominates Startup Funding Landscape Amid AI Surge**
** | ** In the world of venture capital, North America is the heavyweight champion. The continent is pulling in a staggering amount of investment, leaving other regions in the dust. The first half of 2024 has seen North American startups rake in... |
25.07.2024 | Ускорение генерации токена LLM в два раза для больших контекстов | Помимо ChatGPT и многочисленных конкурентов в облаке с веб-мордами и/или API, существует огромная экосистема для запуска LLM на собственном железе. На Huggingface на любой бюджет найдется модель для скачивания, которая влезет в видеопамять ... |
25.07.2024 | NVIDIA NVIDIA AI Foundry builds custom Llama 3.1 generative AI models for enterprises around the world | NVIDIA
NVIDIA AI Foundry builds custom Llama 3.1-generated AI models for enterprises around the world
……
[Image: https://prtimes.jp/i/12662/477/resize/d12662-477-0ca8f9a4e4a1068383cc-0.png&s3=12662-477-ff07e4f058cddb7215bf342cceb2e056-1... |
25.07.2024 | Представлена языковая модель Mistral Large 2 размером 123B. Как запускать. Локальный Сopilot. Открытый конкурент GPT-4o | MistralAI, вслед за LLaMA 3.1 405B, представила свою флагманскую модель с открытыми весами Mistral Large 2 (Mistral-Large-Instruct-2407). Mistral всегда отличалась очень качественными открытыми моделями, и, судя по всему, эта будет не исклю... |
24.07.2024 | Stability AI steps into a new gen AI dimension with Stable Video 4D | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Stability AI is expanding its growing roster of generative AI models, quite literally adding a new dimension with... |
24.07.2024 | Обучение языковых моделей на примере сервиса протоколирования встреч AiGenda | Привет! Я Евгений Гутин, ML-инженер.
Два года назад я захотел расширить свои компетенции в NLP и больших языковых моделях. Увидел, что ИТМО с @NapoleonITсоздали проектную магистратуру по ИИ, где можно получать знания от экспертов и преподав... |
24.07.2024 | Дата-сайентистам: рецензия на книгу “Машинное обучение с PyTorch и Scikit-Learn” | Это случилось: в русском переводе вышла самая объемная из когда-либо издававшихся книг по машинному и глубокому обучению. "Machine Learning with PyTorch and Scikit-Learn" Себастьяна Рашки и его соавторов — это огромное, почти на 8... |
24.07.2024 | AuraFlow — новейшая модель для генерации изображений с открытым исходным кодом | AuraFlow — крупнейшая и полностью открытая модель генерации изображений по текстовому описанию, основанная на технологии потоковых моделей (flow-based models).
Модель достигает передовых результатов по метрике GenEval и представляет собой з... |
24.07.2024 | ruMTEB: новый бенчмарк для русскоязычных эмбеддеров | Салют, Хабр! На связи команды AGI NLP и нейронных сетей Виртуального ассистента Салют. В SberDevices наши команды занимаются созданием бенчмарков, а также обучением моделей для векторных представлений текстов или эмбеддеров. В этой статье р... |
24.07.2024 | Установка LLM на скромном VPS | «Я тебя завалю, если ещё раз упомянешь AI», — писал автор нашумевшей статьи. В самом деле, хайп вокруг ИИ всем надоел. Но мы всё-таки рискнём поговорить о том, какую LLM поставить на своём сервере и зачем.
Сразу упомянем, что на серверах RU... |
23.07.2024 | The first GPT-4-class AI model anyone can download has arrived: Llama 405B | Enlarge
Benj Edwards / Getty Images reader comments 158
In the AI world, there's a buzz in the air about a new AI language model released Tuesday by Meta: Llama 3.1 405B. The reason? It's potentially the first time anyone can download a GPT... |
23.07.2024 | Слив языковой модели LLaMA 3.1 размером 405B (а также 70B, 8B). Главный открытый конкурент GPT-4o | После выхода LLaMA 3 70B многие ждали обещанную модель размером 400B. Эта модель должна была составить полноценную конкуренцию с GPT-4, при этом оставаться с открытыми весами. Правда некоторые слухи утверждали, что в открытый доступ 400B мо... |
23.07.2024 | Как с помощью supervised fine-tuning кастомизировать LLM
Supervised fine-tuning (SFT)
Supervised fine-tuning (SFT) при помощи библиотеки Transformers
Выводы... | В быстро развивающейся сфере Natural Language Processing (NLP) fine-tuning стал мощным и эффективным инструментом адаптации предварительно обученных больших языковых моделей (Large Language Model, LLM) под конкретные задачи. Предварительно ... |
23.07.2024 | Как мы построили сервис, который поможет сократить поиск видео контента в огромной базе данных | Кто мы
Привет, Habr!
Мы — команда нейро-сети.рф, специализирующаяся на разработке AI-сервисов для решения бизнес-задач и внедрения искусственного интеллекта в реальный сектор экономики. Мы специализируемся в GenAI (LLM, Диффузионные модели)... |
23.07.2024 | Вышла новая — Llama 3.1 405B | В апреле 2024 года компания Meta представила Llama 3 - следующее поколение современных моделей больших языков с открытым исходным кодом. Первые две модели - Llama 3 8B и Llama 3 70B установили новые стандарты для LLM своего размера. Однако ... |
23.07.2024 | Как развивалась технология экстремального сжатия LLM: от QuIP до AQLM с PV-tuning | Мы живём в эпоху LLM — компании применяют на практике всё более крупные модели с миллиардами параметров. Это здорово, потому что большие модели открывают пользователям сервисов новые возможности, но не всё так просто. Размер накладывает огр... |
23.07.2024 | NVIDIA AI Foundry Builds Custom Llama 3.1 Generative AI Models for the World’s Enterprises | Enterprises and Nations Can Now Build ‘Supermodels’ With NVIDIA AI Foundry Using Their Own Data Paired With Llama 3.1 405B and NVIDIA Nemotron Models
NVIDIA AI Foundry Offers Comprehensive Generative AI Model Service Spanning Curation, Synt... |
22.07.2024 | Большие языковые модели: от предобучения до обучения на инструкциях | Это перевод моей статьи об обучении языковых моделей на medium.com. Год назад я подготовил краткое исследование на тему языковых моделей, и для закрепления практики начал пробовать дообучение (fine-tuning) больших языковых моделей (LLM) для... |
22.07.2024 | Sakana AI drops image models to generate Japan’s traditional ukiyo-e artwork | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Remember Sakana AI? Almost a year ago, the Tokyo-based startup made a striking appearance on the AI scene with it... |
21.07.2024 | Как я обучил модель, которая понимает русский лучше GPT 3.5 Turbo | В этой статье я расскажу, как я смог обучить модель, которая превзошла GPT 3.5 Turbo на русскоязычной части MT-Bench. Также я рассмотрю новую конфигурацию для обучения на двух графических процессорах параллельно с помощью accelerate и deeps... |
20.07.2024 | Т-Банк открыл доступ к собственной русскоязычной языковой модели T-lite | Специалисты из Центра искусственного интеллекта Т-банка открыли доступ к новой языковой модели в весовой категории 7-8 миллиардов параметров. Согласно внутренним и индустриальным бенчмаркам, модель обходит все существующие в своем классе ан... |
19.07.2024 | Mistral выпустила модели машинного обучения для кода и математики | Mistral представила модели машинного обучения MathΣtral и Codestral, предназначенные для решения математических задач и генерации кода соответственно. Обе нейросети опубликованы под лицензией Apache 2.0.
MathΣtral представляет собой базовую... |
19.07.2024 | AI’s new frontier: Hugging Face, Nvidia, and OpenAI lead charge in small language models | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Three major players in artificial intelligence unveiled compact language models this week, signaling a major shif... |
19.07.2024 | Apple shows off open AI prowess: new models outperform Mistral and Hugging Face offerings | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
As the world continues to gush over the prowess of the all-new GPT-4o-mini, Apple has chosen to expand its family... |
19.07.2024 | H2O.ai Debuts Danube3 Series, Surpassing Apple and Rivalling Microsoft with New Small Language Models | H2O.ai, the open-source leader in Generative AI and machine learning, is excited to announce the global release of the H2O-Danube3 series, the latest addition to its suite of small language models. This series, now available on Hugging Face... |
19.07.2024 | OpenAI GPT-4o Mini Now Available to Consumers, Developers | By Aldohn Domingo
Published Jul 19, 2024 12:56AM EDT
Share on Facebook Share on Twitter Share on LinkedIn Share on Reddit Share on Flipboard Share on Pocket
OpenAI's GPT-4o mini is now reportedly available for consumers and developers. It i... |
19.07.2024 | OpenAI, Nvidia, and Hugging Face unveil small AI models: GPT-4o Mini, Mistral-Nemo, and SmolLM lead industry shift | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Three major players in artificial intelligence unveiled compact language models this week, signaling a major shif... |
18.07.2024 | Safeguarding Personal Data in the Age of AI: A Closer Look at GDPR Compliance | In the rapidly evolving realm of artificial intelligence (AI) technology, the protection of personal data has emerged as a critical concern. As the discourse surrounding AI and its implications continues to gain momentum, it is imperative t... |
18.07.2024 | Groq’s open-source Llama AI model tops leaderboard, outperforming GPT-4o and Claude in function calling | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Groq, an AI hardware startup, has released two open-source language models that outperform tech giants in special... |
18.07.2024 | Вышла Mistral NeMo — многоязычная 12B модель с поддержкой русского и 128К контекстом | Mistral AI представила Mistral NeMo, 12-миллиардную модель, разработанную в сотрудничестве с NVIDIA. Mistral NeMo предлагает большой контекст до 128 тысяч токенов.
Модель выпущена по лицензии Apache 2.0, что разрешает её коммерческое исполь... |
17.07.2024 | Исследователи представили метод EchoMimic для генерации лицевой анимации по аудио и редактируемым маркерам | Исследователи представили нейросеть EchoMimic для генерации реалистичной лицевой анимации по редактируемым маркера лица и аудио. Особенность метода в том, что сохраняется исходное изображение.
EchoMimic разработан на базе генеративных модел... |
17.07.2024 | Original research Using generative AI, 34% of tasks can be solved with just prompts | [Original research] Using generative AI, 34% of tasks can be solved with just prompts
*Lightblue Co., Ltd.*
Press release: July 17, 2024
**
[Original research] Using generative AI, 34% of tasks can be solved with just prompts
*The importanc... |
16.07.2024 | Карачаево-балкарский переводчик | Это небольшая статья, но, чтобы её написать, нужно было очень много проделать. Тут кратко описано про язык, про сбор нами данных и про обучение моделей. Это скорее не инструкция, как делать, а способ заявить о проделанном.Про язык и народ
Р... |
16.07.2024 | Hugging Face’s SmolLM models bring powerful AI to your phone, no cloud required | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Hugging Face today unveiled SmolLM, a new family of compact language models that surpass similar offerings from M... |
16.07.2024 | Mistral releases Codestral Mamba for faster, longer code generation | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
The well-funded French AI startup Mistral, known for its powerful open source AI models, launched two new entries... |
16.07.2024 | Как работает генерация видео в open source проекте Wunjo CE | Генерация видео теперь open source? Наконец-то я нашёл время, чтобы добавить генерацию видео из текста и изображений в свой open source проект Wunjo CE. В этой статье мы рассмотрим, как это работает, сравним его с похожими решениями, изучим... |
15.07.2024 | Эволюция языковых моделей для генерации текста с высоты птичьего полёта | В этой статье я хотел бы поделиться своими заметками о том, как языковые модели (LMs) развивались в последние десятилетия. Этот текст может послужить туториалом для новичков и помочь понять ключевые концепции языковых моделей на протяжении ... |
15.07.2024 | Tencent опубликовала MiraData — большой датасет видеоданных для обучения нейросетей | Китайская компания Tencent опубликовала MiraData — открытый датасет видеоданных для обучения нейросетей. С его помощью разработчики могут создавать модели для генерации длинных роликов.
Авторы датасета отмечают, что анонс нейросети Sora от ... |
13.07.2024 | Запускаем ComfyUI на GPU AMD Radeon в Docker | В этой статье я хочу рассказать об опыте контейнеризации с использованием видеокарты Radeon от AMD. В качестве примера возьмём ComfyUI и поместим его в контейнер. А в конце, для демонстрации успешной работы, создадим видео в стиле аниме.
Вс... |
12.07.2024 | Как сбить цензор GPT-3.5 за 250 рублей? | Всего за 3 доллара и 15 минут ожидания можно заставить модель забыть про мораль и безопасный контент. В этой статье мы расскажем, как это сделать, и поделимся своими результатами. Дисклеймер
Всем привет, меня зовут Виктор Барбарич, магистра... |
12.07.2024 | Создаем чат-бота техподдержки на русском языке с RAG из документации компании в OpenWebUI | OpenWebUI сейчас — это медиакомбайн, который объединяет доступ к OpenAI, Ollama, Automaitc1111, ComfyUI, Wisper API, создание кастомных моделей, RAG на основе Langchain и ChromaDB, гибридный поиск на основе BM25, веб-поиск и многое другое.
... |
12.07.2024 | World's First Miss AI Contest Faces Backlash Over Unrealistic Beauty Standards | By Inno Flores
Published Jul 12, 2024 5:07AM EDT
Share on Facebook Share on Twitter Share on LinkedIn Share on Reddit Share on Flipboard Share on Pocket
The recent Miss AI contest by the influencer platform Fanvue has stirred controversy by... |
11.07.2024 | Используем модель Stable Diffusion 3 в SD WebUI (он же Automatic1111) | Для Stable Diffusion WebUI (он же Automatic1111) уже несколько дней, как стала доступна модель Stable Diffusion 3.
SD3 теперь работает и в Stable Diffusion WebUI (Automatic1111), но пока еще не со всеми возможностями.
Чтобы ее поставить и и... |
11.07.2024 | Meet Patronus AI’s ‘Lynx’: The open-source bullshit detector outsmarting GPT-4 | We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More
Patronus AI, a New York-based startup, unveiled Lynx tod... |
11.07.2024 | Announcing the winners of VentureBeat’s 6th Annual AI Innovation Awards | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Capping the second day featuring insights from enterprise AI and data leaders during VB Transform 2024 in San Fra... |
09.07.2024 | Искусство общения с LLM: Гайд по техникам Prompt Engineering | Привет, Хабр! Меня зовут Никита Кулин, ML-Engineer NLP моделей. Это мой первый пост, поэтому буду рад любой обратной связи!Интро
Большие языковые модели (LLM или БЯМ) становятся все более распространенными в производственных средах, посколь... |
08.07.2024 | Microsoft drops ‘MInference’ demo, challenges status quo of AI processing | We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More
Microsoft unveiled an interactive demonstration of its n... |
08.07.2024 | How Much Does It Cost to Develop AI? The CEO of an $18 Billion AI Startup Reveals the Current Price. There's a sky-high bar to creating AI, and an expert says it will get even more expensive. | Most startups won't be able to afford to sign up for the AI race, the CEO of $18 billion Anthropic admits.
In a recent "In Good Company" podcast interview with Norges Bank CEO Nicolai Tangen, Anthropic CEO Dario Amodei went into t... |
05.07.2024 | NER для начинающих: Простое объяснение с примерами на SpaCy | Что же такое, этот ваш NER?
Named Entity Recognition (NER) — это задача в области NLP (Natural Language Processing), направленная на выделение фрагментов в тексте, относящихся к классам, таким как имена людей, названия организаций, даты, ме... |
04.07.2024 | Meta drops AI bombshell: Multi-token prediction models now open for research | We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More
Meta has thrown down the gauntlet in the race for more e... |
03.07.2024 | The Rising Costs of Artificial Intelligence: A Deep Dive into the Financial Implications | In today's rapidly evolving technological landscape, artificial intelligence (AI) is experiencing explosive growth. The pace of AI integration is accelerating worldwide, permeating diverse industries such as healthcare, education, finance, ... |
03.07.2024 | Announcing the finalists for the 6th annual VentureBeat AI Innovations Awards | We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More
As enterprise decision-makers get ready for VentureBeat’... |
03.07.2024 | Почему «утекают» данные в больших языковых моделях. Часть 2 | Добрый день, уважаемые читатели Хабра. Продолжаем разбираться в теме «утечки» конфиденциальных данных на примере больших языковых моделей и совершаемых для этого атак. В первой статье мы затронули такие механизмы атаки как Special Character... |
03.07.2024 | Salesforce proves less is more: xLAM-1B ‘Tiny Giant’ beats bigger AI Models | We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More
Salesforce has unveiled an AI model that punches well ab... |
02.07.2024 | From AGI to ROI: The 6 AI debates shaping enterprise strategy in 2024 | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
As I’ve been organi... |
02.07.2024 | LLMops: что есть, кроме ChatGPT и как это развернуть | Привет, Хабр! Меня зовут Ирина Николаева и я — руководитель R’n’D отдела машинного обучения в компании Raft Digital Solution. Я внедряла различные ML-модели: от анализа временных рядов и Computer Vision до высоконагруженных дата-инженерных ... |
02.07.2024 | The Dataset Convening: A community workshop on open AI datasets | Participants of the Dataset Convening in Amsterdam. Mozilla and EleutherAI brought together experts to discuss a critical question: How do we create openly licensed and open-access LLM training datasets and how do we tackle the challenges f... |
02.07.2024 | У вас новый ремонт? Лучше! У нас есть рисунок нового ремонта | Сейчас технологии машинного обучения и нейронных сетей находят широкое применение в различных сферах, не исключая дизайн и ремонт помещений. Одной из таких технологий являются методы генеративных нейросетей, которые позволяют преобразовыват... |
02.07.2024 | AI's Global Race: Innovations, Investments, and Public Concerns United States is leading the global leadership in AI with 61 notable AI models, followed by the EU with 21 notable models, and then Chin... | Industries around the world are rushing towards technological advancements for several reasons. Today, around the world, be it developed nations or developing nations; all are trying their luck in Artificial Intelligence, Generative Artific... |
02.07.2024 | 17 продвинутых RAG-техник: как превратить прототип LLM-приложения в готовое решение | GenAI стремительно ворвался в нашу жизнь. Ещё вчера мы с опаской смотрели на него, а сегодня уже вовсю используем в работе. Многие эксперты пророчат GenAI большое будущее, считая его предвестником новой промышленной революции.
И ведь действ... |
01.07.2024 | AI Development Platform Landscape has Reportedly Transfomred How Industry Participants Assess ROI, Use-Cases | The team at CBInsights has shared key industry insights in an update, entitled Enterprise AI Roadmap: How the AI development platform landscape has transformed, changing how buyers assess ROI, use cases.
The researchers reportedly mined CB ... |
01.07.2024 | Apple just launched a public demo of its ‘4M’ AI model: Here’s why it’s a big deal | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
Apple, in collabora... |
01.07.2024 | Быстрое введение в мир существующих больших языковых моделей (LLM) для начинающих | Особенности и отличия семейств LLM в одной статье. Разберемся, что это такое, как они развивались и чем отличаются друг от друга. Для новичков и желающих упорядочить знания в сфере LLM. Это перевод статьи Brain John Aboze из блога компании ... |
29.06.2024 | Irbis-7B или как мы учили ЛЛМку казахскому языку | Начало
Языковые модели, основанные на архитектуре трансформеров, такие как Llama, Mistral и прочие, показывают впечатляющие результаты на английском языке. Однако их эффективность на других языках, включая казахский, может страдать. Дообуче... |
28.06.2024 | LMSYS launches ‘Multimodal Arena’: GPT-4 tops leaderboard, but AI still can’t out-see humans | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
LMSYS organization ... |
28.06.2024 | «Midjourney на коленке, но теперь с S3». Как хранить генерации с промптами в объектном хранилище | Привет, Хабр! Построить конвейерную ленту по генерации изображений не так сложно — мы доказали это в обзоре. Но как сохранить результаты? Ведь если вы захотите пересоздать виртуальную машину с нейронкой, на которой хранятся файлы, то оконча... |
27.06.2024 | AI Startups in Legal Battle with Record Labels | AI startups Suno and Udio are facing legal battles with major record labels over alleged copyright violations. The record labels, including Sony Music, Universal Music Group, and Warner Records, are seeking compensation for what they claim ... |
27.06.2024 | Google’s Gemma 2 series launches with not one, but two lightweight model options—a 9B and 27B | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
Google says Gemma 2... |
27.06.2024 | Цикл разработки LLM | В этой статье я использую мой опыт обучения больших языковых моделей (смотрите серию видео на канале Ruslan Dev), чтобы выявить и описать основные фазы разработки собственной LLM.
На сегодняшний день разработчики GenAI моделей, как правило,... |
27.06.2024 | Непреодолимая легкость повышения утилизации GPU | Привет, Хабр! Я Антон, DevOps-инженер в Selectel. В апреле у нас проходил ML-митап, где я и мой коллега, ML-Ops инженер Ефим Головин, рассказали, как подбираем конфигурацию ML-инфраструктуры и повышаем утилизацию GPU. Запись нашего выступле... |
27.06.2024 | Google представил Gemma 2: ещё доступнее, ещё мощнее | Новая версия модели ИИ от Google устанавливает новые стандарты скорости, эффективности и безопасности. Доступная в вариантах с 9 и 27 миллиардами параметров, Gemma 2 превосходит свою предшественницу по всем направлениям. Gemma 2 (27B) демон... |
27.06.2024 | Meta’s LLM Compiler is the latest AI breakthrough to change the way we code | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
Meta has unveiled t... |
26.06.2024 | NASA, IBM Develop INDUS Large Language Models for Advanced Science Research | By Jace Dela Cruz
Published Jun 26, 2024 7:38AM EDT
Share on Facebook Share on Twitter Share on LinkedIn Share on Reddit Share on Flipboard Share on Pocket
NASA has partnered with IBM to develop INDUS, a suite of large language models (LLMs... |
26.06.2024 | Hugging Face’s updated leaderboard shakes up the AI evaluation game | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
In a move that coul... |
26.06.2024 | Как быстро растут нейросети: прогресс Stable Diffusion за все время | В феврале 2024 года StabilityAI анонсировали третье поколение генеративной нейронной сети Stable Diffusion. Спустя четыре месяца, 12 июня, вышла «Сommunity-версия» Stable Diffusion 3 Medium. Нам обещают хорошую оптимизацию для домашних комп... |
26.06.2024 | ELYZA develops and releases Japanese LLM with performance superior to “GPT-4” | ELYZA Co., Ltd.
ELYZA develops and releases Japanese LLM with performance superior to “GPT-4” Developed based on open model, 70B model exceeds “GPT-4”, lightweight 8B model will be released to the public in commercially usable format ……
ELY... |
25.06.2024 | A Microsoft-Partnered AI Startup Is Being Sued By the Biggest Record Labels in the World The company is allegedly profiting from AI without compensating the human work that fed the technology, the law... | Since AI can take a written command and create an image, movie, or song within seconds, the process can seem almost magical at first glance.
Yet there are key legal issues that persist underneath the shine. Does the company behind the AI mo... |
25.06.2024 | Разработчики выпустили нейросеть See-2-Sound для генерации звуков окружения по картинке или видео | Исследователи Университета Торонто представили See-2-Sound — нейросеть для генерации звуков окружения по картинке или видео. Модель машинного обучения не только создаёт подходящую дорожку, но и расставляет источники звука в пространстве для... |
25.06.2024 | Cloudera using AI to boost data & analytics development | Cloudera has announced the introduction of three new AI-driven assistants aimed at accelerating the development of data, analytics, and AI business applications.
This comes as recent research indicates that 84% of businesses in the Asia-Pac... |
25.06.2024 | DataStax unveils major updates to AI platform at RAG++ event | DataStax is set to unveil a series of updates to its Generative AI development platform at the AI Engineer World's Fair, RAG++, in San Francisco. These updates are aimed at making retrieval-augmented generation (RAG) powered application dev... |
25.06.2024 | Кластерное обучение нейросетей | Multi gpu training overview
Если обучение модели на одном графическом процессоре происходит слишком медленно или если веса модели не помещаются в VRAM, переход на обучение с несколькими графическими процессорами (или с несколькими устройств... |
25.06.2024 | Notice of Appointment of Mr. Takao Nakamura as Outside Director of Lightblue Co., Ltd. | Notice of Appointment of Mr. Takao Nakamura as Outside Director of Lightblue Co., Ltd.
*View in browser* *Lightblue Co., Ltd.*
Press release: June 25, 2024
**
Notice of Appointment of Mr. Takao Nakamura as Outside Director of Lightblue Co.,... |
24.06.2024 | Кратко про Multi-Head RAG: решение многоаспектных задач с помощью LLM | Привет, Хабр!
Современные языковые модельки обладают огромным потенциалом, но они часто сталкиваются с трудностями, когда дело доходит до решения комплексных задач, требующих доступа к разнообразным источникам данных. Multi-Head RAG объявил... |
24.06.2024 | DataStax looks to help enterprises escape RAG ‘Hell’ with AI tools update | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
Retrieval Augmented... |
24.06.2024 | DataStax to Launch Major AI Updates at RAG++ in San Francisco with Key Partners | Featuring End-to-end Platform that Makes AI Application Development 100x Faster Across the Entire AI Application Lifecycle: Data Preparation and Readiness; Application Development; Real-Time Data; and Deployment
RAG++ — DataStax, the AI pla... |
24.06.2024 | Дообучение модели GPT-2 (RUS) для генерации описаний заведений на основании названия, рубрики и оценки | Привью
Исходный кодАннотация
В данной работе представлен процесс дообучения модели генерации текста на основе архитектуры GPT-2. Целью работы является демонстрация возможностей применения дообученной модели для генерации текстов, соответств... |
20.06.2024 | Anthropic launches Claude 3.5 Sonnet to raise bar for model intelligence in coding and visual processing
Your vote of support is important to us and it helps us keep the content FREE.
One click below ... | Anthropic PBC today launched Claude 3.5 Sonnet, the company’s first release in a forthcoming artificial intelligence large language model family that outperforms both competing models and its Claude 3 Opus model, which was introduced three ... |
20.06.2024 | Haize Labs is using algorithms to jailbreak leading AI models | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
Regular readers of ... |
19.06.2024 | Microsoft Florence-2 for Vision is Now Here From Azure AI—What Does It Bring? | By Isaiah Richard
Published Jun 19, 2024 9:36PM EDT
Share on Facebook Share on Twitter Share on LinkedIn Share on Reddit Share on Flipboard Share on Pocket
Microsoft's new vision foundation model, centered on Florence-2, is capable of handl... |
19.06.2024 | Microsoft drops Florence-2, a unified model to handle a variety of vision tasks | Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More
Today, Microsoft’s ... |
18.06.2024 | Red Hat levels up AI support for teleco service providers | Earlier this year, Chris Wright reflected on what comes next for telecommunication service providers in 2024 and with these initiatives in mind, we learned that a focus for telcos will be to embrace intelligent automation and AI technologie... |
17.06.2024 | What is Sakana AI and why is everyone comparing it to OpenAI? | Source: Sakana AI article-article-body
Tokyo-based AI startup Sakana AI may achieve unicorn status in less than a year after its founding. Here’s what you need to know about the company, its former Google founders, and why it’s being called... |
17.06.2024 | Apple embraces open-source AI with 20 Core ML models on Hugging Face platform | It's time to celebrate the incredible women leading the way in AI! Nominate your inspiring leaders for VentureBeat’s Women in AI Awards today before June 18. Learn More
Apple has made a significant stride in its efforts to empower developer... |
17.06.2024 | Представлена открытая LLM модель для кода DeepSeek-Coder-V2 на 16B и 236B. Теоретический конкурент для Codestral 22B | DeepSeek, вслед за своей моделью DeepSeek-V2, представила модель специализирующуюся на коде DeepSeek-Coder-V2. Модель представлена в двух видах: DeepSeek-Coder-V2 размером 236B и DeepSeek-Coder-V2-Lite размером 16B. Старшая модель в большин... |