Edit

Hugging Face

https://huggingface.co/

Last activity: 26.07.2024

Active

Categories: Artificial IntelligenceBuildingFutureInformationLearnPlatformScienceSmartWaterTech

The AI community building the future.

Followers

4.01K

Followers

41.83K

Website visits

12.7M /mo.

Mentions

1.09K

Location: Australia, New South Wales, Concord

Employees: 51-200

Total raised: $494M

Valuation: $4.5B

Founded date: 2016

Twitter

Facebook

Youtube

Investors 6

Date	Name	Website
24.05.2023	Techstars	techstars....
-	A.Capital ...	acapital.c...
-	Mercuri	mercuri.vc
-	Betaworks ...	betaworksv...
-	Lux Capita...	luxcapital...
30.12.2021	SVAngel	svangel.co...

Funding Rounds 6

Date	Series	Amount	Investors
07.09.2023	Series D	$235M	-
13.04.2023	-	$100M	Sequoia Ca...
10.05.2022	Series C	$100M	-
13.03.2021	Series B	$40M	-
17.12.2019	-	$15M	-
23.05.2018	-	$4M	-

Mentions in press and media 1093

Date	Title	Description
26.07.2024	The Design Process: Avoiding the Trap of Form Factor	In the world of product design, the process is often overshadowed by the end result. Designers face pressure to deliver visually appealing products quickly. This urgency can lead to a dangerous pitfall: the trap of form factor. This trap oc...
26.07.2024	Meta's Llama 3.1: A Game Changer in Open AI Models	** In the ever-evolving landscape of artificial intelligence, Meta has thrown down the gauntlet with the release of Llama 3.1. This new model is not just another entry in the crowded field of AI; it’s a bold statement about the future of op...
26.07.2024	Без компромиссов. Как добиться одновременно высокого качества в редактировании и инверсии изображений с помощью StyleGAN...	Всем привет! Меня зовут Денис Бобков, я сейчас обучаюсь на совместной магистерской программе ВШЭ и ШАД под названием «Современные компьютерные науки», а также работаю исследователем в AIRI в команде Controllable Generative AI лаборатории Fu...
26.07.2024	Волшебный чемоданчик c инструментами создания графики для продуктового дизайнера	Всем привет! Меня зовут Гриша Ковалёв, я продуктовый дизайнер в Альфа-Банке. Люблю пробовать новые инструменты и проверять их на прочность. Были ли у вас задачи, где нужно было подготовить графику? Например, нарисовать баннер для акции: «От...
26.07.2024	Stability AI показала модель Stable Video 4D для генерации новых ракурсов для видео	Stability AI показала модель машинного обучения Stable Video 4D, предназначенную для генерации новых ракурсов для видео. Нейросеть доступна бесплатно для исследователей, некоммерческих проектов и компаний с годовым доходом до миллиона долла...
25.07.2024	The Rise of Small Language Models: A New Era in AI Innovation	** In the bustling world of artificial intelligence, a quiet revolution is underway. Small Language Models (SLMs) are emerging as the new stars, reshaping the landscape of AI technology. These nimble models are not just smaller versions of ...
25.07.2024	North America Dominates Startup Funding Landscape Amid AI Surge	** In the world of venture capital, North America is the heavyweight champion. The continent is pulling in a staggering amount of investment, leaving other regions in the dust. The first half of 2024 has seen North American startups rake in...
25.07.2024	Ускорение генерации токена LLM в два раза для больших контекстов	Помимо ChatGPT и многочисленных конкурентов в облаке с веб-мордами и/или API, существует огромная экосистема для запуска LLM на собственном железе. На Huggingface на любой бюджет найдется модель для скачивания, которая влезет в видеопамять ...
25.07.2024	NVIDIA NVIDIA AI Foundry builds custom Llama 3.1 generative AI models for enterprises around the world	NVIDIA NVIDIA AI Foundry builds custom Llama 3.1-generated AI models for enterprises around the world …… [Image: https://prtimes.jp/i/12662/477/resize/d12662-477-0ca8f9a4e4a1068383cc-0.png&s3=12662-477-ff07e4f058cddb7215bf342cceb2e056-1...
25.07.2024	Представлена языковая модель Mistral Large 2 размером 123B. Как запускать. Локальный Сopilot. Открытый конкурент GPT-4o	MistralAI, вслед за LLaMA 3.1 405B, представила свою флагманскую модель с открытыми весами Mistral Large 2 (Mistral-Large-Instruct-2407). Mistral всегда отличалась очень качественными открытыми моделями, и, судя по всему, эта будет не исклю...
24.07.2024	Stability AI steps into a new gen AI dimension with Stable Video 4D	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Stability AI is expanding its growing roster of generative AI models, quite literally adding a new dimension with...
24.07.2024	Обучение языковых моделей на примере сервиса протоколирования встреч AiGenda	Привет! Я Евгений Гутин, ML-инженер. Два года назад я захотел расширить свои компетенции в NLP и больших языковых моделях. Увидел, что ИТМО с @NapoleonITсоздали проектную магистратуру по ИИ, где можно получать знания от экспертов и преподав...
24.07.2024	Дата-сайентистам: рецензия на книгу “Машинное обучение с PyTorch и Scikit-Learn”	Это случилось: в русском переводе вышла самая объемная из когда-либо издававшихся книг по машинному и глубокому обучению. "Machine Learning with PyTorch and Scikit-Learn" Себастьяна Рашки и его соавторов — это огромное, почти на 8...
24.07.2024	AuraFlow — новейшая модель для генерации изображений с открытым исходным кодом	AuraFlow — крупнейшая и полностью открытая модель генерации изображений по текстовому описанию, основанная на технологии потоковых моделей (flow-based models). Модель достигает передовых результатов по метрике GenEval и представляет собой з...
24.07.2024	ruMTEB: новый бенчмарк для русскоязычных эмбеддеров	Салют, Хабр! На связи команды AGI NLP и нейронных сетей Виртуального ассистента Салют. В SberDevices наши команды занимаются созданием бенчмарков, а также обучением моделей для векторных представлений текстов или эмбеддеров. В этой статье р...
24.07.2024	Установка LLM на скромном VPS	«Я тебя завалю, если ещё раз упомянешь AI», — писал автор нашумевшей статьи. В самом деле, хайп вокруг ИИ всем надоел. Но мы всё-таки рискнём поговорить о том, какую LLM поставить на своём сервере и зачем. Сразу упомянем, что на серверах RU...
23.07.2024	The first GPT-4-class AI model anyone can download has arrived: Llama 405B	Enlarge Benj Edwards / Getty Images reader comments 158 In the AI world, there's a buzz in the air about a new AI language model released Tuesday by Meta: Llama 3.1 405B. The reason? It's potentially the first time anyone can download a GPT...
23.07.2024	Слив языковой модели LLaMA 3.1 размером 405B (а также 70B, 8B). Главный открытый конкурент GPT-4o	После выхода LLaMA 3 70B многие ждали обещанную модель размером 400B. Эта модель должна была составить полноценную конкуренцию с GPT-4, при этом оставаться с открытыми весами. Правда некоторые слухи утверждали, что в открытый доступ 400B мо...
23.07.2024	Как с помощью supervised fine-tuning кастомизировать LLM Supervised fine-tuning (SFT) Supervised fine-tuning (SFT) при помощи библиотеки Transformers Выводы...	В быстро развивающейся сфере Natural Language Processing (NLP) fine-tuning стал мощным и эффективным инструментом адаптации предварительно обученных больших языковых моделей (Large Language Model, LLM) под конкретные задачи. Предварительно ...
23.07.2024	Как мы построили сервис, который поможет сократить поиск видео контента в огромной базе данных	Кто мы Привет, Habr! Мы — команда нейро-сети.рф, специализирующаяся на разработке AI-сервисов для решения бизнес-задач и внедрения искусственного интеллекта в реальный сектор экономики. Мы специализируемся в GenAI (LLM, Диффузионные модели)...
23.07.2024	Вышла новая — Llama 3.1 405B	В апреле 2024 года компания Meta представила Llama 3 - следующее поколение современных моделей больших языков с открытым исходным кодом. Первые две модели - Llama 3 8B и Llama 3 70B установили новые стандарты для LLM своего размера. Однако ...
23.07.2024	Как развивалась технология экстремального сжатия LLM: от QuIP до AQLM с PV-tuning	Мы живём в эпоху LLM — компании применяют на практике всё более крупные модели с миллиардами параметров. Это здорово, потому что большие модели открывают пользователям сервисов новые возможности, но не всё так просто. Размер накладывает огр...
23.07.2024	NVIDIA AI Foundry Builds Custom Llama 3.1 Generative AI Models for the World’s Enterprises	Enterprises and Nations Can Now Build ‘Supermodels’ With NVIDIA AI Foundry Using Their Own Data Paired With Llama 3.1 405B and NVIDIA Nemotron Models NVIDIA AI Foundry Offers Comprehensive Generative AI Model Service Spanning Curation, Synt...
22.07.2024	Большие языковые модели: от предобучения до обучения на инструкциях	Это перевод моей статьи об обучении языковых моделей на medium.com. Год назад я подготовил краткое исследование на тему языковых моделей, и для закрепления практики начал пробовать дообучение (fine-tuning) больших языковых моделей (LLM) для...
22.07.2024	Sakana AI drops image models to generate Japan’s traditional ukiyo-e artwork	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Remember Sakana AI? Almost a year ago, the Tokyo-based startup made a striking appearance on the AI scene with it...
21.07.2024	Как я обучил модель, которая понимает русский лучше GPT 3.5 Turbo	В этой статье я расскажу, как я смог обучить модель, которая превзошла GPT 3.5 Turbo на русскоязычной части MT-Bench. Также я рассмотрю новую конфигурацию для обучения на двух графических процессорах параллельно с помощью accelerate и deeps...
20.07.2024	Т-Банк открыл доступ к собственной русскоязычной языковой модели T-lite	Специалисты из Центра искусственного интеллекта Т-банка открыли доступ к новой языковой модели в весовой категории 7-8 миллиардов параметров. Согласно внутренним и индустриальным бенчмаркам, модель обходит все существующие в своем классе ан...
19.07.2024	Mistral выпустила модели машинного обучения для кода и математики	Mistral представила модели машинного обучения MathΣtral и Codestral, предназначенные для решения математических задач и генерации кода соответственно. Обе нейросети опубликованы под лицензией Apache 2.0. MathΣtral представляет собой базовую...
19.07.2024	AI’s new frontier: Hugging Face, Nvidia, and OpenAI lead charge in small language models	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Three major players in artificial intelligence unveiled compact language models this week, signaling a major shif...
19.07.2024	Apple shows off open AI prowess: new models outperform Mistral and Hugging Face offerings	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More As the world continues to gush over the prowess of the all-new GPT-4o-mini, Apple has chosen to expand its family...
19.07.2024	H2O.ai Debuts Danube3 Series, Surpassing Apple and Rivalling Microsoft with New Small Language Models	H2O.ai, the open-source leader in Generative AI and machine learning, is excited to announce the global release of the H2O-Danube3 series, the latest addition to its suite of small language models. This series, now available on Hugging Face...
19.07.2024	OpenAI GPT-4o Mini Now Available to Consumers, Developers	By Aldohn Domingo Published Jul 19, 2024 12:56AM EDT Share on Facebook Share on Twitter Share on LinkedIn Share on Reddit Share on Flipboard Share on Pocket OpenAI's GPT-4o mini is now reportedly available for consumers and developers. It i...
19.07.2024	OpenAI, Nvidia, and Hugging Face unveil small AI models: GPT-4o Mini, Mistral-Nemo, and SmolLM lead industry shift	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Three major players in artificial intelligence unveiled compact language models this week, signaling a major shif...
18.07.2024	Safeguarding Personal Data in the Age of AI: A Closer Look at GDPR Compliance	In the rapidly evolving realm of artificial intelligence (AI) technology, the protection of personal data has emerged as a critical concern. As the discourse surrounding AI and its implications continues to gain momentum, it is imperative t...
18.07.2024	Groq’s open-source Llama AI model tops leaderboard, outperforming GPT-4o and Claude in function calling	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Groq, an AI hardware startup, has released two open-source language models that outperform tech giants in special...
18.07.2024	Вышла Mistral NeMo — многоязычная 12B модель с поддержкой русского и 128К контекстом	Mistral AI представила Mistral NeMo, 12-миллиардную модель, разработанную в сотрудничестве с NVIDIA. Mistral NeMo предлагает большой контекст до 128 тысяч токенов. Модель выпущена по лицензии Apache 2.0, что разрешает её коммерческое исполь...
17.07.2024	Исследователи представили метод EchoMimic для генерации лицевой анимации по аудио и редактируемым маркерам	Исследователи представили нейросеть EchoMimic для генерации реалистичной лицевой анимации по редактируемым маркера лица и аудио. Особенность метода в том, что сохраняется исходное изображение. EchoMimic разработан на базе генеративных модел...
17.07.2024	Original research Using generative AI, 34% of tasks can be solved with just prompts	[Original research] Using generative AI, 34% of tasks can be solved with just prompts Lightblue Co., Ltd. Press release: July 17, 2024 ** [Original research] Using generative AI, 34% of tasks can be solved with just prompts *The importanc...
16.07.2024	Карачаево-балкарский переводчик	Это небольшая статья, но, чтобы её написать, нужно было очень много проделать. Тут кратко описано про язык, про сбор нами данных и про обучение моделей. Это скорее не инструкция, как делать, а способ заявить о проделанном.Про язык и народ Р...
16.07.2024	Hugging Face’s SmolLM models bring powerful AI to your phone, no cloud required	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Hugging Face today unveiled SmolLM, a new family of compact language models that surpass similar offerings from M...
16.07.2024	Mistral releases Codestral Mamba for faster, longer code generation	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More The well-funded French AI startup Mistral, known for its powerful open source AI models, launched two new entries...
16.07.2024	Как работает генерация видео в open source проекте Wunjo CE	Генерация видео теперь open source? Наконец-то я нашёл время, чтобы добавить генерацию видео из текста и изображений в свой open source проект Wunjo CE. В этой статье мы рассмотрим, как это работает, сравним его с похожими решениями, изучим...
15.07.2024	Эволюция языковых моделей для генерации текста с высоты птичьего полёта	В этой статье я хотел бы поделиться своими заметками о том, как языковые модели (LMs) развивались в последние десятилетия. Этот текст может послужить туториалом для новичков и помочь понять ключевые концепции языковых моделей на протяжении ...
15.07.2024	Tencent опубликовала MiraData — большой датасет видеоданных для обучения нейросетей	Китайская компания Tencent опубликовала MiraData — открытый датасет видеоданных для обучения нейросетей. С его помощью разработчики могут создавать модели для генерации длинных роликов. Авторы датасета отмечают, что анонс нейросети Sora от ...
13.07.2024	Запускаем ComfyUI на GPU AMD Radeon в Docker	В этой статье я хочу рассказать об опыте контейнеризации с использованием видеокарты Radeon от AMD. В качестве примера возьмём ComfyUI и поместим его в контейнер. А в конце, для демонстрации успешной работы, создадим видео в стиле аниме. Вс...
12.07.2024	Как сбить цензор GPT-3.5 за 250 рублей?	Всего за 3 доллара и 15 минут ожидания можно заставить модель забыть про мораль и безопасный контент. В этой статье мы расскажем, как это сделать, и поделимся своими результатами. Дисклеймер Всем привет, меня зовут Виктор Барбарич, магистра...
12.07.2024	Создаем чат-бота техподдержки на русском языке с RAG из документации компании в OpenWebUI	OpenWebUI сейчас — это медиакомбайн, который объединяет доступ к OpenAI, Ollama, Automaitc1111, ComfyUI, Wisper API, создание кастомных моделей, RAG на основе Langchain и ChromaDB, гибридный поиск на основе BM25, веб-поиск и многое другое. ...
12.07.2024	World's First Miss AI Contest Faces Backlash Over Unrealistic Beauty Standards	By Inno Flores Published Jul 12, 2024 5:07AM EDT Share on Facebook Share on Twitter Share on LinkedIn Share on Reddit Share on Flipboard Share on Pocket The recent Miss AI contest by the influencer platform Fanvue has stirred controversy by...
11.07.2024	Используем модель Stable Diffusion 3 в SD WebUI (он же Automatic1111)	Для Stable Diffusion WebUI (он же Automatic1111) уже несколько дней, как стала доступна модель Stable Diffusion 3. SD3 теперь работает и в Stable Diffusion WebUI (Automatic1111), но пока еще не со всеми возможностями. Чтобы ее поставить и и...
11.07.2024	Meet Patronus AI’s ‘Lynx’: The open-source bullshit detector outsmarting GPT-4	We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More Patronus AI, a New York-based startup, unveiled Lynx tod...
11.07.2024	Announcing the winners of VentureBeat’s 6th Annual AI Innovation Awards	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Capping the second day featuring insights from enterprise AI and data leaders during VB Transform 2024 in San Fra...
09.07.2024	Искусство общения с LLM: Гайд по техникам Prompt Engineering	Привет, Хабр! Меня зовут Никита Кулин, ML-Engineer NLP моделей. Это мой первый пост, поэтому буду рад любой обратной связи!Интро Большие языковые модели (LLM или БЯМ) становятся все более распространенными в производственных средах, посколь...
08.07.2024	Microsoft drops ‘MInference’ demo, challenges status quo of AI processing	We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More Microsoft unveiled an interactive demonstration of its n...
08.07.2024	How Much Does It Cost to Develop AI? The CEO of an $18 Billion AI Startup Reveals the Current Price. There's a sky-high bar to creating AI, and an expert says it will get even more expensive.	Most startups won't be able to afford to sign up for the AI race, the CEO of $18 billion Anthropic admits. In a recent "In Good Company" podcast interview with Norges Bank CEO Nicolai Tangen, Anthropic CEO Dario Amodei went into t...
05.07.2024	NER для начинающих: Простое объяснение с примерами на SpaCy	Что же такое, этот ваш NER? Named Entity Recognition (NER) — это задача в области NLP (Natural Language Processing), направленная на выделение фрагментов в тексте, относящихся к классам, таким как имена людей, названия организаций, даты, ме...
04.07.2024	Meta drops AI bombshell: Multi-token prediction models now open for research	We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More Meta has thrown down the gauntlet in the race for more e...
03.07.2024	The Rising Costs of Artificial Intelligence: A Deep Dive into the Financial Implications	In today's rapidly evolving technological landscape, artificial intelligence (AI) is experiencing explosive growth. The pace of AI integration is accelerating worldwide, permeating diverse industries such as healthcare, education, finance, ...
03.07.2024	Announcing the finalists for the 6th annual VentureBeat AI Innovations Awards	We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More As enterprise decision-makers get ready for VentureBeat’...
03.07.2024	Почему «утекают» данные в больших языковых моделях. Часть 2	Добрый день, уважаемые читатели Хабра. Продолжаем разбираться в теме «утечки» конфиденциальных данных на примере больших языковых моделей и совершаемых для этого атак. В первой статье мы затронули такие механизмы атаки как Special Character...
03.07.2024	Salesforce proves less is more: xLAM-1B ‘Tiny Giant’ beats bigger AI Models	We want to hear from you! Take our quick AI survey and share your insights on the current state of AI, how you’re implementing it, and what you expect to see in the future. Learn More Salesforce has unveiled an AI model that punches well ab...
02.07.2024	From AGI to ROI: The 6 AI debates shaping enterprise strategy in 2024	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More As I’ve been organi...
02.07.2024	LLMops: что есть, кроме ChatGPT и как это развернуть	Привет, Хабр! Меня зовут Ирина Николаева и я — руководитель R’n’D отдела машинного обучения в компании Raft Digital Solution. Я внедряла различные ML-модели: от анализа временных рядов и Computer Vision до высоконагруженных дата-инженерных ...
02.07.2024	The Dataset Convening: A community workshop on open AI datasets	Participants of the Dataset Convening in Amsterdam. Mozilla and EleutherAI brought together experts to discuss a critical question: How do we create openly licensed and open-access LLM training datasets and how do we tackle the challenges f...
02.07.2024	У вас новый ремонт? Лучше! У нас есть рисунок нового ремонта	Сейчас технологии машинного обучения и нейронных сетей находят широкое применение в различных сферах, не исключая дизайн и ремонт помещений. Одной из таких технологий являются методы генеративных нейросетей, которые позволяют преобразовыват...
02.07.2024	AI's Global Race: Innovations, Investments, and Public Concerns United States is leading the global leadership in AI with 61 notable AI models, followed by the EU with 21 notable models, and then Chin...	Industries around the world are rushing towards technological advancements for several reasons. Today, around the world, be it developed nations or developing nations; all are trying their luck in Artificial Intelligence, Generative Artific...
02.07.2024	17 продвинутых RAG-техник: как превратить прототип LLM-приложения в готовое решение	GenAI стремительно ворвался в нашу жизнь. Ещё вчера мы с опаской смотрели на него, а сегодня уже вовсю используем в работе. Многие эксперты пророчат GenAI большое будущее, считая его предвестником новой промышленной революции. И ведь действ...
01.07.2024	AI Development Platform Landscape has Reportedly Transfomred How Industry Participants Assess ROI, Use-Cases	The team at CBInsights has shared key industry insights in an update, entitled Enterprise AI Roadmap: How the AI development platform landscape has transformed, changing how buyers assess ROI, use cases. The researchers reportedly mined CB ...
01.07.2024	Apple just launched a public demo of its ‘4M’ AI model: Here’s why it’s a big deal	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More Apple, in collabora...
01.07.2024	Быстрое введение в мир существующих больших языковых моделей (LLM) для начинающих	Особенности и отличия семейств LLM в одной статье. Разберемся, что это такое, как они развивались и чем отличаются друг от друга. Для новичков и желающих упорядочить знания в сфере LLM. Это перевод статьи Brain John Aboze из блога компании ...
29.06.2024	Irbis-7B или как мы учили ЛЛМку казахскому языку	Начало Языковые модели, основанные на архитектуре трансформеров, такие как Llama, Mistral и прочие, показывают впечатляющие результаты на английском языке. Однако их эффективность на других языках, включая казахский, может страдать. Дообуче...
28.06.2024	LMSYS launches ‘Multimodal Arena’: GPT-4 tops leaderboard, but AI still can’t out-see humans	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More LMSYS organization ...
28.06.2024	«Midjourney на коленке, но теперь с S3». Как хранить генерации с промптами в объектном хранилище	Привет, Хабр! Построить конвейерную ленту по генерации изображений не так сложно — мы доказали это в обзоре. Но как сохранить результаты? Ведь если вы захотите пересоздать виртуальную машину с нейронкой, на которой хранятся файлы, то оконча...
27.06.2024	AI Startups in Legal Battle with Record Labels	AI startups Suno and Udio are facing legal battles with major record labels over alleged copyright violations. The record labels, including Sony Music, Universal Music Group, and Warner Records, are seeking compensation for what they claim ...
27.06.2024	Google’s Gemma 2 series launches with not one, but two lightweight model options—a 9B and 27B	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More Google says Gemma 2...
27.06.2024	Цикл разработки LLM	В этой статье я использую мой опыт обучения больших языковых моделей (смотрите серию видео на канале Ruslan Dev), чтобы выявить и описать основные фазы разработки собственной LLM. На сегодняшний день разработчики GenAI моделей, как правило,...
27.06.2024	Непреодолимая легкость повышения утилизации GPU	Привет, Хабр! Я Антон, DevOps-инженер в Selectel. В апреле у нас проходил ML-митап, где я и мой коллега, ML-Ops инженер Ефим Головин, рассказали, как подбираем конфигурацию ML-инфраструктуры и повышаем утилизацию GPU. Запись нашего выступле...
27.06.2024	Google представил Gemma 2: ещё доступнее, ещё мощнее	Новая версия модели ИИ от Google устанавливает новые стандарты скорости, эффективности и безопасности. Доступная в вариантах с 9 и 27 миллиардами параметров, Gemma 2 превосходит свою предшественницу по всем направлениям. Gemma 2 (27B) демон...
27.06.2024	Meta’s LLM Compiler is the latest AI breakthrough to change the way we code	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More Meta has unveiled t...
26.06.2024	NASA, IBM Develop INDUS Large Language Models for Advanced Science Research	By Jace Dela Cruz Published Jun 26, 2024 7:38AM EDT Share on Facebook Share on Twitter Share on LinkedIn Share on Reddit Share on Flipboard Share on Pocket NASA has partnered with IBM to develop INDUS, a suite of large language models (LLMs...
26.06.2024	Hugging Face’s updated leaderboard shakes up the AI evaluation game	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More In a move that coul...
26.06.2024	Как быстро растут нейросети: прогресс Stable Diffusion за все время	В феврале 2024 года StabilityAI анонсировали третье поколение генеративной нейронной сети Stable Diffusion. Спустя четыре месяца, 12 июня, вышла «Сommunity-версия» Stable Diffusion 3 Medium. Нам обещают хорошую оптимизацию для домашних комп...
26.06.2024	ELYZA develops and releases Japanese LLM with performance superior to “GPT-4”	ELYZA Co., Ltd. ELYZA develops and releases Japanese LLM with performance superior to “GPT-4” Developed based on open model, 70B model exceeds “GPT-4”, lightweight 8B model will be released to the public in commercially usable format …… ELY...
25.06.2024	A Microsoft-Partnered AI Startup Is Being Sued By the Biggest Record Labels in the World The company is allegedly profiting from AI without compensating the human work that fed the technology, the law...	Since AI can take a written command and create an image, movie, or song within seconds, the process can seem almost magical at first glance. Yet there are key legal issues that persist underneath the shine. Does the company behind the AI mo...
25.06.2024	Разработчики выпустили нейросеть See-2-Sound для генерации звуков окружения по картинке или видео	Исследователи Университета Торонто представили See-2-Sound — нейросеть для генерации звуков окружения по картинке или видео. Модель машинного обучения не только создаёт подходящую дорожку, но и расставляет источники звука в пространстве для...
25.06.2024	Cloudera using AI to boost data & analytics development	Cloudera has announced the introduction of three new AI-driven assistants aimed at accelerating the development of data, analytics, and AI business applications. This comes as recent research indicates that 84% of businesses in the Asia-Pac...
25.06.2024	DataStax unveils major updates to AI platform at RAG++ event	DataStax is set to unveil a series of updates to its Generative AI development platform at the AI Engineer World's Fair, RAG++, in San Francisco. These updates are aimed at making retrieval-augmented generation (RAG) powered application dev...
25.06.2024	Кластерное обучение нейросетей	Multi gpu training overview Если обучение модели на одном графическом процессоре происходит слишком медленно или если веса модели не помещаются в VRAM, переход на обучение с несколькими графическими процессорами (или с несколькими устройств...
25.06.2024	Notice of Appointment of Mr. Takao Nakamura as Outside Director of Lightblue Co., Ltd.	Notice of Appointment of Mr. Takao Nakamura as Outside Director of Lightblue Co., Ltd. View in browser Lightblue Co., Ltd. Press release: June 25, 2024 ** Notice of Appointment of Mr. Takao Nakamura as Outside Director of Lightblue Co.,...
24.06.2024	Кратко про Multi-Head RAG: решение многоаспектных задач с помощью LLM	Привет, Хабр! Современные языковые модельки обладают огромным потенциалом, но они часто сталкиваются с трудностями, когда дело доходит до решения комплексных задач, требующих доступа к разнообразным источникам данных. Multi-Head RAG объявил...
24.06.2024	DataStax looks to help enterprises escape RAG ‘Hell’ with AI tools update	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More Retrieval Augmented...
24.06.2024	DataStax to Launch Major AI Updates at RAG++ in San Francisco with Key Partners	Featuring End-to-end Platform that Makes AI Application Development 100x Faster Across the Entire AI Application Lifecycle: Data Preparation and Readiness; Application Development; Real-Time Data; and Deployment RAG++ — DataStax, the AI pla...
24.06.2024	Дообучение модели GPT-2 (RUS) для генерации описаний заведений на основании названия, рубрики и оценки	Привью Исходный кодАннотация В данной работе представлен процесс дообучения модели генерации текста на основе архитектуры GPT-2. Целью работы является демонстрация возможностей применения дообученной модели для генерации текстов, соответств...
20.06.2024	Anthropic launches Claude 3.5 Sonnet to raise bar for model intelligence in coding and visual processing Your vote of support is important to us and it helps us keep the content FREE. One click below ...	Anthropic PBC today launched Claude 3.5 Sonnet, the company’s first release in a forthcoming artificial intelligence large language model family that outperforms both competing models and its Claude 3 Opus model, which was introduced three ...
20.06.2024	Haize Labs is using algorithms to jailbreak leading AI models	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More Regular readers of ...
19.06.2024	Microsoft Florence-2 for Vision is Now Here From Azure AI—What Does It Bring?	By Isaiah Richard Published Jun 19, 2024 9:36PM EDT Share on Facebook Share on Twitter Share on LinkedIn Share on Reddit Share on Flipboard Share on Pocket Microsoft's new vision foundation model, centered on Florence-2, is capable of handl...
19.06.2024	Microsoft drops Florence-2, a unified model to handle a variety of vision tasks	Don’t miss OpenAI, Chevron, Nvidia, Kaiser Permanente, and Capital One leaders only at VentureBeat Transform 2024. Gain essential insights about GenAI and expand your network at this exclusive three day event. Learn More Today, Microsoft’s ...
18.06.2024	Red Hat levels up AI support for teleco service providers	Earlier this year, Chris Wright reflected on what comes next for telecommunication service providers in 2024 and with these initiatives in mind, we learned that a focus for telcos will be to embrace intelligent automation and AI technologie...
17.06.2024	What is Sakana AI and why is everyone comparing it to OpenAI?	Source: Sakana AI article-article-body Tokyo-based AI startup Sakana AI may achieve unicorn status in less than a year after its founding. Here’s what you need to know about the company, its former Google founders, and why it’s being called...
17.06.2024	Apple embraces open-source AI with 20 Core ML models on Hugging Face platform	It's time to celebrate the incredible women leading the way in AI! Nominate your inspiring leaders for VentureBeat’s Women in AI Awards today before June 18. Learn More Apple has made a significant stride in its efforts to empower developer...
17.06.2024	Представлена открытая LLM модель для кода DeepSeek-Coder-V2 на 16B и 236B. Теоретический конкурент для Codestral 22B	DeepSeek, вслед за своей моделью DeepSeek-V2, представила модель специализирующуюся на коде DeepSeek-Coder-V2. Модель представлена в двух видах: DeepSeek-Coder-V2 размером 236B и DeepSeek-Coder-V2-Lite размером 16B. Старшая модель в большин...

Hugging Face

Investors 6

Funding Rounds 6

Mentions in press and media 1093

Reviews 0