Edit

arXiv.org e

http://arxiv.org/

Last activity: 04.11.2024

Active

Categories: Content DistributionNewsService

A new type of multimodal large language model (MLLM) from Apple that excels in both image understanding and language processing, particularly demonstrating significant advantages in understanding spatial references.

Mentions

6.24K

Location: United States, New York, Ithaca

Twitter

Mentions in press and media 6235

Date	Title	Description
05.11.2024	The Rise of Intelligent AI: Navigating Complexity with Precision	Artificial intelligence is evolving. It’s no longer just about brute force or sheer size. Two recent breakthroughs highlight this shift: Microsoft’s OmniParser and a collaborative effort from UC San Diego and Tsinghua University. Both innov...
04.11.2024	UC San Diego, Tsinghua University researchers just made AI way better at knowing when to ask for help	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More A team of computer scientists has developed a method that helps artificial intelligence understand when to use to...
04.11.2024	Исследование: ChatGPT-4o можно использовать для автономного голосового мошенничества	Исследователи показали, как можно злоупотреблять голосовым API OpenAI для ChatGPT-4o, чтобы проводить финансовые мошеннические кампании. ChatGPT-4o предлагает текстовый, голосовой и визуальный ввод и вывод данных. Благодаря этим функциям Op...
04.11.2024	Почему галлюцинируют нейросети [и что с этим делают]	Австрийский математик Курт Гёдель еще в 1931 году сформулировал и доказал две теоремы о неполноте. В общем случае первая теорема гласит, что всякая непротиворечивая теория имеет утверждения, которые нельзя доказать средствами этой теории. Т...
03.11.2024	Исследования: QUIC может быть медленнее, чем ожидалось	Когда появился QUIC, его называли преемником TCP и предвестником нового сверхбыстрого интернета. Однако с годами выходит все больше исследований, авторы которых утверждают: в ряде случаев QUIC работает даже хуже «классического» протокола. С...
02.11.2024	Prompt Me One More Time. Учим LLM строить графы знаний из текстов	Привет, Хабр! Меня зовут Алла, я работаю младшим исследователем в команде Memory‑Augmented models в составе лаборатории Cognitive AI Systems AIRI и занимаюсь ресерчем на пересечений графов знаний и языковых моделей. Потребность в таких изыс...
02.11.2024	GigaChat MAX — новая, сильная модель GigaChat	Салют, Хабр! Прошедший сезон оказался богат на релизы: ровно год назад мы делились новостями о GigaChat Pro, затем весной рассказали об увеличении контекста и улучшении возможностей модели, а совсем недавно завершили обучение GigaChat Visio...
02.11.2024	Why multi-agent AI tackles complexities LLMs can’t	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More The introduction of ChatGPT has brought large language models (LLMs) into widespread use across both tech and non...
01.11.2024	The Rise of Mamba: A New Contender in Deep Learning	In the world of deep learning, transformers reign supreme. They’ve reshaped the landscape, powering everything from chatbots to complex language models. Yet, like a towering giant, they have their vulnerabilities. Enter Mamba, a new archite...
01.11.2024	Runway goes 3D with new AI video camera controls for Gen-3 Alpha Turbo	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More As the AI video wars continue to wage with new, realistic video generating models being released on a near weekly...
01.11.2024	Действительно ли фотоны вечные?	Во всей Вселенной лишь несколько частиц вечно стабильны. Фотон, квант света, имеет бесконечное время жизни. Или нет? Одна из самых стойких идей во всей Вселенной заключается в том, что всё, что существует сейчас, когда-нибудь прекратит своё...
31.10.2024	The Rise of Open-Source Text-to-Speech Solutions: A New Era in Voice Synthesis	In the world of technology, the voice is a powerful tool. It conveys emotion, intent, and information. Text-to-speech (TTS) technology has evolved dramatically, transforming how we interact with machines. Today, open-source solutions are at...
31.10.2024	PostgreSQL 17: A New Era of Performance and Usability	PostgreSQL 17 has arrived, and with it comes a wave of enhancements that promise to reshape the landscape of database management. This latest version is not just an incremental update; it’s a significant leap forward, addressing both perfor...
31.10.2024	Простой и быстрый тест LLM для прототипа: сравниваем 16 open-source-моделей на запросе с разной температурой	Привет, Хабр! Меня зовут Дмитрий Фролов, я ведущий разработчик в Центре RnD МТС Диджитал. С ростом популярности LLM создание на них прототипа может прилететь даже тем, кто напрямую с ML не связан. Допустим, вы работаете аналитиком, а ваше н...
31.10.2024	Patronus AI launches world’s first self-serve API to stop AI hallucinations	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More A customer service chatbot confidently describes a product that doesn’t exist. A financial AI invents market data...
31.10.2024	State Space Models. Mamba	Привет, Habr! Ни для кого не секрет, что доминирующей на данный момент архитектурой в области Deep Learning являются трансформеры. Они произвели настоящий фурор и стали основой для самых известных LLM. На данный момент они используются почт...
31.10.2024	Учёные из T-Bank AI Research, МИСИС и МФТИ разработали метод распознавания неизвестных объектов на фото с помощью ИИ	Специалисты из лаборатории исследований искусственного интеллекта (ИИ) T‑Bank AI Research совместно со студентами Университета МИСИС и МФТИ разработали самый точный в мире метод распознавания неизвестных объектов на фото с помощью ИИ. В реш...
31.10.2024	Meta makes its MobileLLM open for researchers, posting full weights	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Meta AI has announced the open-source release of MobileLLM, a set of language models optimized for mobile devices...
31.10.2024	Microsoft’s agentic AI tool OmniParser rockets up the open source charts	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Microsoft’s OmniParser is on to something. The new open source model that converts screenshots into a format that...
31.10.2024	Геометрия мягких ячеек	В октябре 2021 года я опубликовал на Хабре статью «Змей и дротик. От михраба до квазикристаллов», в которой кратко рассказал об апериодических мозаиках, в том числе, составленных Роджером Пенроузом и древнеперсидскими архитекторами. Не прип...
30.10.2024	Как мы выиграли соревнование CLEF 2024 по генерации медицинских снимков	Всем привет! Меня зовут Михаил Чайчук, я учусь в магистратуре Вышки на ФКН, где также являюсь исследователем в НУЛ моделей и методов вычислительной прагматики. А недавно я пришел работать в AIRI на должность инженера-исследователя в команду...
30.10.2024	В ожидании лучших 3D датасетов для ML	Для одного из своих проектов, я погрузился в чтение методов генерации трехмерных сцен и анимированных моделей. Не слишком удивительным фактом оказалось, что подавляющее большинство из них опираются на одну и ту же идею переноса градиента из...
30.10.2024	Операции машинного обучения (MLOps) для начинающих: полное внедрение проекта	Разработка, развёртывание и поддержка моделей машинного обучения в продакшене может быть сложной и трудоёмкой задачей. Именно здесь на помощь приходит Machine Learning Operations (MLOps). MLOps — это набор практик, который автоматизирует уп...
30.10.2024	Text-to-speech. Анализ открытых решений синтеза речи	Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в пользование результаты своих трудов (спасибо ...
29.10.2024	The Digital Dilemma: AI's Wasteful Future and the Quest for Knowledge Preservation	The digital age is a double-edged sword. On one side, it promises innovation and efficiency. On the other, it threatens to drown us in a sea of electronic waste. A recent study warns that by 2030, the computational demands of artificial int...
29.10.2024	The AI Revolution: Breakthroughs and Challenges in October 2024	October 2024 was a month of significant advancements and intriguing developments in the world of artificial intelligence (AI). From Nobel Prize winners to groundbreaking frameworks, the landscape of AI is evolving rapidly. Let’s dive into t...
29.10.2024	Study finds LLMs can identify their own mistakes	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More A well-known problem of large language models (LLMs) is their tendency to generate incorrect or nonsensical outpu...
29.10.2024	Postgresso 9 (70)	PostgreSQL: PostgreSQL 17 Released! Новшества давно известны (в том числе из обзоров Павла Лузанова PostgreSQL 17: Часть 5, 4, 3, 2, 1), но интересно, что выбрали в сообществе как самое-самое важное. Выбрали вот что: Производительность: пер...
29.10.2024	Nvidia тюнингует LLaMA, нобелевские лауреаты ликуют, исследователи Apple ищут логику: главные события октября в сфере ИИ...	Делимся подборкой важных и интересных событий из мира AI и машинного обучения за последний месяц. Сегодня в программе: Нобелевские премии за прорывы в ИИ, новые модели от tech-гигантов, 70 000 новых вирусов и затерянные в пустыне города, а ...
29.10.2024	Специалисты по информатике объединили два «красивых» метода доказательства	Трое исследователей придумали, как создать доказательство, которое распространяет информацию, сохраняя её в полной тайне. Как доказать, что что-то истинно? Для математиков ответ прост: начните с базовых предположений и шаг за шагом дойдите ...
28.10.2024	Meta's AI Revolution: A New Era for Mobile Technology	In the fast-paced world of technology, Meta Platforms has made a bold move. The company has unveiled smaller versions of its Llama artificial intelligence models, designed to run on smartphones and tablets. This is a game-changer. It opens ...
28.10.2024	ML в медицине: дайджест за 21 — 27 октября 2024 г	Модели машинного обучения и бенчмарки 🟩 BioMistral-NLU: модель с повышенным пониманием медицинской терминологии. Машинное обучение в медицине: большой дайджест за 21 - 27 октября 2024 г. BioMistral-NLU – модель, разработанная на основе BioM...
28.10.2024	Создаем алгоритм определения скорости объектов по видео	Определение скорости объекта на видеопотоке является актуальной задачей в сфере компьютерного зрения и обработки видео, в частности, в области автономного вождения, контроля на дорогах, видеонаблюдения, спортивной аналитики. Скорость объект...
28.10.2024	Doctors Are Using AI to Transcribe Conversations With Patients. But Researchers Say the Tool Is Hallucinating 'Entire' Sentences. The tool malfunctioned 312 times in one study, leading to concerns abo...	ChatGPT-maker OpenAI introduced Whisper two years ago as an AI tool that transcribes speech to text. Now, the tool is used by AI healthcare company Nabla and its 45,000 clinicians to help transcribe medical conversations across over 85 orga...
28.10.2024	Причуды отрицательного времени	В декабре 2021 года я опубликовал в этом блоге статью «Большой Взрыв и песочные часы или куда на самом деле течет время», собравшую несколько десятков комментариев и более 39 тысяч просмотров. В ней я коротко рассказал о том, какие математи...
27.10.2024	Практическая устойчивость значений Шепли в интерпретации моделей ИИ	Привет, Хабр! В исследованиях и на практике значения Шепли (Shapley values) — один из наиболее популярных методов интерпретации. По определению, значения Шепли вычисляются по оценке вклада признака во все возможные "коалиции" (под...
27.10.2024	Нобелевские премии 2024 и искусственный интеллект. Химия: предсказание белковых структур	С вами снова Павел Бузин. Как и обещал в первой части саги о Нобелевской премии, сегодня поговорим о химии. Надеюсь, интерес публики к новости еще не угас, потому что, признаюсь, даже у меня, технически подкованного человека, ушло немало вр...
25.10.2024	Bridging the Language Divide: Cohere's Aya Expanse Models	In a world where communication is key, language barriers can feel like towering walls. Cohere, a nonprofit research lab, is on a mission to dismantle these barriers. With the launch of the Aya Expanse family of multilingual AI models, they ...
25.10.2024	AI model madness vs. AI model skeptics AI and data: New AI models and their skeptics New models and services Around the enterprise: App store armageddon? Cyber beat: Platform wars Elsewhere in tech: W...	New artificial intelligence models keep arriving every day — make that several times a day now, judging from the list below — and you have to wonder if customers can keep up. What do you bet your company on, when an even shinier new one arr...
25.10.2024	Как научить LLM понимать видео? Часть 2	Привет, Хабр! В прошлой статье мы рассказали про эволюцию подходов к обучению мультимодальных больших языковых моделей для решения задачи понимания видео. Сегодня хотим рассказать о том, как мы учим LLM понимать видео и поддерживать диалог ...
24.10.2024	The Voice Revolution: AI's Leap into Natural Speech	In the world of artificial intelligence, voice technology is the new frontier. Two recent innovations are shaking up the landscape: ElevenLabs' Voice Design and Meta's Spirit LM. These tools are not just enhancements; they are game-changers...
24.10.2024	The Dark Side of AI Companionship: A Tragic Case Unfolds	In a world where technology bridges gaps, it can also create chasms. The recent tragedy involving a 14-year-old boy from Florida, Sewell Setzer III, highlights the potential dangers of AI companionship. Setzer's story is a cautionary tale, ...
24.10.2024	The AI Arms Race: Innovations and Legal Battles in Machine Learning	The world of artificial intelligence is a battlefield. Companies are racing to develop the most advanced models, while legal disputes loom over the horizon. The latest developments in machine learning reveal a landscape filled with innovati...
24.10.2024	The Rise of AI Agents: A New Era in Computing	In the fast-paced world of technology, change is the only constant. The latest advancements in artificial intelligence (AI) are not just incremental updates; they represent a seismic shift in how we interact with computers. Two recent devel...
24.10.2024	Пошаговое повышение производительности алгоритма	Недавно мне довелось работать над новым алгоритмом приближённого поиска ближайших соседей, который называется RaBitQ. Автор этого алгоритма уже предоставил достаточно скоростную реализацию на C++. Я попытался переписать этот алгоритм на Rus...
24.10.2024	Продуктовый матчинг на маркетплейсе: что происходит под капотом сравнения товаров	Привет, Хабр! На связи команда продуктового матчинга ecom.tech. Сегодня расскажем вам про машинное обучение под капотом сопоставления товаров на Мегамаркете. Зачем нужен продуктовый матчинг и какие там могут быть сложности – обсуждали в про...
24.10.2024	DeepMind’s Talker-Reasoner framework brings System 2 thinking to AI agents	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More AI agents must solve a host of tasks that require different speeds and levels of reasoning and planning capabilit...
24.10.2024	Cohere announces Aya Expanse multilingual AI model family for researchers Your vote of support is important to us and it helps us keep the content FREE. One click below supports our mission to provide...	Cohere for AI, the nonprofit research lab run by the artificial intelligence startup Cohere Inc., pushed the boundaries of multilingual frontier AI model research today with the release of Aya Expanse, a family of high-performance multiling...
24.10.2024	Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито	Привет! Я Настя Рысьмятова, руковожу командой LLM в Авито. Эта статья — про то, какие задачи мы решаем с помощью языковых моделей и как адаптируем их под себя. Мой опыт будет интересен прежде всего тем, кто тоже занимается большими языковым...
24.10.2024	Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning»	Привет! Некоторое время назад я взялся написать обзорную статью о том, что такое Deep Learning. Задача не казалась сложной до тех пор, пока… я не добрался до определения. Вот вы можете в двух словах объяснить этот термин, ничего не упустив?...
23.10.2024	Stability AI Unveils Stable Diffusion 3.5: A Leap Forward in Image Generation	On October 22, 2024, Stability AI launched its latest model, Stable Diffusion 3.5. This release comes after a rocky start with the previous version, SD3 Medium. The team took a step back, rethinking their approach and investing four months ...
23.10.2024	Claude 3.5 Sonnet Can Control Your Computer	Anthropic has unveiled a major update to its Claude AI models, including the new “Computer Use” feature. Developers can direct the upgraded Claude 3.5 Sonnet to navigate desktop apps, move cursors, click buttons, and type text — essentially...
23.10.2024	Differentiable Adaptive Merging is accelerating SLMs for enterprises	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Model merging is a fundamental AI process that enables organizations to reuse and combine existing trained models...
23.10.2024	Character.ai обвиняют в самоубийстве подростка	Фрагмент переписки подростка-самоубийцы с его любимым персонажем Дейенерис. New York Times Газета New York Times рассказала о самоубийстве подростка, который много, в том числе до момента смерти, общался с персонажем Character.ai. Сервису г...
23.10.2024	Поиск «токсичных» SQL-запросов	Мы, студенты из МИФИ, Даниил и Александр, пришли на стажировку в Сбербанк в департамент SberData, который занимается развитием внутренней корпоративной аналитической платформы (КАП).Это современная платформа с удобными инструментами созданн...
23.10.2024	Новости из мира машинного обучения 23.10.24	✔️ Anthropic выпускает обновленные модели Claude 3.5 Sonnet и Claude 3.5 Haiku и представляет функцию "использование компьютера". Обновленная Claude 3.5 Sonnet улучшена по сравнению с предыдущей версией, особенно в области програм...
23.10.2024	OpenAI researchers develop new model that speeds up media generation by 50X	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More A pair of researchers at OpenAI has published a paper describing a new type of model — specifically, a new type o...
22.10.2024	IBM's Granite 3.0: A New Era in AI Performance and Safety	IBM has unveiled its latest innovation, Granite 3.0, at the annual TechXchange event. This new suite of AI models is designed to redefine performance and safety in enterprise applications. The Granite 3.0 family includes models that are not...
22.10.2024	Как мы в Яндексе делаем роборуку с искусственным интеллектом	Ещё 10–20 лет назад многие думали, что роботы под управлением искусственного интеллекта возьмут на себя всю тяжёлую и опасную работу на предприятиях. Однако нейросети нашли применение в офисах, колл‑центрах, службе поддержки и даже стали по...
22.10.2024	Stability AI представила Stable Diffusion 3.5: Тестируем новую модель на реальных задачах и сравниваем с SDXL и FLUX	Привет, друзья, 22 октября Stability AI представила долгожданное обновление своей флагманской модели — Stable Diffusion 3.5. После не самого удачного релиза SD3 Medium в июне этого года, команда взяла паузу для серьёзной переработки архитек...
22.10.2024	Стоит ли ждать ChatGPT-o1 дома?	Большие языковые модели прочно засели в новостном пространстве, позволяя изменить подход к огромному количеству задач и дразня новой технологической революцией. Однако основной прогресс LLM сейчас происходит в компаниях, фокусирующихся на п...
22.10.2024	Очень сложный способ заработать $300	Привет Хабр, в этом посте я хочу поделиться историей своего стартапа/пет проекта/сайд хастла. История началась когда я встретился со своим другом/сооснователем и у него, как у меня, было жгучее желание сделать что нибудь такое-эдакое. Это в...
22.10.2024	Как мы в МТС создали библиотеку для работы с графовыми нейронными сетями	Привет, Хабр! Меня зовут Диана Павликова, я работаю ML-инженером. Часто к нам приходят задачи, когда нужно повысить качество работы модели там, где обычными способами это сделать уже не получается. Мы решили применить что-то новое, поэтому ...
21.10.2024	Новый алгоритм поможет снизить энергозатраты ИИ до 95% без потери точности	Учёные из BitEnergy AI предложили новый метод для повышения энергоэффективности работы языковых моделей. В основе исследования лежит алгоритм линейной сложности умножения (L-Mul), который позволяет заменять операции с плавающей точкой на бо...
21.10.2024	Мультимодальные приложения на Llama 3.2 и Llama Stack	Недавний релиз Llama 3.2 с мультимодальными версиями 11B и 90B открывает возможности для создания AI приложений, анализирующих визуальный ввод. Мультимодальные модели были и раньше, но это первая официальная версия Llama с такими функциями....
21.10.2024	Машинное обучение: Медицинский дайджест за 14 — 20 октября 2024 г	Модели машинного обучения и бенчмарки 🟩 OLAPH: Повышение достоверности ответов на медицинские вопросы. OLAPH (Optimizing Large Language models’ Answers with Preferences of mitigating Hallucination) - метод, который фокусируется на повышении...
21.10.2024	IBM Introduces Granite 3.0: High Performing AI Models Built for Business	New Granite 3.0 8B & 2B models, released under the permissive Apache 2.0 license, show strong performance across many academic and enterprise benchmarks, able to outperform or match similar-sized models New Granite Guardian 3.0 models d...
19.10.2024	A new generation of telescopes could transform our knowledge of the universe	In recent decades, we’ve learnt huge amounts about the universe and its history. The rapidly developing technology of telescopes – both on Earth and in space – has been a key part of this process, and those that are due to start operating o...
19.10.2024	AI and Automation: Precision through Advanced Computational Systems	Share Tweet Share Share Email By Amit Srivastava Artificial Intelligence (AI) and automation are central to Industry 4.0, driving complex decision-making, optimization, and predictive analytics across industries. Moving beyond basic automat...
18.10.2024	The Dawn of AI: Nobel Prizes and the Future of Machine Learning	The recent announcement of the 2024 Nobel Prizes has sent ripples through the scientific community, particularly in the realms of artificial intelligence (AI) and machine learning. The recognition of John Hopfield and Geoffrey Hinton for th...
18.10.2024	Последовательное A/B-тестирование в Netflix. Часть 1: непрерывные потоки данных	Этот материал посвящён применению последовательного A/B‑тестирования в Netflix.1. Найдите отличия Можете увидеть разницу между двумя потоками данных, показанными ниже? Каждое наблюдение представляет собой временной интервал, который проходи...
18.10.2024	Meta Introduces Spirit LM open source model that combines text and speech inputs/outputs	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Just in time for Halloween 2024, Meta has unveiled Meta Spirit LM, the company’s first open-source multimodal lan...
17.10.2024	Machine Learning: Медицинский дайджест за период 07.10 — 13.10 2024 г	Большой медицинский Machine learning дайджест подготовлен командой телеграм канала Machine Learning Interview.Модели машинного обучения и бенчмарки 🟩 ONCOPILOT: Интерактивная модель для сегментации опухолей на основе КТ и измерения по RECIS...
17.10.2024	Краткий обзор LLM бенчмарков	Когда мы говорим о бенчмаркинге LLM в какой-то предметной области, то имеем в виду две разные концепции: бенчмарки моделей LLM и бенчмарки систем LLM. Бенчмаркинг моделей LLM заключается в сравнении базовых моделей общего назначения (наприм...
17.10.2024	Нобелевские премии 2024 и искусственный интеллект. Физика: Джон Хопфилд и нейросети имени его	Всем привет, с вами снова Павел Бузин. Нобелевская неделя принесла несколько замечательных новостей, которые окажут серьезное влияние на развитие отраслей, связанных с машинным обучением и искусственным интеллектом. Первая новость — Нобелев...
17.10.2024	Как работает Mesh R-CNN	Ну для начала всем привет, в этой статье постараюсь рассказать вам про структуру Mesh R-CNN как он работает, что вообще из себя представляет, также будут сделаны сноски с описанием концепции по генерации 3D объектов. Буду опираться как и уж...
16.10.2024	Microsoft’s Differential Transformer cancels attention noise in LLMs	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Improving the capabilities of large language models (LLMs) in retrieving in-prompt information remains an area of...
16.10.2024	Искусство аугментации: как улучшить модели компьютерного зрения без сбора новых данных	Представьте, что вы разрабатываете модель компьютерного зрения для распознавания кошек на фотографиях. Чем больше разных фото кошек вы покажете модели, тем лучше она будет справляться с задачей. Но что делать, если у вас не хватает фотограф...
16.10.2024	Bukva: алфавит русского жестового языка	Всем привет! Совсем недавно мы анонсировали словарь русского жестового языка (РЖЯ), а в этой статье поговорим про задачу распознавания алфавита РЖЯ, именуемого также дактильным алфавитом или дактилем. Предлагаем ознакомиться с нашей работой...
15.10.2024	Исследование Apple выявило недостатки в LLM от OpenAI, Google и Meta*	Исследование, проведенное учеными из Apple, ставит под сомнение интеллектуальные способности крупных языковых моделей (LLM) от OpenAI, Google и Meta*, которые ранее получили признание за свои впечатляющие навыки рассуждения. Исследователи у...
15.10.2024	От контекста до юрисдикции: 7 ключевых параметров при выборе LLM для вашего проекта	Привет, Хабр! Я Сергей, продакт направления AI в Битрикс24. Последний год мы активно внедряем нейросети в наш продукт, и я хочу поделиться опытом, который может сэкономить вам время и деньги. Оказалось, что выбор правильной модели нейросети...
15.10.2024	The AdEMAMix Optimizer: Better, Faster, Older	В данный момент мы находимся на стадии развития глубинного обучения, когда просто увеличивать кластера для более качественного результата становится проблематично. А потому все начинают спускаться на уровень ниже. И одна из таких ниш для ул...
14.10.2024	Исследование: ИИ-модели лишь имитируют мышление человека	Группа исследователей ИИ в Apple опубликовала статью «Понимание ограничений математического рассуждения в больших языковых моделях» для общего обсуждения. Она посвящена концепциям символического обучения и воспроизведения шаблонов, но основ...
14.10.2024	Как устроен бенчмарк LLM? Знакомство с оценкой моделей	В условиях, когда полным ходом идет (генеративная) революция искусственного интеллекта, каждый день появляются новые крупные языковые модели (LLM). Существуют общие модели и усовершенствованные версии этих общих моделей для конкретных целей...
13.10.2024	ИИ без иллюзий. Развенчивание мифов	В своем подкасте я грозился сам почитать статью GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models ученых из Apple и разобраться. Почитал. Разобрался. Забавная статья. Забавная не по содержанию, а...
12.10.2024	The Evolution and Impact of Text-to-Speech Technology	Text-to-Speech (TTS) technology has transformed the way we interact with machines. It turns written text into spoken words, bridging the gap between human communication and digital interfaces. Imagine a world where machines speak as fluentl...
12.10.2024	Pyramid Flow: The New Frontier in Open-Source Video Generation	In the fast-paced world of artificial intelligence, innovation is the name of the game. Enter Pyramid Flow, a groundbreaking open-source video generation model that promises to change the landscape. Developed by a collaboration of researche...
11.10.2024	The Rise of AI in Data Science: A New Era of Collaboration and Competition	Artificial Intelligence (AI) is no longer just a buzzword. It’s a reality reshaping industries, especially data science. The recent introduction of OpenAI’s MLE-bench benchmark highlights this transformation. This tool measures AI’s capabil...
11.10.2024	The Future of Course Development: Harnessing AI for Educational Innovation	In the world of education, creating a course is akin to crafting a masterpiece. It requires creativity, insight, and a deep understanding of the subject matter. Yet, the process can often feel like wading through a swamp of routine tasks. E...
11.10.2024	The Long and Short of Language Models: A Dive into Recent Advances and Challenges	In the world of artificial intelligence, large language models (LLMs) are the towering giants. They process vast amounts of data, generate human-like text, and have transformed how we interact with technology. But as these models grow, so d...
11.10.2024	Представлен Pyramid Flow — новый высококачественный ИИ-генератор видео с открытым исходным кодом	Количество моделей для генерации видео на базе искусственного интеллекта стремительно растет. На этой неделе была представлена новая модель — Pyramid Flow, которая быстро генерирует высококачественные видео продолжительностью до 10 секунд и...
11.10.2024	Астрономы обнаружили новый класс гигантских черных дыр. Одна из них — в центре нашей галактики	В центре нашей галактики находится огромная черная дыра. Размером она напоминает Солнце, но при этом в миллионы раз тяжелее. Ее огромное гравитационное притяжение перемешивает межзвездную пыль и газ вокруг нее. Эта сверхмассивная черная дыр...
11.10.2024	Что такое технология TTS, как устроена и каких сферах используется синтез речи	Синтез речи — технология, которая преобразует написанный текст в аудиосигнал. Программа анализирует слова и создает звуки, которые имитируют человеческий голос. Метод называют по-разному: генерация речи, Text-to-Voice (T2V), Text-to-Speech ...
11.10.2024	Топология в нейросетях?	Вот часто, когда слышишь про математику в ML, звучат только байесовские методы, производные, интерполяции, а еще иногда тензоры... Но математический аппарат в машинном обучении может уходить глубоко в корни даже, как кажется, совершенно фун...
11.10.2024	Сага об агенте или как LLM может помочь в разработке на Jmix	Всем привет! В последние годы большие языковые модели (LLM) стали набирать огромную популярность в решении множества задач, начиная от классического поиска по документам и заканчивая анализом финансовых новостей для принятия решений. В этой...
11.10.2024	LLM агент для работы с Google Spreadsheets	Салют, Хабр! На связи Арсенин Никита из команды R&D в SberDevices. Сегодня я хочу рассказать про одно из наших направлений исследований — разработку агентских систем на основе больших языковых моделей. В этой статье мы постараемся сдела...
11.10.2024	Звездогалактики или история о третьем населении	Как известно, современные звёзды состоят в основном из водорода и гелия, однако на разных стадиях развития содержат примеси многих других элементов. В обычных звёздах Главной Последовательности в результате термоядерных реакций могут образо...
11.10.2024	Новая методика существенно повышает эффективность систем RAG в поиске необходимых документов	Метод генерации с дополнением извлечения (RAG) стал популярным способом связывания больших языковых моделей (LLM) с внешними источниками знаний. Системы RAG обычно используют модель эмбеддингов для кодирования документов в корпусе знаний и ...
10.10.2024	Визуальные трансформеры (ViT)	С момента своего появления в 2017 году в публикации Attention is All You Need [1] трансформеры стали доминирующим подходом в обработке естественного языка (NLP). В 2021 году в статье An Image is Worth 16x16 Words [2] трансформеры были успеш...
10.10.2024	DeepMind’s Michelangelo benchmark reveals limitations of long-context LLMs	Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Large language models (LLMs) with very long context windows have been making headlines lately. The ability to cra...

arXiv.org e

Mentions in press and media 6235

Reviews 0