arXiv.org e
Edit

arXiv.org e

http://arxiv.org/
Last activity: 04.11.2024
Active
Categories: Content DistributionNewsService
A new type of multimodal large language model (MLLM) from Apple that excels in both image understanding and language processing, particularly demonstrating significant advantages in understanding spatial references.
Mentions
6.24K
Location: United States, New York, Ithaca

Mentions in press and media 6235

DateTitleDescription
05.11.2024The Rise of Intelligent AI: Navigating Complexity with PrecisionArtificial intelligence is evolving. It’s no longer just about brute force or sheer size. Two recent breakthroughs highlight this shift: Microsoft’s OmniParser and a collaborative effort from UC San Diego and Tsinghua University. Both innov...
04.11.2024UC San Diego, Tsinghua University researchers just made AI way better at knowing when to ask for helpJoin our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More A team of computer scientists has developed a method that helps artificial intelligence understand when to use to...
04.11.2024Исследование: ChatGPT-4o можно использовать для автономного голосового мошенничестваИсследователи показали, как можно злоупотреблять голосовым API OpenAI для ChatGPT-4o, чтобы проводить финансовые мошеннические кампании. ChatGPT-4o предлагает текстовый, голосовой и визуальный ввод и вывод данных. Благодаря этим функциям Op...
04.11.2024Почему галлюцинируют нейросети [и что с этим делают]Австрийский математик Курт Гёдель еще в 1931 году сформулировал и доказал две теоремы о неполноте. В общем случае первая теорема гласит, что всякая непротиворечивая теория имеет утверждения, которые нельзя доказать средствами этой теории. Т...
03.11.2024Исследования: QUIC может быть медленнее, чем ожидалосьКогда появился QUIC, его называли преемником TCP и предвестником нового сверхбыстрого интернета. Однако с годами выходит все больше исследований, авторы которых утверждают: в ряде случаев QUIC работает даже хуже «классического» протокола. С...
02.11.2024Prompt Me One More Time. Учим LLM строить графы знаний из текстовПривет, Хабр! Меня зовут Алла, я работаю младшим исследователем в команде Memory‑Augmented models в составе лаборатории Cognitive AI Systems AIRI и занимаюсь ресерчем на пересечений графов знаний и языковых моделей. Потребность в таких изыс...
02.11.2024GigaChat MAX — новая, сильная модель GigaChatСалют, Хабр! Прошедший сезон оказался богат на релизы: ровно год назад мы делились новостями о GigaChat Pro, затем весной рассказали об увеличении контекста и улучшении возможностей модели, а совсем недавно завершили обучение GigaChat Visio...
02.11.2024Why multi-agent AI tackles complexities LLMs can’tJoin our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More The introduction of ChatGPT has brought large language models (LLMs) into widespread use across both tech and non...
01.11.2024The Rise of Mamba: A New Contender in Deep LearningIn the world of deep learning, transformers reign supreme. They’ve reshaped the landscape, powering everything from chatbots to complex language models. Yet, like a towering giant, they have their vulnerabilities. Enter Mamba, a new archite...
01.11.2024Runway goes 3D with new AI video camera controls for Gen-3 Alpha TurboJoin our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More As the AI video wars continue to wage with new, realistic video generating models being released on a near weekly...
Show more

Reviews 0

Sign up to leave a review

Sign up Log In