Date | Title | Description |
20.03.2025 | The Digital Wallet Revolution: Empowering the Next Generation with Google Wallet | In a world where cash is becoming a relic, Google is taking a bold step. The tech giant is rolling out a significant update to Google Wallet, allowing children to engage in digital payments. This move is not just about convenience; it’s abo... |
19.03.2025 | Pureinsights Discovery 2.0: The Future of AI Application Development | In the fast-paced world of technology, the launch of Pureinsights Discovery 2.0 marks a significant milestone. This versatile AI application platform is designed to streamline the development and deployment of AI-powered solutions. Business... |
19.03.2025 | Manycore Tech Makes SpatialLM Open-source to Empower Embodied Intelligence Training | SAN JOSE, Calif., March 19, 2025 /PRNewswire/ -- Manycore Tech Inc., a fast-growing spatial intelligence company, announced that it has made its multimodal spatial comprehension model, SpatialLM, open-source at the GTC 2025, significantly l... |
19.03.2025 | Hugging Face submits open-source blueprint, challenging Big Tech in White House AI policy fight | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
In a Washington policy landscape increasingly dominated by calls for minimal AI regulation, Hugging Face is makin... |
19.03.2025 | Pureinsights Unveils Discovery 2.0 | Pureinsights, a leader in AI and search technologies, announced the launch of Pureinsights Discovery 2.0, a versatile AI application platform that helps businesses build and deploy AI-powered assistants, agents, and search solutions—faster.... |
18.03.2025 | JFrog & Hugging Face join forces to secure AI models | - |
18.03.2025 | Pureinsights Unveils Discovery 2.0: A Versatile AI Application Platform That Delivers Results, Faster | Pureinsights, a leader in AI and search technologies, today announced the launch of Pureinsights Discovery 2.0, a versatile AI application platform that helps businesses build and deploy AI-powered assistants, agents, and search solutions—f... |
18.03.2025 | LG unveils New AI Model 'EXAONE Deep' | LG AI's 'EXAONE Deep' marks a milestone in AI innovation, offering unparalleled reasoning capabilities and setting a new standard in the global AI landscape.
SEOUL, South Korea, March 18, 2025 /PRNewswire/ -- LG AI Research unveiled 'EXAONE... |
18.03.2025 | Nvidia announces new AI models for smarter, more adaptable robots
AI models for physical AI training and reasoning
Your vote of support is important to us and it helps us keep the content FREE.
One cl... | Nvidia Corp. today unveiled new technologies and artificial intelligence models that help developers more quickly build smarter robots, including humanoids, and self-driving vehicles by automating the complex modeling and data work.
These i... |
17.03.2025 | Mistral AI drops new open-source model that outperforms GPT-4o Mini with fraction of parameters | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
French artificial-intelligence startup Mistral AI unveiled a new open-source model today that the company says ou... |
13.03.2025 | The AI Race Heats Up: Manus and Cerebras Challenge the Status Quo | The artificial intelligence landscape is evolving at breakneck speed. Two players, Manus and Cerebras, are making waves. Each brings a unique approach to the table, shaking up the industry and challenging established giants like OpenAI and ... |
13.03.2025 | The AI Landscape in 2025: Shifting Powers and New Frontiers | The artificial intelligence (AI) landscape is a whirlwind, constantly evolving and reshaping itself. In 2025, two major reports shed light on this dynamic ecosystem, revealing significant shifts in market share and technological advancement... |
13.03.2025 | The Shifting Sands of AI: A Landscape in Flux | The artificial intelligence (AI) market is a dynamic battlefield. In 2025, the landscape is shifting rapidly, with established giants facing fierce competition from nimble newcomers. The latest reports reveal a dramatic reshaping of market ... |
13.03.2025 | Cohere targets global enterprises with new highly multilingual Command A model requiring only 2 GPUs | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Canadian AI startup Cohere — cofounded by one of the authors of the original transformer paper that kickstarted t... |
13.03.2025 | New technique helps LLMs rein in CoT lengths, optimizing reasoning without exploding compute costs | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Reasoning through chain-of-thought (CoT) — the process by which models break problems into manageable “thoughts” ... |
12.03.2025 | 5 things to know about Manus, the AI agent everyone’s debating | Social media has been buzzing with polarizing takes on Manus, an artificial intelligence tool that its creator has described as “a general AI agent that bridges minds and actions.”
Butterfly Effect, the startup behind Manus, clearly holds t... |
11.03.2025 | Cerebras just announced 6 new AI datacenters that process 40M tokens per second — and it could be bad news for Nvidia | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Cerebras Systems, an AI hardware startup that has been steadily challenging Nvidia’s dominance in the artificial ... |
10.03.2025 | Major AI market share shift revealed: DALL-E plummets 80% as Black Forest Labs dominates 2025 data | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
New data reveals dramatic AI market share shifts in 2025, with rapid changes in how businesses and consumers util... |
10.03.2025 | Chinese smaller generative AI tool exhibits robust abilities at much lower cost | BEIJING -- A Chinese open-source AI model is shown to rival top-tier global competitors such as DeepSeek R1, despite its smaller size, representing another step forward in balancing performance and efficiency in AI application.
The QwQ-32B,... |
06.03.2025 | Google’s New Data Science Agent: A Game Changer for Data Analysis | In the world of data science, speed and efficiency are the golden keys. Google has just unlocked a new door with its Gemini-powered Data Science Agent on the Colab platform. This innovative tool is like a turbocharger for data analysis, des... |
06.03.2025 | May in Paris: GOSIM AI Paris 2025 Ignites a New Wave of AI Innovation, Building a Global Open-Source Ecosystem | PARIS, March 6, 2025 /PRNewswire/ -- Following the pace of global open-source AI innovation, GOSIM AI Paris 2025, hosted by the GOSIM (Global Open-Source Innovation Meetup) and co-organized by CSDN, will take place in Paris, France, on May ... |
06.03.2025 | Hugging Face co-founder Thomas Wolf just challenged Anthropic CEO’s vision for AI’s future — and the $130 billion industry is taking notice | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Thomas Wolf, cofounder of AI company Hugging Face, has issued a stark challenge to the tech industry’s most optim... |
05.03.2025 | Scale AI announces multimillion-dollar defense deal, a major step in U.S. military automation | Scale AI has partnered with the Department of Defense to use AI agents for U.S. military planning and operations.
“Thunderforge” is the DOD’s flagship program and will work with Anduril, Microsoft and others to develop and deploy AI agents.... |
05.03.2025 | Alibaba’s new open source model QwQ-32B matches DeepSeek-R1 with way smaller compute requirements | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Qwen Team — a division of Chinese e-commerce giant Alibaba developing its growing family of open-source Qwen larg... |
05.03.2025 | New open-source math model Light-R1-32B surpasses equivalent DeepSeek performance with only $1000 in training costs | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Researchers have introduced Light-R1-32B, a new open-source AI model optimized to solve advanced math problems. I... |
04.03.2025 | Sonatype Unveils Industry-First AI Software Composition Analysis (SCA) to Power AI-Driven Innovation | Empowers organizations to securely integrate, manage, and govern the use of open source AI/ML models
Sonatype, the leader in software supply chain security, today announced end-to-end AI Software Composition Analysis (AI SCA) capabilities t... |
04.03.2025 | Cohere’s first vision model Aya Vision is here with broad, multilingual understanding and open weights — but there’s a catch | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Canadian AI startup Cohere launched in 2019 specifically targeting the enterprise, but independent research has s... |
03.03.2025 | Google launches free Gemini-powered Data Science Agent on its Colab Python platform | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
AI agents are all the rage, but how about one focused specifically on analyzing, sorting and drawing conclusions ... |
01.03.2025 | The AI Arms Race: Anthropic's Bold Move Against OpenAI and DeepSeek | The landscape of artificial intelligence is shifting. Anthropic has just launched Claude 3.7 Sonnet, a model that could redefine how businesses interact with AI. This release is not just a product; it’s a declaration of war in the AI arms r... |
01.03.2025 | The Rise of Compact AI: Efficiency Meets Performance in Modern Technology | In the fast-paced world of artificial intelligence, size has long been equated with power. Bigger models, with billions of parameters, have dominated the landscape. But a new wave is emerging, one that challenges this notion. Compact AI mod... |
01.03.2025 | IBM's Granite 3.2: A New Era of Enterprise AI | IBM has unveiled Granite 3.2, a significant leap in enterprise AI. This new model family introduces small, efficient AI solutions designed to tackle real-world challenges. With a focus on reasoning, vision, and time series forecasting, Gran... |
26.02.2025 | IBM Expands Granite Model Family with New Multi-Modal and Reasoning AI Built for the Enterprise | Granite 3.2 – small AI models offering reasoning, vision, and guardrail capabilities with a developer friendly license
Updated Granite time series models that offer long-range forecasting with less than 10M parameters
IBM today debuted the ... |
26.02.2025 | Coding made easy: Lovable bags €14.3 million for its AI fullstack engineer | Lovable, a Stockholm-based AI startup behind the “world’s first” AI fullstack engineer, announced that it has raised €14.3 million in a pre-Series A round to expand its integrations with services like Supabase for database, and GitHub for c... |
26.02.2025 | Alibaba makes AI video generation model free to use globally | The Chinese giant said it is open sourcing four models that are part of its Wan2.1 series, the latest version of the company’s foundational AI model that can generate images and video from text and image inputs.
Open source is in contrast t... |
26.02.2025 | Microsoft’s new Phi-4 AI models pack big performance in small packages | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Microsoft has introduced a new class of highly efficient AI models that process text, images, and speech simultan... |
26.02.2025 | Hugging Face launches FastRTC to simplify real-time AI voice and video apps | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Hugging Face, the AI startup valued at over $4 billion, has introduced FastRTC, an open-source Python library tha... |
26.02.2025 | IBM Expands Granite Model Family with New Multi-Modal and Reasoning AI Built for the Enterprise | Granite 3.2 – small AI models offering reasoning, vision, and guardrail capabilities with a developer friendly license
Updated Granite time series models that offer long-range forecasting with less than 10M parameters
ARMONK, N.Y., Feb. 26,... |
24.02.2025 | Anthropic’s Claude 3.7 Sonnet takes aim at OpenAI and DeepSeek in AI’s next big battle | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Anthropic just fired a warning shot at OpenAI, DeepSeek and the entire AI industry with the launch of Claude 3.7 ... |
21.02.2025 | The AI Renaissance: How Collaboration and Innovation Are Shaping the Future | The landscape of artificial intelligence (AI) is shifting. The 2025 Global Developer Conference (GDC) in Shanghai is a testament to this change. It’s a gathering of minds, a melting pot of ideas. From February 21 to 23, developers from arou... |
21.02.2025 | How DeepSeek used distillation to train its artificial intelligence model, and what it means for companies such as OpenAI | Chinese artificial intelligence lab DeepSeek roiled markets in January, setting off a massive tech and semiconductor selloff after unveiling AI models that it said were cheaper and more efficient than American ones.
But the underlying fears... |
20.02.2025 | Prior Labs: €9 Million (Pre-Seed) Raised To Change How Businesses Unlock Insights | Prior Labs – an AI startup innovating foundation models for spreadsheets and databases – announced it has €9 million in pre-Sseed funding, led by Balderton Capital along with XTX Ventures, SAP founder Hans Werner-Hector’s Hector Foundation,... |
18.02.2025 | 2025 Global Developer Conference brings together AI titans for collaboration | SenseTime, a Chinese AI company, presents an advertisement in an office tower in Shanghai's Xuhui district. [Photo by Li Junfeng / chinadaily.com.cn]
The 2025 Global Developer Conference (GDC) is gearing up to kick off from Feb 21 to 23 in ... |
12.02.2025 | The Rise of SmolLM2: A New Contender in AI Language Models | In the bustling world of artificial intelligence, new players emerge regularly. The latest contender is Hugging Face, a company known for its commitment to open-source AI. Their new language model, SmolLM2, has made waves since its release.... |
11.02.2025 | The Dawn of Current AI: A New Era for Socially Responsible Technology | In the heart of Paris, a significant shift in the landscape of artificial intelligence (AI) is unfolding. The Current AI initiative has emerged as a beacon of hope, aiming to steer AI development toward the greater good. With a promise of $... |
11.02.2025 | Positron: $23.5 Million Raised For Designing Made-In-America AI Chips | Positron, a growing force in AI inference technology for AI computing, announced it has raised $23.5 million in funding from a group of investors, including Flume Ventures, Valor Equity Partners, Atreides Management, and Resilience Reserve.... |
11.02.2025 | «Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью | 9 февраля на arXiv была опубликована новая научная работа "LM2: Large Memory Models", в которой исследователи описали обновление классической архитектуры LLM на базе трансформеров. LM2 превосходит как модель RMT с дополненной памя... |
11.02.2025 | Хакатоны ML или битва за скор наяву | Добрый день, уважаемые читатели! Хакатоны уже давно стали неотъемлемой частью жизни любого топового разработчика, который хочет быть всегда в тренде и видеть самые «горячие» и актуальные задачи бизнеса. На них можно увидеть не только типовы... |
11.02.2025 | «Невероятно маленькая и очень качественная». Zyphra представила Zonos, 1.6B модель для генерации речи любым голосом | 2025 год богат на свершения от ноунейм компаний. В этот раз в прицеле нашего внимания Zyphra, которая на днях релизнула модель Zonos-v0.1, крайне впечатляющую не столько тем, что в бенчмарках она рядом с ElevenLabs и прочими (а некоторых да... |
10.02.2025 | Navigating the Complex World of Machine Learning Deployment with Nvidia Triton Server | In the realm of machine learning, deploying models is akin to launching a ship into uncharted waters. The journey is fraught with challenges, from ensuring smooth communication between components to monitoring performance metrics. As the nu... |
10.02.2025 | Исследователи выпустили MedRAX — медицинского ИИ-агента для анализа рентгенограмм грудной клетки | Исследователи из Канады представили нейросетевого агента MedRAX, который должен помочь врачам анализировать рентгенограммы грудной клетки. Преимущество агента в том, что его специально разрабатывали для медицины, поэтому учли возможность ин... |
10.02.2025 | Who’s using AI the most? The Anthropic Economic Index breaks down the data | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
AI is reshaping the modern workplace, but until now, its impact on individual tasks and occupations has been diff... |
10.02.2025 | Hugging Face выпускает небольшую языковую модель, которая в большинстве случаев превосходит Qwen и Llama | Исследовательская группа Hugging Face представила SmolLM2, свою новейшую языковую модель. Несмотря на то, что она не открывает новых горизонтов, она является ценным дополнением к портфолио AI-технологий компании.
Эффективность модели обусло... |
10.02.2025 | Nexar Announces Open Dataset and Nexar Dashcam Crash Prediction Challenge To Advance Collision Prediction | Nexar, a leader in AI-powered mobility solutions, today announced the release of a groundbreaking open dataset and the launch of Nexar Dashcam Crash Prediction Challenge, a global competition on Kaggle, aimed at advancing collision predicti... |
10.02.2025 | Твой ИИ тебя понимает? Разбираем тайны внутреннего мира языковых моделей | Современные крупные языковые модели, такие как ChatGPT, Claude или Gemini, поражают своими возможностями. Но главный вопрос остаётся открытым: как именно они думают?
С момента появления открытых LLM метод изучения их мышления был довольно п... |
10.02.2025 | Как DeepSeek-R1 научилась мыслить и «последний экзамен человечества»: топ-10 исследований ИИ за январь 2025 | Привет, Хабр! Я - Андрей, технологический предприниматель и консультант по ИИ.
Январь вновь оказался насыщенным месяцем на прорывные исследования в сфере искусственного интеллекта (ИИ). В этой статье я отобрал десять работ, которые ярко дем... |
10.02.2025 | Current AI: финансирование проектов AI, направленных на решение социальных проблем | Current AI — компания, которая позиционируется как инициатива в интересах общества, направленная на стимулирование и управление развитием искусственного интеллекта в социально значимых направлениях, была анонсирована на французском саммите ... |
10.02.2025 | Paris AI summit: France and EU promise to cut red tape on tech | Paris AI summit: France and EU promise to cut red tape on tech
By Jeffrey Dastin, Florence Loeve and Elizabeth HowcroftFebruary 10, 20257:10 PM UTCUpdated ago
Text
Small Text
Medium Text
Large Text
Share
X
Facebook
Linkedin
Email
Link
Summa... |
09.02.2025 | Запускаем ML-модели с помощью Docker и Nvidia Triton Server | Введение
Запускать и сопровождать модели машинного обучения в рамках веб-сервисов - это нетривиальная задача. Вам придется решать кучу проблем от взаимодействия различных частей вашего приложения с моделью до мониторинга ее производительнос... |
08.02.2025 | The Future of Human-Robot Interaction: Meta's Bold Leap Forward | In a world where technology and humanity intertwine, Meta is stepping into the spotlight. The company recently unveiled PARTNR, a groundbreaking program aimed at exploring human-robot interaction (HRI). This initiative is not just a leap; i... |
08.02.2025 | Meta's Language Initiative: Bridging Gaps in AI and Inclusivity | In a world increasingly defined by digital communication, language remains a powerful barrier. Meta, the tech giant formerly known as Facebook, is stepping up to dismantle this barrier. In partnership with UNESCO, Meta has launched a new pr... |
08.02.2025 | Shanghai to host 2025 Global Developer Conference | A view of the Huangpu River in Shanghai. [Photo/VCG]
SHANGHAI - The 2025 Global Developer Conference, scheduled from Feb 21 to 23 in Shanghai, is expected to bring together approximately 100 developer communities from around the world, the ... |
07.02.2025 | The Rise of AI Marketplaces: A New Era for Enterprises | The landscape of artificial intelligence is evolving. The emergence of AI marketplaces is reshaping how enterprises deploy and utilize AI applications. This shift is akin to the gold rush of the 19th century, where miners flocked to new ter... |
07.02.2025 | Pi0 от Hugging Face: Прорыв в обучении роботов через AI-команды | Hugging Face и Physical Intelligence совершили революцию в мире робототехники, запустив Pi0 (Pi-Zero) — первую в своем роде базовую модель, которая позволяет роботам переводить команды на естественном языке напрямую в физические действия. Э... |
07.02.2025 | Meta anuncia programa com a UNESCO para melhorar IA de fala e tradução | A Meta, em parceria com a UNESCO, anunciou um novo programa para coletar gravações de voz e transcrições, impulsionando o desenvolvimento de IA voltada para reconhecimento de fala e tradução. O Language Technology Partner Program busca cola... |
07.02.2025 | Meta* запускает программу по сбору языковых данных для развития AI | Meta запускает новую программу в партнёрстве с ЮНЕСКО по сбору речевых записей и расшифровок, которые, по словам компании, помогут в разработке общедоступного AI в будущем.
Партнерская программа языковых технологий ищет участников, которые ... |
07.02.2025 | Запускаем DeepSeek-R1 на обычном сервере с 768Гб ОЗУ в LM-Studio | Что побудило написать статью?
Была тут недавно статья с картинками железа, ценами на железо, но без описания настроек, но зато с ссылками на GitHub и цитирую «Инструкция: Следуйте руководству в репозитории GitHub».:‑) Хотя в нынешних реалия... |
06.02.2025 | The Rise of Open Source Search Agents: A New Era in Information Retrieval | In the fast-paced world of technology, innovation often springs from inspiration. Recently, the engineering team at Hugging Face took a bold leap, crafting their own version of OpenAI's DeepResearch agent in just 24 hours. This endeavor hig... |
06.02.2025 | Bridging the Gap: Innovations in AI and Biomedical Engineering | In the ever-evolving landscape of technology, two fields stand out: artificial intelligence and biomedical engineering. Both are reshaping industries, driving innovation, and addressing critical challenges. Recently, two remarkable stories ... |
06.02.2025 | Команда Hugging Face представила собственную открытую реализацию агента DeepResearch от OpenAI | Инженеры Hugging Face рассказали в блоге, что вдохновились функцией DeepResearch от OpenAI и решили за 24 часа разработать собственную реализацию. В итоге получился поисковой агент, который может автономно просматривать веб-страницы, искать... |
06.02.2025 | Отчёт о запуске DeepSeek-R1 на Xeon 6132 c 768 ГБ памяти | Спойлер для экономии времени читающих — я просто скачаю DeepSeek и запущу его через llama.cpp, на какую-либо научную новизну этот пост совершенно не претендует. Зачем это на хабре, если там всего одна команда? Просто в комментариях к посту ... |
06.02.2025 | Hugging Face brings ‘Pi-Zero’ to LeRobot, making AI-powered robots easier to build and deploy | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
Hugging Face and Physical Intelligence have quietly launched Pi0 (Pi-Zero) this week, the first foundational mode... |
06.02.2025 | Hugging Face работает над копированием возможностей OpenAI Deep Research с помощью агента AI с открытым исходным кодом | Команда Hugging Face под руководством главного научного сотрудника Томаса Вольфа создала версию системы Deep Research OpenAI с открытым исходным кодом за 24 часа.
Согласно блогу Hugging Face , они стремятся сделать фирменную технологию дост... |
05.02.2025 | The Convergence of Translation and Summarization: A New Frontier in AI | In the realm of artificial intelligence, two tasks often stand apart: translation and summarization. At first glance, they seem like distant cousins in the family of natural language processing. Translation is the meticulous art of converti... |
05.02.2025 | The Rise of Autonomous AI Research Agents: A New Era in Information Retrieval | In the digital age, information is the lifeblood of innovation. As we navigate through a sea of data, the tools we use to sift through this information are evolving. Enter autonomous AI research agents, a groundbreaking development that pro... |
05.02.2025 | Тесты помогают быстрее и дешевле учить ИИ писать код. Новая работа китайских ученых: TDD для обучения ИИ | Сегодня в HuggingFace Daily papers ачивку "#3 daily paper" завоевала работа китайских исследователей из TigerLab. Мне она показалась настолько логичной и классной, что захотелось побольше рассказать об этой новости.
Итак, при клас... |
05.02.2025 | Lightning AI’s AI Hub shows AI app marketplaces are the next enterprise game-changer | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
The last mile problem in generative AI refers to the ability of enterprises to deploy applications to production.... |
05.02.2025 | Prior Labs raises €9 million for foundation models for spreadsheets and databases | Freiburg-based Prior Labs, an AI startup innovating foundation models for spreadsheets and databases, has raised €9 million in pre-Seed funding, to accelerate product development, expand the team, and bring the model to more users.
The fund... |
05.02.2025 | DeepSeek штурмует рейтинги, OpenAI запускает первого автономного агента: главные события января в сфере ИИ | Первый месяц 2025 года задал высокую планку для развития ИИ. DeepSeek выпустила открытую модель уровня о-1, которая переполошила весь интернет и обрушила акции гигантов индустрии. Американские коллеги ответили настоящим шквалом релизов: Ope... |
05.02.2025 | Neuralk-AI raises $4M to build foundation models for critical commerce data | Neuralk-AI, a French deeptech startup building a Tabular Foundation Model specialised for Commerce, has raised $4M in funding.
The round was led by Fly Ventures with participation from StemAI, Thomas Wolf, Charles Gorintin, Philippe Corrot,... |
04.02.2025 | Оценка систем больших языковых моделей (LLM): метрики, проблемы и лучшие практики | Фото Яни Каасинен на Unsplash.
В последнее время разработка и развертывание больших языковых моделей (LLM) стали ключевыми в формировании интеллектуальных приложений в различных областях. Но реализация этого потенциала требует строгого и си... |
04.02.2025 | Как я объединил перевод и суммаризацию текстов, и что из этого вышло | Как я объединил перевод и суммаризацию текстов, и что из этого вышло.
Перевод и суммаризация текстов – это две задачи, которые на первый взгляд кажутся совершенно разными. Перевод требует точного передачи исходного содержания на другой язык... |
04.02.2025 | Опять DeepSeek? Побудем в роли детектива | 这篇帖子是用一碗米饭支付的,猫老婆Хайп, хайп и еще раз хайп
Когда про DeepSeek-r1 начали говорить уже из каждого утюга, я долго думал, а стоит ли еще и свои 5 копеек вставлять в эту историю, и подумал, конечно же да! Ведь могу.
Если коротко, просыпаюсь в по... |
03.02.2025 | DeepSeek-R1 для чайников | В последние месяцы всё чаще слышим про «reasoning-модели», способные не просто продолжать текст, а действительно шаг за шагом решать сложнейшие задачи цепочкой рассуждений (chain-of-thought). Впервые такой подход эффектно показали в OpenAI ... |
03.02.2025 | Поднимаем DeepSeek llm локально | Все уже слышали про новую модель DeepSeek r1, которая обогнала по бенчмаркам openai. Компания DeepSeek выложила веса и дистилляты в открытый доступ, поэтому мы можем их запустить.
В статье поднимем дистилляты модели r1 используя llama.cpp -... |
03.02.2025 | OpenAI анонсировали Deep Research — самостоятельного агента для исследований | В 16:00 по Pacific Time OpenAI запустили стрим, на котором анонсировали новый продукт компании - Deep Research, особый режим для ChatGPT, в котором он переходит в режим высокой автономности, и может проводить длительные глубокие исследовани... |
03.02.2025 | Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за январь 2025 года | Облако слов из заголовков публикаций информационной службы Хабра в январе 2025 года
В январе 2025 года информационная служба Хабра выпустила 843 публикации (792 новости и поста, 14 лонгридов и 37 переводов). В этом дайджесте представлены лу... |
02.02.2025 | Устанавливаем и пробуем нейросеть для генерации 3D моделей Hunyan3D-2 под Windows в ComfyUI | Нейросеть Hunyan3D-2, генерирующая 3D модели по 2D картинкам, от компании Tencent появилась недавно в открытом доступе. Ее рабочая версия в виде «3D студии» существует, но доступна только владельцам китайских мобильных номеров (или если у в... |
01.02.2025 | The DeepSeek Dilemma: Privacy, Power, and the Future of AI | In the world of artificial intelligence, the stakes are high. The recent controversy surrounding DeepSeek, a Chinese AI chatbot company, has ignited a firestorm of privacy concerns. Italy has taken a bold step, blocking the app after a comp... |
01.02.2025 | Компания Allen AI: новая модель Tülu 3 405B с открытым исходным кодом конкурирует с лучшими моделями | Институт искусственного интеллекта Аллена (Ai2) выпустил Tülu 3 405B — языковую модель с открытым исходным кодом, которая, как сообщается, по производительности соответствует или превосходит DeepSeek V3 и GPT-4o. Команда во многом объясняет... |
01.02.2025 | «Неконтролируемая человеческая речь»: какие опасности таит в себе новый набор данных для AI? | MLCommons, некоммерческая рабочая группа по безопасности AI, объединилась с платформой для разработки AI Hugging Face, чтобы выпустить одну из крупнейших в мире коллекций голосовых записей из общественного достояния для исследований в облас... |
31.01.2025 | It’s here: OpenAI’s o3-mini advanced reasoning model arrives to counter DeepSeek’s rise | Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More
OpenAI has released a new proprietary AI model in time to counter the rapid rise of open source rival DeepSeek-R1... |
31.01.2025 | Всё, что я узнал о запуске локальных языковых моделей | В мире, где облачные решения диктуют свои правила, локальные модели дают свободу — полную приватность, работу офлайн и отсутствие ограничений. Эта статья для тех, кто хочет впервые попробовать самостоятельно запустить LLM на своем компьютер... |
31.01.2025 | Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров | Mistral AI выпустила Small 3 — новую языковую модель с 24 миллиардами параметров, которая по производительности не уступает гораздо более крупным моделям от Meta* и OpenAI. Компания также переходит на более либеральную лицензию Apache 2.0.
... |
31.01.2025 | 99 вкладок браузера или «Бесконечность — не предел!» | Хабр, привет!
Представьте: вы открываете браузер и... 99 вкладок, хаос, поиск той самой нужной страницы превращается в квест. Мы, команда ИИнтеграция, столкнулись с этим лично, и именно так родился HoundApp — интеллектуальный ассистент, кот... |
31.01.2025 | DeepSeek App Blocked In Italy After Privacy Complaint Under EU’s GDPR, Irish Data Protection Commission Also Investigating | Last week Techdirt wrote about leading Chinese tech companies being hit with GDPR complaints from noyb.eu concerning the transfer of personal data from the EU to China. More recently, much of the world has been obsessed with another Chinese... |
31.01.2025 | Hirundo Unlearns Bias from DeepSeek-R1 and Releases Debiased Model Publicly | DeepSeek-R1 Debiased by Hirundo
Hirundo reduces bias in DeepSeek-R1 by 76% without performance loss, releasing the fairer model on Hugging Face to promote responsible AI development.
Bias in AI is not just a technical issue—it’s a strategic... |
31.01.2025 | Что такое DeepSeek и на что способна китайская нейросеть, из-за которой OpenAI снизил цену на ChatGPT | DeepSeek взорвал рынок нейросетей
Стандартный сценарий выхода новой нейросети обычно включает в себя громкие заявления, масштабную рекламную кампанию и последующее разочарование пользователей. Так было с Apple Intelligence, Galaxy AI и даже... |
30.01.2025 | The Rise of Open-Source AI: Alibaba's Qwen Models and the Future of Data Privacy | In the world of artificial intelligence, innovation is the lifeblood. Recently, Alibaba unveiled its Qwen models, a significant leap in open-source AI technology. These models, Qwen2.5-7B-Instruct-1M and Qwen2.5-14B-Instruct-1M, can process... |
30.01.2025 | The Rise of DeepSeek: A New Era in AI Efficiency and Competition | In the ever-evolving landscape of artificial intelligence, a seismic shift is underway. DeepSeek, a Chinese AI powerhouse, is making waves with its innovative models. The recent launch of the Janus Pro 7B vision model and the compression of... |
30.01.2025 | The Dawn of Janus: DeepSeek's Game-Changer in AI Image Generation | In the ever-evolving landscape of artificial intelligence, a new titan has emerged. DeepSeek, a Chinese startup, has launched Janus-Pro-7B, a model that claims to outperform established giants like DALL-E 3 and Stable Diffusion. This isn't ... |