Sapient бросает вызов ChatGPT: новый игрок в гонке ИИ
PostsSapient бросает вызов ChatGPT: новый игрок в гонке ИИ

Sapient бросает вызов ChatGPT: новый игрок в гонке ИИ

3 min read·Feb 9, 2025
Table of contents

Sapient бросает вызов ChatGPT: новый игрок в гонке ИИ

ИИ 2.0? Sapient представляет "компактную" модель, способную затмить ChatGPT

В мире искусственного интеллекта появился новый претендент: иерархическая модель рассуждений (HRM) от компании Sapient. Сможет ли эта "компактная" модель потеснить гигантов вроде ChatGPT, вдохновленная устройством человеческого мозга?

Иерархия против "цепи мыслей": новый подход к рассуждениям

В сфере искусственного интеллекта, где доминируют огромные языковые модели (LLM) типа ChatGPT, назревает переворот. Компания Sapient из Сингапура представила иерархическую модель рассуждений (HRM), которая, по их словам, способна на большее при меньших затратах. В то время как LLM используют метод "цепь мыслей" (CoT), HRM черпает вдохновение в иерархической организации и мульти-временных процессах, происходящих в человеческом мозге.

Это как сравнивать старый добрый арифмометр с современным квантовым компьютером – оба считают, но как!

Ключевое отличие HRM – ее "компактность". Всего 27 миллионов параметров и обучение на 1000 примерах. Это на порядки меньше, чем у LLM, где GPT-5, по слухам, может содержать от 3 до 5 триллионов параметров.

Разработчики утверждают, что эффективность достигается за счет разделения задач между высокоуровневым модулем (абстрактное планирование) и низкоуровневым (детальные вычисления). Это как если бы у вас был генеральный директор, который ставит цели, и команда исполнителей, которые их достигают.

HRM также использует итеративное уточнение, улучшая решение шаг за шагом, и самостоятельно решает, когда "думать" дальше, а когда выдавать результат. Представьте себе художника, который постепенно наносит мазки на холст, пока не получится шедевр.

Первые успехи и скептический взгляд на будущее

Первые результаты HRM впечатляют. В бенчмарке ARC-AGI, оценивающем приближение моделей к искусственному общему интеллекту (AGI), HRM показала результаты выше, чем известные LLM. В тесте ARC-AGI-1 она набрала 40.3%, обогнав o3-mini-high (34.5%), Claude 3.7 (21.2%) и Deepseek R1 (15.8%).

Особенно впечатляет ее способность решать сложные судоку и находить оптимальные пути в лабиринтах, с чем LLM обычно не справляются. Это как если бы вы дали компьютеру головоломку, которую он решил быстрее и лучше, чем человек.

Однако, как и в любой научной работе, к новым результатам нужно относиться с осторожностью. Во-первых, исследование еще не прошло экспертную оценку. Во-вторых, воспроизведение результатов ARC-AGI сторонними исследователями выявило нюансы.

Оказалось, что иерархическая архитектура оказывает меньшее влияние на производительность, чем предполагалось. Основной прирост, по мнению исследователей, обеспечивается недокументированным процессом доработки во время обучения. 

В самом сложном тесте ARC-AGI-2 HRM набрала всего 5%, что хоть и превосходит показатели конкурентов, но указывает на ограничения модели. Это как если бы вы обнаружили, что новый чудо-препарат работает не так хорошо, как рекламировалось.

Открытый код и перспективы развития

Несмотря на оговорки, HRM – это интересный и перспективный подход к разработке ИИ. Открытый исходный код модели позволяет другим исследователям изучить ее сильные и слабые стороны и внести свой вклад в ее развитие.

Успехи HRM могут способствовать созданию более эффективных и мощных моделей ИИ, требующих меньше вычислительных ресурсов.

Возможно, будущее ИИ – не в наращивании количества параметров, а в более эффективной организации и использовании ресурсов. HRM показывает, что вдохновение можно черпать в самой природе, в том, как устроен наш мозг. Похоже мы заново открыли секреты Леонардо да Винчи и применили их к современным технологиям.

Что все это значит?

Иерархическая модель рассуждений от Sapient – это не просто еще один ИИ-проект. Это вызов существующей парадигме, попытка создать более эффективный и экономичный ИИ, вдохновленный самой природой. Несмотря на первые успехи и существующие ограничения, HRM открывает новые перспективы для решения сложных задач в различных областях. Время покажет, сможет ли она потеснить гигантов, но уже сейчас она заставляет нас задуматься о том, как мы строим искусственный интеллект.

Вопросы для размышления

  • Может ли "компактный" ИИ превзойти огромные языковые модели?
  • Какие еще уроки можно извлечь из устройства человеческого мозга для создания более эффективного ИИ?
  • Какие этические вопросы возникают в связи с разработкой ИИ, имитирующего человеческое мышление?

Written by Boaleks

Контент сам себя не сделает… Или сделает?!

GridMindAI: AI-агенты, поиск новостей, мультипликация контента, контент-план в таблице Google.