OpenAI o1: Шаг вглубь разума или дорогостоящий эксперимент?

56

В четверг мир ИИ замер в ожидании. OpenAI представила свои новые модели o1, давшие пользователям возможность прикоснуться к искусственному интеллекту, который прежде чем ответить, задумывается – словно человек.

Загадка “Strawberry”

За кулисами этих моделей, получивших прозвище “Strawberry”, кипит ажиотаж. Но оправдывает ли эта загадочная Strawberry все шумиху? На первый взгляд – да и нет. OpenAI o1 словно делает шаг вперед и два назад по сравнению с уже знакомым GPT-4o. С одной стороны, он блистает способностью рассуждать и отвечать на сложные вопросы, но стоит это в четыре раза дороже, чем его предшественник. GPT-4o, в свою очередь, сохраняет свои преимущества: мультимодальность, скорость и инструменты, которые сделали его таким популярным. OpenAI даже признает, что для большинства запросов GPT-4o все еще остается лучшим выбором.

Мнение экспертов

“Это впечатляет, но я бы не сказал, что это революционное улучшение,” – комментирует Равид Шварц Зив, профессор Нью-Йоркского университета, изучающий модели ИИ. “В некоторых задачах o1 превосходит GPT-4o, но в целом различий не так много.”

Именно поэтому эксперты советуют использовать o1 только для действительно сложных задач, где его способность к многоступенчатому рассуждению может стать решающей.

Думай как человек: Многоступенчатое мышление

Новизна подхода

Особенность o1 заключается в том, что он “думает”, разбивая сложные вопросы на мелкие шаги и анализируя правильность каждого из них. Это многоступенчатое рассуждение не является чем-то новым (исследователи давно его предлагали), но до недавнего времени оно было непрактичным. OpenAI, похоже, нашла способ сделать это работающим.

“В сообществе ИИ настоящий ажиотаж,” – говорит Киан Катанфоруш, генеральный директор Workera и адъюнкт-преподаватель Стэнфорда, специализирующийся на машинном обучении. “Если вы сможете объединить обучение с подкреплением алгоритмов с языковыми моделями OpenAI, вы получите возможность создавать пошаговое мышление у ИИ, позволяющее ему оттачивать большие идеи.”

Цена рассуждений

Еще одна особенность o1 – его цена. В отличие от большинства моделей, где оплачиваются входные и выходные токены, здесь взимается плата за “логические токены” – скрытый процесс многоступенчатого мышления, требующий огромных вычислительных мощностей.

Это подчеркивает важность избирательного использования o1, чтобы не переплачивать за ответы на простые вопросы, вроде местоположения столицы Невады.

Практика: От Дня Благодарения до деловых поездок

Тем не менее, идея модели, помогающей “оттачивать большие идеи”, очень сильна. На практике o1 справляется с этим неплохо.

В одном из тестов я попросил o1 помочь моей семье спланировать ужин на День Благодарения – задачу, где логика и рассуждения были бы кстати. Мне нужно было понять, хватит ли двух духовок для 11 человек и стоит ли арендовать Airbnb с третьей духовкой. После 12 секунд “раздумий” o1 предоставил развернутый ответ более чем в 750 словах, обосновав, что двух духовок достаточно при грамотной стратегии, и предложив варианты экономии средств и времени.

Он не просто давал советы, а шаг за шагом объяснял свое видение, учитывая все факторы, включая затраты, время семьи и управление духовкой. В отличие от GPT-4o, которая требовала уточняющих вопросов о каждом блюде и давала более поверхностные советы.

Аналогично, o1 помог составить план напряженного рабочего дня с аэропортом, встречами и офисом, предоставив подробный маршрут. Правда, иногда избыточность информации могла быть утомительной.

Однако при простом запросе (где найти кедровые деревья в Америке) o1 переусердствовал, написав 800-словный ответ с описанием всех видов кедровых деревьев и даже политикой OpenAI. GPT-4o справился бы этим за пару предложений.

Ожидания vs Реальность: Не AGI, но шаг вперед

Запуск o1 сопровождался ожиданиями, порожденными слухами о “логических моделях” OpenAI, которые появились в ноябре 2023 года, во время скандала с увольнением Сэма Альтмана. Многие надеялись на AGI – искусственный интеллект, превосходящий человеческий.

Альтман развеял эти ожидания, подчеркнув, что o1 не является AGI. Тем не менее, он признал, что модель “по-прежнему несовершенна и ограничена”.

Мир ИИ смиряется с тем, что Strawberry – это шаг вперед, но не революция, как GPT-4.

“Ажиотаж вышел из-под контроля у OpenAI,” – считает Рохан Пандей, инженер-исследователь стартапа ReWorkd. Он надеется, что логические способности o1 помогут решать сложные задачи, где GPT-4 не справляется, но признает, что это скорее эволюция, а не революция.

Ценность в процессе: От AlphaGo до “умного” совещания

Принципы, лежащие в основе o1, были заложены давно. Энди Харрисон, бывший сотрудник Google и генеральный директор венчурной компании S32, напоминает о проекте AlphaGo 2016 года, где Google использовала аналогичный подход для создания первой ИИ-системы, победившей чемпиона мира по Го.

Он отмечает давний спор в ИИ: “Один лагерь считает, что с помощью агентурного процесса можно автоматизировать рабочие процессы. Другой – что если у вас есть обобщенный интеллект и способность рассуждать, вам не нужен рабочий процесс, и ИИ просто вынес бы решение, как человек.”

Харрисон принадлежит к первому лагерю, считая, что o1 – инструмент для “умного” совещания. Представьте: вы собираетесь взять интервью у специалиста по обработке данных. Вы говорите o1 о своих 30-минутном ограничении и необходимых навыках. Модель анализирует ситуацию, учитывая время и другие факторы, помогая вам лучше структурировать вопросы и оценить кандидата.

Однако цена – это вопрос. В то время как модели ИИ в целом дешевеют, o1 стала одной из первых, которая подорожала. Стоит ли эта “умная” рассудительность такой высокой стоимости? Время покажет.