squirrelcat

Развитие забуксовало? Кажется, у искусственного интеллекта появились проблемы

Крупнейшие компании испытывают все больше сложностей в поиске свежих источников высококачественных данных для обучения своих более продвинутых систем ИИ.

Сначала все было хорошо. И некоторые даже поверили, что вот-вот ИИ заменит нам все - от высококлассных специалистов до навязчивой необходимости учиться в школе. ИИ за нас и выучится, и реорганизует медицину и ЖКХ, отправит на покой (во всех смыслах) водителей человеческого происхождения, покажет нам куда бы мы могли поехать в отпуск и расскажет, как прекрасен мир где-то там, где ни нас, ни самого ИИ нет и не было. 

О проблемах

Спустя несколько лет стремительного прогресса в разработке всё более сложных ИИ-продуктов у ведущих компаний области появились проблемы. к 2024 году отдача от инвестиций в новые технологии стала снижаться. В то же время проблема разработки возникла не вчера, она вообще существовала с первого дня, просто с течением времени усугубилась. Поиск свежих и качественных данных для обучения продвинутых систем становится задачей крайне трудной. Все вот это свежее и качественное должно быть сгенерировано живыми людьми... Часть такой информации уже "освоена", часть не отвечает требованиям, ну хоть людей нанимай и пускай создают контент для обучения ИИ.
Нынешние незначительные улучшения не способны оправдать колоссальные затраты на создание и внедрение новых моделей, а также не удовлетворяют возросшие ожидания от новых продуктов.

Некоторые продукты

Для примера вспомним про Orion от OpenAI. Инсайдеры еще в летом текущего года говорили, что компания находится на пороге важной вехи. В сентябре завершился начальный этап обучения для масштабной модели Orion. Предполагалось, что состоявшееся успешное обучение станет (дальше красиво, прям для рекламы формулировка) важным шагом на пути к созданию ИИ, превосходящего человеческие способности.
Стало?
Нет. Orion вроде должна была, но не смогла продемонстрировать тот прорыв, который ранее продемонстрировала модель GPT-4 по сравнению со своей предшественницей, GPT-3.5.

  • О ChatGPT

    Подробнее
  • Что уме­ет?

    Что уме­ет?

    Спо­собен вес­ти ди­алог, ис­кать ошиб­ки в ко­де, со­чинять сти­хи, пи­сать сце­нарии и да­же спо­рить.
  • Ог­ра­ниче­ния прог­раммы

    Ог­ра­ниче­ния прог­раммы

    Мо­дель воз­награж­де­ния ChatGPT, раз­ра­ботан­ная с учё­том че­лове­чес­ко­го над­зо­ра, мо­жет быть чрез­мерно оп­ти­мизи­рова­на и, та­ким об­ра­зом, сни­жать про­из­во­дитель­ность в со­от­ветс­твии с за­коном Гуд­харта.
  • На­писа­ние ко­да с по­мощью ChatGPT

    На­писа­ние ко­да с по­мощью ChatGPT

    Чат-бот не толь­ко под­ска­зыва­ет, как вы­пол­нить опе­рацию или про­цесс, но и ана­лизи­ру­ет код, ищет в нем не­дос­татки, а так­же пе­рево­дит из од­но­го язы­ка прог­рамми­рова­ния в дру­гой. Его уже ус­пешно при­меня­ли для соз­да­ния прос­тых, но пол­но­фун­кци­ональ­ных при­ложе­ний для iOS и Android.
  • Дос­тупность

    Дос­тупность

    Дос­туп к сер­ви­су ог­ра­ничен в та­ких стра­нах, как Ки­тай, Рос­сия, Бе­лорус­сия, Аф­га­нис­тан, Ве­несу­эла, Тур­кме­нис­тан, Иран. Так­же ра­нее сер­вис не был дос­ту­пен для жи­телей Ук­ра­ины и Ита­лии.

Да, деваться некуда: как для  OpenAI, так и для ее товарищей по сфере развития и по несчастью самая большая проблема в том, что интеллектуальная собственность (защищенная или в открытом доступе) - ресурс исчерпаемый. За последние годы разработчики пользовались всеми доступными данными, включая информацию из соцсетей, включая X (бывший Twitter) и YouTube.
А теперь все.
OpenAI даже была вынуждена заключить соглашения с издателями, ради получения высококачественных данных и противодействия растущему юридическому давлению со стороны правообладателей. Помогло это? Отчасти. Увы. и это исчерпаемый ресурс.

Неужели всё?

Чтобы научить ИИ чему-то принципиально новому это новое надо найти (или создать). А значит развитие ИИ серьезно затормозится и это неизбежно. И сейчас специалисты сосредоточились на том, чтобы научить ИИ анализировать и проверять свои ответы перед выдачей. 

То есть, главное требование - уйти все дальше от случайного ответа "по теме", подчас мало общего имеющего с реальностью. Модель учат генерировать несколько ответов в режиме реального времени, а потом путем сравнения выбирать лучший. По такому принципу уже работает, например, GPT-4o1, а создатели похожих продуктов делают этот принцип тенденцией.
И все же замедление в борьбе за качество неизбежно. Пользователи "наигрались". Теперь большинство обращается к искусственному интеллекту за серьезными ответами, но не ради развлечения.

Действия от лица пользователей

Есть другой вариант развития - не улучшение имеющегося, а создание похожего с близким, но иным функционалом. И сразу несколько компаний готовы представлять свои ИИ-агенты, которые позволят выполнять разнообразные задачи на ПК практически без участия пользователя.
Речь о создании амбициозного отраслевого проекта, направленного на разработку программного обеспечения на основе ИИ, способного выполнять многоступенчатые задачи с минимальным вмешательством со стороны пользователей.

OpenAI активно разрабатывает сразу несколько проектов, связанных с ИИ-агентами. Ближе всего к завершению находится универсальный инструмент, способный выполнять задачи в веб-браузере.

Компания Anthropic уже представила аналогичного агента, который может в реальном времени анализировать происходящие на компьютере пользователя события и выполнять действия от его имени (правда, столкнувшись с отставанием в графике появления необходимых функций). Тем временем Microsoft, поддерживающая OpenAI, недавно выпустила набор инструментов, предназначенных для отправки электронных писем и управления записями сотрудников. Google тоже готовится к выходу своего агента на основе ИИ (еще один дискуссионный вопрос о том оправдывает Gemini ожидания или не оправдывает).

И если всего несколько месяцев назад мы ждали что Orion достигнет (а он не достиг!)желаемой OpenAI
производительности, то теперь нам предлагается подождать января 2025-го. Сэм Альтман во время сессии вопросов-ответов на Reddit продукты компании ожидаемо хвалил, и тенденцию в разработке описал более чем конкретно.

Хотя дата выхода Operator для широкой аудитории пока не объявлена, данная разработка указывает на переход к новому поколению ИИ, которые не просто обрабатывают информацию, но и способны активно взаимодействовать с компьютерными системами.
Прекрасно, но это разворот в стратегии, связанный с реальной и потенциальной неудачей. Окупаемость инвестиций в ИИ и достижимость такой глобальной цели. как создание общего искусственного интеллекта (AGI), превосходящего человека в решении большинства интеллектуальных задач - под вопросом. 

Разработчики ИИ-моделей стоят перед выбором - развивать старые модели, дополняя их и улучшая, или же запускать новые версии (дорогие, связанные с использованием синтетических данных, с эмоциональным пост-обучением и т.д.). К сожалению, второй вариант не гарантирует, что ИИ станет работать намного лучше. У инвесторов же по мере роста затрат продолжают расти ожидания, но стремительное развития ИИ, каким оно было на начальном этапе, увы, в ближайшие месяцы (возможно, и годы) не ожидается. 

  • О чем статья?

    Подробнее
  • Проб­ле­мы обу­чения ИИ

    По­иск све­жих и ка­чес­твен­ных дан­ных для обу­чения прод­ви­нутых сис­тем ста­новит­ся за­дачей край­не труд­ной. Все вот это све­жее и ка­чес­твен­ное дол­жно быть сге­нери­рова­но жи­выми людь­ми.
  • Сог­ла­сия пра­во­об­ла­дате­лей все же спро­сили

    OpenAI вы­нуж­де­на зак­лю­чить сог­ла­шения с из­да­теля­ми, ра­ди по­луче­ния вы­соко­качес­твен­ных дан­ных и про­тиво­дей­ствия юри­дичес­ко­му дав­ле­нию со сто­роны пра­во­об­ла­дате­лей.
  • Про­ек­ты с но­вым фун­кци­она­лом

    Агент Anthropic мо­жет ана­лизи­ровать про­ис­хо­дящие на компь­юте­ре поль­зо­вате­ля со­бытия, Microsoft вы­пус­ти­ла инс­тру­мен­ты для от­прав­ки элек­трон­ных пи­сем, есть аген­ты у Google и OpenAI.
  • Ди­лем­ма

    Раз­ра­бот­чи­ки сто­ят пе­ред вы­бором — раз­ви­вать ста­рые мо­дели, до­пол­няя их и улуч­шая, или же за­пус­кать но­вые вер­сии — бо­лее до­рогие, но не нам­но­го эф­фектив­ней име­ющих­ся.
squirrelcat
28

Начать обсуждение

0

ViStat.org - проект с интерактивной инфографикой. Мы делаем информацию визуальной и удобной для восприятия: кликайте на фотографии с деталями или на пиктограммы в ленте событий и узнавайте подробности об этом.

Некоммерческий проект ViStat.org создан с целью визуализации знаний, а также систематизации фактов о событиях, процессах, явлениях для детального поиска в рамках творческой, учебной и иной аналитической деятельности.

Для связи с нами пишите на почту vs@vistat.org