Преодолейте ажиотаж вокруг ИИ-агентов с помощью трехуровневой карты ИИ-агент стал модным словом, однако объяснения варьируются от слишком сложных до слишком простых или слишком многообещающих. Разобраться в этом проще, если подняться по простой лестнице из трех ступеней: большие языковые модели, рабочие процессы ИИ, затем агенты ИИ. Цель - внести практическую ясность для людей, которые уже используют инструменты искусственного интеллекта без технического образования, попутно избавив их от таких терминов, как RAG и ReAct.
Что на самом деле делают магистры: Вводят Запрос, отправляют Текстовое сообщение — и Ничего Не происходит, Пока Вы Не Спросите Большие языковые модели позволяют чат-ботам, таким как ChatGPT и Gemini, превосходно писать и редактировать текст. Вы вводите запрос в качестве входных данных и получаете текст в качестве выходных данных. Их отличают два свойства: они не могут получить доступ к вашим личным данным без явного подключения, и они пассивны — ничего не происходит, пока вы не попросите.
Рабочие процессы искусственного интеллекта: логика управления, определяемая человеком, и доступ к инструментам Рабочие процессы ИИ - это заранее спланированные инструкции, которые указывают модели, какие инструменты использовать, в каком порядке и как действовать. Подключите календарь, и он сможет ответить на вопрос "Когда у меня вечеринка?"; добавьте погодный API и голосового помощника, который будет получать прогноз и озвучивать ответ. Поисково-расширенная генерация просто означает получение необходимой информации перед ответом и является всего лишь еще одним этапом рабочего процесса.
Канал передачи новостей в социальные сети - и почему Он все еще нуждается в Вас Создайте конвейер, который сохраняет ссылки на новости в Google Sheet, использует GPT для их обобщения, генерирует сообщения в Telegram и Instagram на основе этих сводок и запускается автоматически в 8:00 каждое утро. Последовательность действий четко определена — делай это, затем то, — поэтому результаты отражают то, как человек настраивает шаги и подсказки. Когда результаты не удовлетворяют, пользователь редактирует подсказки и повторно тестирует, повторяя вручную для улучшения качества.
От рабочего процесса к агенту: Рассуждайте, действуйте и самосовершенствуйтесь (реагируйте) Чтобы стать агентом, человек выходит из цикла, и модель берет на себя планирование и выполнение задач. Агент решает, где собирать новости, выбирает инструменты, записывает, проверяет по критериям, пересматривает и повторяет до тех пор, пока цель не будет достигнута, следуя схеме "сначала рассуждай, а потом действуй". Он может даже привлечь вторую модель для критического анализа черновиков, обновления собственных настроек на основе отзывов и получения улучшенного результата, в то время как человек только устанавливает цели и утверждает изменения.
Агенты в дикой природе, текущие ограничения и что будет дальше Реальные агенты уже справляются с конкретными задачами: в одной из демонстраций можно найти "волка ночью" в видеороликах, используя атрибуты и сканируя файлы, чтобы выделить совпадения — люди обычно ставили метки вручную. Появляются специализированные сервисы: Lovable создает прототипы веб-приложений и страниц на основе краткого описания, Aabkus проводит веб-исследования, такие как обзоры торговых площадок или планы поездок, а Manus преуспевает в сборе информации на ранней стадии. Технологические гиганты демонстрируют "офисные" средства, такие как просмотр веб—страниц в ChatGPT и редактирование документов, а также аналогичные разработки Google, Anthropic и Microsoft, но это в основном демонстрации, и они пока не пользуются большим доверием при бронировании или путешествиях. Краткосрочный прогресс может привести к появлению агентов уровня личных помощников, хотя современные инструменты по-прежнему эффективны для решения узких, узкоспециализированных задач.