Эволюция современного ИИ достигла явного переломного момента в конце 2023 года, когда такие инструменты, как Claude и ChatGPT, начали генерировать связные фрагменты кода без частых корректировок модели. Этот сдвиг привел к переходу от традиционной логики, основанной на правилах (Программное обеспечение 1.0), и машинного обучения (программное обеспечение 2.0) к новой эре программирования, в которой подсказки на естественном языке служат основным вычислительным рычагом (Программное обеспечение 3.0). В этой парадигме большие языковые модели интерпретируют контекстные окна для выполнения сложных вычислений непосредственно в цифровом пространстве, что в корне меняет взгляд разработчиков на дизайн системы.
Традиционная разработка программного обеспечения предполагала создание сложных интерфейсов и промежуточного программного обеспечения для обработки запросов пользователей, но программное обеспечение 3.0 позволяет нейронным сетям выполнять основную часть работы. Например, вместо ручного кодирования приложения для распознавания меню и получения изображений с помощью нескольких API, разработчик теперь может передавать фотографию непосредственно в мультимодальную модель, такую как Gemini, для мгновенного отображения визуального результата. Это говорит о том, что многие существующие приложения-посредники со временем станут ненужными, поскольку модели научатся выполнять сквозную обработку информации.
Автоматизация ИИ быстрее всего развивается в областях, где результаты могут быть легко проверены, таких как математика и программирование. Поскольку лаборатории отдают приоритет моделям обучения в таких проверяемых средах с использованием обучения с подкреплением, в этих конкретных областях наблюдается резкий рост возможностей по сравнению с более субъективными задачами. Интересно, что высокая производительность моделей в сложных задачах, таких как поиск уязвимостей нулевого дня, часто контрастирует с простыми логическими ошибками, что означает, что мастерство моделей сильно зависит от конкретных схем обучения с подкреплением.
В то время как "vibe coding" нацелена на то, чтобы предоставить разработчикам causal возможность создавать простые инструменты, agentic engineering стремится поддерживать высокую планку качества для профессионального производства программного обеспечения. Эта дисциплина требует координации сложных, но иногда подверженных ошибкам агентов для ускорения разработки без создания уязвимостей в области безопасности или эффективности. Потенциал для совершенствования в этой области огромен, и инженеры-агенты высшего уровня, вероятно, значительно превосходят производительность традиционных "инженеров 10x".
По мере того как модели берут на себя управление сложными внутренними API и деталями синтаксиса, роль человека-разработчика смещается в сторону высокоуровневой стратегии и эстетического контроля. В то время как ИИ-агент может справиться со специфическими операциями копирования памяти или изменения формы тензора, человек все равно должен понимать основные принципы, чтобы правильно управлять системой. Основная ценность человека заключается в способности определять подробные спецификации и поддерживать согласованный план, который затем выполняется агентами.
Способность передавать мышление на аутсорсинг с помощью инструментов искусственного интеллекта не означает способность передавать понимание на аутсорсинг. В дальнейшем образование и профессиональный рост должны быть направлены на углубление ментальных моделей и получение информации с помощью инструментов, поддерживающих модели, таких как базы знаний LLM. В конечном счете, люди должны оставаться руководителями процесса искусственного интеллекта, поскольку даже самые продвинутые модели по-прежнему полагаются на определенные человеком цели в управлении своей вычислительной обработкой.