Скорость эволюции ИИ

В марте 2026 года, когда пишется эта глава, в индустрии ИИ говорят: «То, что было нормой полгода назад, уже устарело».

В цифрах: инвестиции в ИИ в 2025 году достигли рекордных 225,8 млрд долларов[1]. 77% компаний внедрили или тестируют ИИ, 21% населения мира ежедневно пользуется ИИ-инструментами. Объём рынка в 2025 году оценивается в 244–391 млрд долларов.

Что произошло за последние полтора года — давайте посмотрим на хронологию.

Хронология развития ИИ 2024–2026

Теперь рассмотрим 4 ключевых тренда подробнее.

Мультимодальный ИИ — ИИ с «органами чувств»

Мультимодальный ИИ — это системы, работающие одновременно с текстом, изображениями, звуком и видео. Первые LLM «умели» только читать и писать текст. Современный ИИ видит фотографии, слышит речь и создаёт видео.

Прорывы 2025 года

Область Сервис Возможности
Генерация изображений GPT-4o (нативная генерация) Точная генерация изображений с текстом. После запуска в марте 2025 GPU «расплавились», как выразился Альтман
Генерация видео Google Veo 3 Генерация видео со звуком. Более 270 млн видеороликов создано после запуска
Понимание длинных текстов Gemini 2.5 Pro Обработка 1 млн токенов (больше целой книги) за раз. №1 на LMArena с момента выхода
Голосовой диалог GPT-4o Advanced Voice Естественный голосовой диалог в реальном времени без промежуточного текста

При этом генерация видео OpenAI «Sora» обходилась примерно в $15 млн/день на инфраструктуру и была закрыта в марте 2026 года. Качественное видео всё ещё стоит огромных ресурсов.

Практический совет: анализ изображений (фото → текст) доступен почти бесплатно у всех провайдеров. Распознавание чеков, оцифровка рукописных заметок, извлечение данных из графиков — попробуйте в повседневных задачах.

Революция моделей рассуждений — ИИ, который «думает»

Во второй половине 2024 года в мире ИИ появилась новая категория: модели рассуждений.

Обычный ИИ отвечает мгновенно. Модели рассуждений — иначе: они берут «время на обдумывание». Как человек решает математическую задачу не сразу, а делая пометки и рассуждая пошагово.

Эволюция моделей рассуждений — сравнение ключевых моделей

Почему это важно

Модели рассуждений резко подняли планку в областях, где ИИ раньше был слаб: математика, наука, сложное программирование.

  • OpenAI o4-mini — 92,7% на математической олимпиаде (AIME 2025). С использованием Python — 99,5%
  • DeepSeek R1 — обучение обошлось всего в ~$6 млн (для сравнения, GPT-4 — более $100 млн), но модель вышла на №1 в App Store в США в январе 2025 года. Акции Nvidia временно упали на 18%[2]
  • Claude Extended Thinking — уникальная возможность настройки «бюджета на размышления», а также «чередующееся мышление» — модель продолжает думать при работе с инструментами

Ключевой момент: вычисления на этапе рассуждения
Открытие того, что «чем дольше ИИ думает, тем точнее отвечает», добавило новое измерение прогресса. Помимо привычных «увеличить данные» и «увеличить модель», теперь увеличение вычислений при рассуждении тоже повышает качество.

ИИ-агенты — эпоха делегирования

Самое горячее слово 2025–2026 — ИИ-агенты.

Раньше ИИ был «собеседником, который отвечает на вопросы». ИИ-агент — другое: вы ставите цель, а он планирует, использует инструменты и самостоятельно выполняет задачу. Примерно как поручить работу ассистенту.

ИИ-агенты: основные сервисы и объём рынка

Примеры ИИ-агентов

Агент Возможности Особенности
Claude Code Автономная генерация, выполнение и отладка кода Один из 3 продуктов, достигших ARR $1 млрд в сфере ИИ для кода
Operator Управление браузером: бронирование, исследования Предусматривает контрольные точки для человека, но безопасность — вызов
Manus AI Выполнение сложных задач в облаке асинхронно Появился в марте 2025, вскоре Meta купила за ~$2 млрд
Devin Автономный ИИ-разработчик $500/мес. Официальная успешность — 13,86%, технология в развитии

MCP — «общий язык» ИИ-агентов

Стандарт для взаимодействия агентов с внешними инструментами — MCP (Model Context Protocol), разработанный Anthropic, — стремительно распространяется. В декабре 2025 года передан Linux Foundation; количество загрузок SDK достигло 97 млн/мес. ChatGPT, Gemini, VS Code, AWS, Azure — все крупные платформы его поддерживают.

По прогнозу Gartner, к концу 2026 года ИИ-агенты будут встроены в 40% корпоративных приложений[1].

Ограничения агентов: агенты удобны, но пока имеют серьёзные ограничения: ошибки в сложных решениях, риски безопасности (несанкционированная отправка данных), затраты (многократные API-вызовы) и непрозрачность. Принцип «делегируй, но проверяй» — обязателен.

Подъём ИИ с открытым кодом

GPT-4 и Claude — не единственный путь. Открытые модели ИИ, бесплатные для использования и модификации, развиваются с невероятной скоростью.

Основные модели (2025)

Модель Разработчик Особенности
Llama 4 Scout/Maverick Meta Scout: контекст 10 млн токенов, работает на 1 H100. Maverick: на уровне GPT-4o
DeepSeek V3/R1 DeepSeek (Китай) V3: обучение за ~$6 млн при уровне GPT-4o. R1: модель рассуждений №1 в США
Qwen 3 Alibaba Лицензия Apache 2.0. 119 языков. По загрузкам обогнал Llama

Почему открытый код важен

  1. Прозрачность — можно проверить и оценить безопасность модели
  2. Кастомизация — создание специализированных моделей на своих данных
  3. Стоимость — запуск на своём сервере = нулевые расходы на API
  4. Конфиденциальность — данные не уходят наружу
  5. Конкуренция — предотвращение монополии нескольких корпораций

Летом 2025 года произошёл символический момент: по суммарным загрузкам китайские модели (DeepSeek + Qwen) обогнали американские. Геополитический баланс в ИИ меняется.

Что это значит для обычного пользователя: открытые модели — в основном для компаний и разработчиков, но их выгоды ощущает каждый. Конкуренция снижает цены и повышает качество коммерческих ИИ. После появления DeepSeek R1 все компании значительно снизили цены на API.

Будущее ИИ — перспективы после 2026 года

Будущее ИИ: робототехника, AGI, стратегии развития

ИИ + робототехника — «подвижный ИИ»

Гуманоидные роботы с интеллектом LLM начинают работать в реальных условиях.

  • Figure 03 — развёрнут на заводе BMW. Инвестиции превышают $1 млрд
  • 1X NEO — первый бытовой гуманоид. ~$20 000 ($499/мес.), поставки с 2026 года
  • Tesla Optimus — целевая цена $20–30 тыс. План — десятки тысяч единиц в 2026 году
  • Китай — более 140 компаний, 330+ моделей в разработке

Путь к AGI — прогнозы экспертов

AGI (Artificial General Intelligence — общий искусственный интеллект, на уровне человека) — когда он появится?

Позиция Прогноз
Anthropic «Начало 2027 года» — ИИ на уровне нобелевского лауреата к концу 2026 – началу 2027
OpenAI «Мы знаем, как его создать» — оптимизм без точных дат
Google DeepMind «Через 3–5 лет» — сдвиг с прежних «10 лет»
Скептики «Нужен фундаментальный прорыв» — при текущем подходе 10–20 лет

AGI не означает мгновенных перемен в повседневной жизни. Но факт: спектр задач, доступных ИИ, расширяется каждый месяц. Убеждение «ИИ это точно не сможет» может устареть через полгода.

Что делать сейчас — в эпоху ИИ

3 принципа

  1. Пробуйте и привыкайте — бесплатные ИИ-инструменты доступны прямо сейчас. Лучше один раз попробовать, чем сто раз прочитать
  2. Сочетайте со своими сильными сторонами — ИИ — это инструмент. Ценность создаётся на стыке ИИ и вашей экспертизы, креативности
  3. Получайте удовольствие от перемен — в эпоху, когда за полгода меняется всё, любопытство — главный навык

Источники

  1. Gartner. "Worldwide AI Spending Will Total $1.5 Trillion in 2025." Gartner Newsroom, September 2025. / Fortune Business Insights. "Artificial Intelligence Market Report." 2025.
  2. "DeepSeek R1: Open-source reasoning model." DeepSeek API Docs, January 20, 2025. / Market impact reported by multiple financial outlets, January 27, 2025.
  3. "Japan adopts first AI basic plan with 1 trillion yen investment." Nikkei, December 2025. / "Japan AI Basic Plan." AI Strategy Headquarters, December 2025.

Полезные ссылки:

  • Hugging Face Models — хаб моделей ИИ с открытым кодом
  • LM Arena — рейтинг и сравнение ИИ-моделей

Поздравляем — вы прошли все 6 глав!
Вы получили систематические знания от основ ИИ до последних трендов. ИИ развивается каждый день. Используйте полученную базу как фундамент, пробуйте инструменты на практике и следите за новостями.