Скорость эволюции ИИ
В марте 2026 года, когда пишется эта глава, в индустрии ИИ говорят: «То, что было нормой полгода назад, уже устарело».
В цифрах: инвестиции в ИИ в 2025 году достигли рекордных 225,8 млрд долларов[1]. 77% компаний внедрили или тестируют ИИ, 21% населения мира ежедневно пользуется ИИ-инструментами. Объём рынка в 2025 году оценивается в 244–391 млрд долларов.
Что произошло за последние полтора года — давайте посмотрим на хронологию.
Теперь рассмотрим 4 ключевых тренда подробнее.
Мультимодальный ИИ — ИИ с «органами чувств»
Мультимодальный ИИ — это системы, работающие одновременно с текстом, изображениями, звуком и видео. Первые LLM «умели» только читать и писать текст. Современный ИИ видит фотографии, слышит речь и создаёт видео.
Прорывы 2025 года
| Область | Сервис | Возможности |
|---|---|---|
| Генерация изображений | GPT-4o (нативная генерация) | Точная генерация изображений с текстом. После запуска в марте 2025 GPU «расплавились», как выразился Альтман |
| Генерация видео | Google Veo 3 | Генерация видео со звуком. Более 270 млн видеороликов создано после запуска |
| Понимание длинных текстов | Gemini 2.5 Pro | Обработка 1 млн токенов (больше целой книги) за раз. №1 на LMArena с момента выхода |
| Голосовой диалог | GPT-4o Advanced Voice | Естественный голосовой диалог в реальном времени без промежуточного текста |
При этом генерация видео OpenAI «Sora» обходилась примерно в $15 млн/день на инфраструктуру и была закрыта в марте 2026 года. Качественное видео всё ещё стоит огромных ресурсов.
Практический совет: анализ изображений (фото → текст) доступен почти бесплатно у всех провайдеров. Распознавание чеков, оцифровка рукописных заметок, извлечение данных из графиков — попробуйте в повседневных задачах.
Революция моделей рассуждений — ИИ, который «думает»
Во второй половине 2024 года в мире ИИ появилась новая категория: модели рассуждений.
Обычный ИИ отвечает мгновенно. Модели рассуждений — иначе: они берут «время на обдумывание». Как человек решает математическую задачу не сразу, а делая пометки и рассуждая пошагово.
Почему это важно
Модели рассуждений резко подняли планку в областях, где ИИ раньше был слаб: математика, наука, сложное программирование.
- OpenAI o4-mini — 92,7% на математической олимпиаде (AIME 2025). С использованием Python — 99,5%
- DeepSeek R1 — обучение обошлось всего в ~$6 млн (для сравнения, GPT-4 — более $100 млн), но модель вышла на №1 в App Store в США в январе 2025 года. Акции Nvidia временно упали на 18%[2]
- Claude Extended Thinking — уникальная возможность настройки «бюджета на размышления», а также «чередующееся мышление» — модель продолжает думать при работе с инструментами
Ключевой момент: вычисления на этапе рассуждения
Открытие того, что «чем дольше ИИ думает, тем точнее отвечает», добавило новое измерение прогресса. Помимо привычных «увеличить данные» и «увеличить модель», теперь увеличение вычислений при рассуждении тоже повышает качество.
ИИ-агенты — эпоха делегирования
Самое горячее слово 2025–2026 — ИИ-агенты.
Раньше ИИ был «собеседником, который отвечает на вопросы». ИИ-агент — другое: вы ставите цель, а он планирует, использует инструменты и самостоятельно выполняет задачу. Примерно как поручить работу ассистенту.
Примеры ИИ-агентов
| Агент | Возможности | Особенности |
|---|---|---|
| Claude Code | Автономная генерация, выполнение и отладка кода | Один из 3 продуктов, достигших ARR $1 млрд в сфере ИИ для кода |
| Operator | Управление браузером: бронирование, исследования | Предусматривает контрольные точки для человека, но безопасность — вызов |
| Manus AI | Выполнение сложных задач в облаке асинхронно | Появился в марте 2025, вскоре Meta купила за ~$2 млрд |
| Devin | Автономный ИИ-разработчик | $500/мес. Официальная успешность — 13,86%, технология в развитии |
MCP — «общий язык» ИИ-агентов
Стандарт для взаимодействия агентов с внешними инструментами — MCP (Model Context Protocol), разработанный Anthropic, — стремительно распространяется. В декабре 2025 года передан Linux Foundation; количество загрузок SDK достигло 97 млн/мес. ChatGPT, Gemini, VS Code, AWS, Azure — все крупные платформы его поддерживают.
По прогнозу Gartner, к концу 2026 года ИИ-агенты будут встроены в 40% корпоративных приложений[1].
Ограничения агентов: агенты удобны, но пока имеют серьёзные ограничения: ошибки в сложных решениях, риски безопасности (несанкционированная отправка данных), затраты (многократные API-вызовы) и непрозрачность. Принцип «делегируй, но проверяй» — обязателен.
Подъём ИИ с открытым кодом
GPT-4 и Claude — не единственный путь. Открытые модели ИИ, бесплатные для использования и модификации, развиваются с невероятной скоростью.
Основные модели (2025)
| Модель | Разработчик | Особенности |
|---|---|---|
| Llama 4 Scout/Maverick | Meta | Scout: контекст 10 млн токенов, работает на 1 H100. Maverick: на уровне GPT-4o |
| DeepSeek V3/R1 | DeepSeek (Китай) | V3: обучение за ~$6 млн при уровне GPT-4o. R1: модель рассуждений №1 в США |
| Qwen 3 | Alibaba | Лицензия Apache 2.0. 119 языков. По загрузкам обогнал Llama |
Почему открытый код важен
- Прозрачность — можно проверить и оценить безопасность модели
- Кастомизация — создание специализированных моделей на своих данных
- Стоимость — запуск на своём сервере = нулевые расходы на API
- Конфиденциальность — данные не уходят наружу
- Конкуренция — предотвращение монополии нескольких корпораций
Летом 2025 года произошёл символический момент: по суммарным загрузкам китайские модели (DeepSeek + Qwen) обогнали американские. Геополитический баланс в ИИ меняется.
Что это значит для обычного пользователя: открытые модели — в основном для компаний и разработчиков, но их выгоды ощущает каждый. Конкуренция снижает цены и повышает качество коммерческих ИИ. После появления DeepSeek R1 все компании значительно снизили цены на API.
Будущее ИИ — перспективы после 2026 года
ИИ + робототехника — «подвижный ИИ»
Гуманоидные роботы с интеллектом LLM начинают работать в реальных условиях.
- Figure 03 — развёрнут на заводе BMW. Инвестиции превышают $1 млрд
- 1X NEO — первый бытовой гуманоид. ~$20 000 ($499/мес.), поставки с 2026 года
- Tesla Optimus — целевая цена $20–30 тыс. План — десятки тысяч единиц в 2026 году
- Китай — более 140 компаний, 330+ моделей в разработке
Путь к AGI — прогнозы экспертов
AGI (Artificial General Intelligence — общий искусственный интеллект, на уровне человека) — когда он появится?
| Позиция | Прогноз |
|---|---|
| Anthropic | «Начало 2027 года» — ИИ на уровне нобелевского лауреата к концу 2026 – началу 2027 |
| OpenAI | «Мы знаем, как его создать» — оптимизм без точных дат |
| Google DeepMind | «Через 3–5 лет» — сдвиг с прежних «10 лет» |
| Скептики | «Нужен фундаментальный прорыв» — при текущем подходе 10–20 лет |
AGI не означает мгновенных перемен в повседневной жизни. Но факт: спектр задач, доступных ИИ, расширяется каждый месяц. Убеждение «ИИ это точно не сможет» может устареть через полгода.
Что делать сейчас — в эпоху ИИ
3 принципа
- Пробуйте и привыкайте — бесплатные ИИ-инструменты доступны прямо сейчас. Лучше один раз попробовать, чем сто раз прочитать
- Сочетайте со своими сильными сторонами — ИИ — это инструмент. Ценность создаётся на стыке ИИ и вашей экспертизы, креативности
- Получайте удовольствие от перемен — в эпоху, когда за полгода меняется всё, любопытство — главный навык
Источники
- Gartner. "Worldwide AI Spending Will Total $1.5 Trillion in 2025." Gartner Newsroom, September 2025. / Fortune Business Insights. "Artificial Intelligence Market Report." 2025.
- "DeepSeek R1: Open-source reasoning model." DeepSeek API Docs, January 20, 2025. / Market impact reported by multiple financial outlets, January 27, 2025.
- "Japan adopts first AI basic plan with 1 trillion yen investment." Nikkei, December 2025. / "Japan AI Basic Plan." AI Strategy Headquarters, December 2025.
Полезные ссылки:
- Hugging Face Models — хаб моделей ИИ с открытым кодом
- LM Arena — рейтинг и сравнение ИИ-моделей
Поздравляем — вы прошли все 6 глав!
Вы получили систематические знания от основ ИИ до последних трендов. ИИ развивается каждый день. Используйте полученную базу как фундамент, пробуйте инструменты на практике и следите за новостями.