Год ИИ: как ChatGPT, Gemini, Apple Intelligence и другие изменили всё в 2024 году
Важный год для искусственного интеллекта
Год назад иногда казалось, что ИИ каким-то образом распространился повсюду, но это было лишь предвестником того, как ИИ ворвался в жизнь людей, к добру или к худу.
Потребовалась бы целая серия книг, чтобы описать каждое революционное обновление, эффектный запуск и досадную ошибку, допущенную крупнейшими брендами в сфере ИИ: OpenAI ChatGPT, Google Gemini и Apple Intelligence, не говоря уже о каждом отдельном разработчике ИИ.
Тем не менее, есть несколько ключевых моментов, о которых стоит помнить, прежде чем 2025 год снова изменит ситуацию.
Бесконечные обновления ChatGPT
Трудно говорить об искусственном интеллекте в 2024 году, не упоминая ChatGPT. OpenAI, похоже, намерен оставаться в центре внимания, выпуская одно революционное обновление за другим.
В мае с выходом GPT-4o, за которым последовал более компактный GPT-4o, началась мультимодальная эволюция ChatGPT, позволяющая обрабатывать текст, изображения, аудио и видео. В декабре вышла модель o1, которая обеспечила новый уровень мышления с более точными и глубокими ответами. Она оказалась бесценным инструментом для решения любых задач — от программирования до творческого мозгового штурма.
Расширенный голосовой режим ChatGPT добавил в ChatGPT новые голосовые функции с целым рядом реалистичных голосов, включая Санта-Клауса. Если вы не разговаривали через приложение, OpenAI даже создала бесплатную горячую линию 1-800-CHATGPT, по которой можно звонить и общаться с ChatGPT.
Кинорежиссёры большую часть года с нетерпением ждали появления Sora, модели OpenAI, преобразующей текст в видео. Хотя она только недавно стала доступна непрофессиональным кинорежиссёрам, способность Sora создавать анимационные видео теперь доступна творческим людям или маркетологам, работающим в сжатые сроки.
Творческая коллаборация также стала основой для режима «Холст» в ChatGPT, который позволяет в режиме реального времени совместно работать с ИИ, редактируя и дорабатывая проекты параллельно. Чтобы всё было под контролем, OpenAI также выпустила функцию «Проекты», которая группирует диалоги и файлы в аккуратные папки. А расширенная функция поиска в ChatGPT помогает поддерживать актуальность и точность всей этой информации.
В довершение всего, OpenAI завершил год праздничным мероприятием «12 дней OpenAI», выпустив ежедневные обновления, такие как интеграция с WhatsApp, новый уровень ChatGPT Pro за 200 долларов в месяц и предварительный просмотр будущей модели O3 для чат-бота. Вероятно, это помогло отвлечься от многочасового сбоя в декабре, вызванного поломкой центра обработки данных Microsoft. Возможно, масштабы возмущения не были хорошим пиар-ходом, но они, несомненно, показали, насколько ChatGPT распространился с начала 2024 года.
Рывок Google Gemini
В конце 2024 года Google Gemini ещё даже не существовало. Только в феврале Bard стал Gemini, и этот ребрендинг был частью годичных усилий Google по опережению OpenAI за счёт интеграции ИИ во всё, что он делает. Новое блестящее приложение Gemini для Android и премиум-подписка Gemini Advanced сразу же начали конкурировать с ChatGPT, и вскоре последовали обновления.
К маю Google выпустила Gemini 1.5 — обновлённую версию с более высокой вычислительной мощностью и расширенным контекстным окном, что сделало её более интеллектуальной и способной лучше понимать сложные запросы. Но настоящее волшебство началось летом, когда интеллект Gemini появился в устройствах Google Home и заменил Google Assistant во многих местах.
Кульминацией этого стало появление в сентябре Gemini Live — функции, которая позволяет вести голосовые разговоры с ИИ в режиме реального времени. Соревнование с ChatGPT продолжилось с помощью пользовательских чат-ботов под названием Gems, а месяц спустя появилось приложение для iPhone с интеграцией в другие приложения Google на iOS.
Грандиозный финал наступил в декабре с выходом Gemini 2.0 — масштабного обновления с улучшенными и более быстрыми откликами, анализом фотографий и многим другим. Не говоря уже о том, что многие эксклюзивные функции для телефонов Google Pixel обеспечивают более тесную связь с остальной экосистемой Google.
Apple Intelligence наконец-то созрел
Слухи о планах Apple в отношении ИИ ходили годами, но в 2024 году Apple Intelligence наконец-то дебютировала. Эта инициатива казалась одновременно неизбежной и уникальной для Apple, когда она была представлена на WWDC в июне.
Дизайн определённо был от Apple, но заметна интеграция с существующими моделями ИИ. В частности, Apple позволит своему обновлённому голосовому помощнику Siri использовать ChatGPT для ответов и различных запросов. Мы также всё ещё ждём обещанной Siri возможности просматривать, понимать и выполнять задачи в приложениях.
Несмотря на другой бренд, инструменты Apple с искусственным интеллектом, похоже, в основном нацелены на то, чтобы соответствовать функциям OpenAI и Google или превосходить их. Например, Apple Intelligence используется в приложении для создания изображений Image Playground, а также в Genmoji, которое позволяет создавать собственные эмодзи.
Самым заметным аспектом, вероятно, является то, что Apple Intelligence в основном использует оборудование Apple для запуска процессов ИИ локально или на сверхзащищённых серверах Private Cloud Compute. Таким образом, Apple Intelligence может работать быстрее и обеспечивать большую конфиденциальность.
Meta и взлет и падение аппаратного обеспечения
В то время как OpenAI, Google и Apple доминировали в заголовках новостей, ИИ оказал гораздо более широкое влияние благодаря другим крупным брендам. Например, Meta (признана экстремистской организацией и запрещена в России) представила виртуального помощника Meta AI, встроив его в Facebook, Instagram и WhatsApp, а также обновляя и расширяя его возможности (включая голоса некоторых знаменитостей) в течение года. Meta также сделала следующий год годом умных очков с ИИ, встроив Meta AI в гарнитуры Meta Quest, а также в умные очки Meta Ray-Ban. О, а кто мог забыть презентацию прототипа очков дополненной реальности Orion?
Однако не все устройства с искусственным интеллектом в этом году оказались такими же успешными. В начале года ажиотаж вокруг таких устройств, как Rabbit R1, небольших устройств с искусственным интеллектом, и носимых устройств, таких как Humane AI Pin и Plaud NotePin, был очень высок, но с тех пор они быстро утратили популярность и могут стать успешными только в качестве нишевых продуктов.
Если 2024 год что-то и доказал, так это то, что искусственный интеллект официально перерос свою блестящую новую технологическую фазу и ворвался в нашу жизнь как полномасштабная революция. ChatGPT, Gemini, Apple Intelligence и их конкуренты показали, что инструменты ИИ могут поражать воображение и даже быть по-настоящему полезными при правильном использовании.
Это не значит, что в 2025 году не будет ошибок и недоработок, но это, безусловно, говорит о том, что ИИ станет неотъемлемой частью многих цифровых процессов на определённом уровне, будь то вечер игр с друзьями, развлечение и обучение детей или составление рациона и планов приготовления блюд. В этом году мы увидели, на что способен ИИ; в следующем году вопрос будет заключаться в том, какие из этих возможностей мы действительно хотим, чтобы ИИ выполнял за нас.