Your AI powered learning assistant

Новости ИИ: OpenAI выпускает o3-mini – Ответ На DeepSeek r1?

Интро

00:00:00

За первый месяц 2025 года появилось столько обновлений, что кажется, будто их хватило на целый год. В новостях компании рассказывается о значительных достижениях как в области креативности человека, так и в области инноваций в области робототехники. Все важные еженедельные достижения собраны в краткую сводку, которая отражает стремительный прогресс.

загадка DeepSeek

00:00:19

Инновационная модель искусственного интеллекта обеспечивает непревзойденную ценность Инновационная модель искусственного интеллекта переопределяет отраслевые стандарты, предлагая высокое качество при минимальных затратах. Впечатляющие показатели производительности и демонстрация возможностей установки на месте подчеркивают стратегический сдвиг в обучении модели, делая акцент на эффективности, а не на масштабе. Это новшество вызвало интерес в научном сообществе и на рынке, создав новое ценностное предложение в области разработки искусственного интеллекта.

Экономически эффективные сбои в работе вызывают споры на рынке и во всем мире Инвесторы резко отреагировали на это, поскольку модель, как сообщается, обучала ведущую систему с использованием минимального количества устаревшего оборудования и ресурсов, что привело к значительному падению рыночной стоимости крупного технологического гиганта. Это достижение, достигнутое при использовании всего 2000 старых графических процессоров и скромном бюджете, стало настоящим прорывом, который бросил вызов устоявшимся подходам. Этот экономически эффективный прорыв вызвал широкое обсуждение и требует разработки более гибких и ресурсосберегающих инвестиционных стратегий в сфере технологий.

DeepSeek врет?

00:03:20

DeepSeek обвиняется в использовании методов дистилляции по модели с открытым исходным кодом, однако первоначальные разработчики не предприняли никаких юридических действий. Анализ финансовых и аппаратных данных позволяет предположить, что затраты на обучение могут быть значительно выше заявленных, что, вероятно, связано с экспортными ограничениями Китая на передовые чипы. Публичная информация намекает на закупку 50 000 чипов NVIDIA H100 через непрямые каналы, такие как Сингапур, что делает стоимость еще более загадочной. Несмотря на разногласия, модель выделяется как впечатляющая инновация с открытым исходным кодом из Китая.

Ход за OpenAI – o3 mini

00:05:21

Сравнительный бенчмаркинг: Время вывода определяет эффективность модели С выпуском модели O3 Mini появились заметные обновления, обеспечивающие локальное развертывание и бесплатный доступ для пользователей. В тестовых оценках Rimini Medium находится на одном уровне с O1, в то время как вариант O3 Mini Low превосходит O1 Mini, но не достигает полной мощности O1; его производительность определяется различным временем вывода (низкое, среднее, высокое). Программирование и математические тесты показали, что 3 мини-версии с высокими и средними настройками являются лучшими в строгих оценках. Сторонние оценки также указывают на то, что некоторые недорогие модели могут быть менее эффективными по сравнению с вариантами более высокого уровня, такими как 3.5 и O1 Pro.

Расширенный доступ по подписке и интегрированные расширенные инструменты Новые планы подписки, включая тариф ULTRA Elite, открывают неограниченный доступ к набору из более чем 70 инструментов, предлагая гибкие возможности логического вывода даже пользователям ChatGPT Plus. Базовая подписка стоимостью от 790 рублей обеспечивает неограниченное использование O3 Mini High, что отличает ее от существующих премиум-сервисов. Расширенные возможности теперь включают расширенную обработку видео с помощью minimax и Runway, а также обновленные функциональные возможности, такие как Lips для элементов в версии 1.6. Несмотря на временные ограничения на платформах, таких как R1, из-за высокой нагрузки, предоставленные ссылки позволяют пользователям легко ознакомиться с этими передовыми возможностями.

Игра с высокими ставками

00:09:05

Приглашение попробовать Sinks с высокими ставками демонстрирует лучшие нейронные сети с различными возможностями. Поиск в ChatGPT теперь доступен для публикации контента, что значительно повышает точность результатов. Журналистские обновления на таких платформах, как X, вводят текущие данные в эти системы, создавая новую динамику в поиске информации. Компании, в том числе OpenAI, идут на огромный риск, отдавая приоритет быстрому выпуску моделей, а не строгим протоколам безопасности, фактически играя на будущее общества.

Ответы Сэма Альтмана

00:10:16

После релиза в Римини Сэм Альтман дал минимальные ответы, оставив без ответа важные вопросы, особенно о будущем GT5. В будущих продуктах O3 предусмотрены различные уровни обмена сообщениями: O3 Mini предоставляет 150 сообщений в день, O3 Mini High - 50 в неделю, а версия O3 Pro, как ожидается, будет предлагать неограниченный доступ к подробной информации о токенах. Слухи указывают на то, что модель, способная генерировать изображения, появится через несколько месяцев, параллельно с более ранними внедрениями в отрасли. Внутренние дебаты по поводу корректировки цен и стратегий с открытым исходным кодом предполагают, что нынешний подход может быть исторически неправильным, что дает надежду на более прогрессивное направление.

OpenAI и MSFT

00:11:55

Китайские конкуренты усиливают давление, что приводит к динамичным изменениям в стратегии OpenAI. Недавняя публикация Сэма Альтмана показала сильный дух товарищества между компаниями и указала на волну совместных предприятий на горизонте. OpenAI готовится к будущему, в котором Microsoft больше не будет единственным партнером по облачным сервисам, несмотря на то, что масштабные инвестиции продолжают менять отрасль.

Janus Pro от DeepSeek

00:12:28

Janus Pro от DeepSeek создает атмосферу сотрудничества между технологическими новаторами. Компания EPS представляет Yanus Pro - универсальную мультимодальную модель, доступную в версиях от 1 до 7 миллиардов параметров, которая генерирует высококачественные изображения с помощью тестовых тестов. Его производительность, превосходящая такие модели, как Open 3 и другие конкуренты, подчеркивается аналогичными достижениями китайских разработчиков.

Дарио Амодеи пишет

00:12:59

Дарио Амодей выделяет скрытую функцию интерфейса, доступную для локальной загрузки, что создает основу для более широких дискуссий о разработках в области искусственного интеллекта. Хотя на первый взгляд может показаться, что компания отстает, важные релизы указывают на то, что подготовка идет полным ходом. Он защищает политику США, утверждая, что даже при наличии парка из 50 000 различных чипов Китай сталкивается с логистическими трудностями, которые сохраняют преимущество Америки. Новая модель искусственного интеллекта, не уступающая по производительности дорогостоящим конкурентам и при этом экономически выгодная, еще раз подчеркивает, что Китай отстает от США на 6-7 месяцев, укрепляя лидерство США в области искусственного интеллекта.

Qwen 2,5 Max

00:14:15

Китайский Qwen 2.5 Max представляет собой крупномасштабную модель с архитектурой, напоминающей DeepSpeed V3, которая объединяет в себе экспертный подход для эффективной обработки миллиардов токенов. Модель улучшает свою производительность, используя более 20 триллионов токенов, благодаря сочетанию контролируемой тонкой настройки и обучения на основе обратной связи с людьми. Он предлагает конкурентоспособные цены по сравнению с известными платформами, такими как OpenAI, и предоставляет возможности, которые конкурируют с GPT-4 и GPT-3.5. Его обширная функциональность, включающая веб-поиск, генерацию изображений и синтез видео, представляет собой привлекательный вариант для пользователей, ищущих надежную альтернативу.

А что Европа?

00:15:54

Европа продолжает вкладывать значительные ресурсы, рабочую силу и усилия фабрик для поддержания производства моделей, даже решая такие проблемы, как утилизация пластиковых отходов. Новая версия искусственного интеллекта с 32 миллиардами параметров напрямую сравнивается с более крупными моделями, такими как версия с 70 миллиардами параметров и компактный GP4 Mini, демонстрируя производительность наравне со своими аналогами или немного превосходящую их. Примечательно, что модель меньшего размера использует оптимизированное лицензирование и обеспечивает задержку в 150 токенов в секунду, обеспечивая быструю и эффективную работу при локальном развертывании. Ужесточение мер по защите данных в Европе привело к удалению этих приложений из крупных итальянских магазинов и вызвало запросы со стороны ирландских и итальянских властей, что привело к надежному переходу на веб-версию.

Gemini 2.0 is COMING

00:17:22

Gemini 2.0 быстро выходит на рынок с экспериментальной моделью PRO, доступной для тестирования, что намекает на выход полной версии без использования Flash. В списках изменений и документации, которые просочились в сеть, есть краткие подробности, которые были быстро удалены, а ключевые функции остались в тайне. Этот релиз повторяет стиль неопределенных, но оптимистичных анонсов конкурентов, что заставляет ожидать более четких обновлений на следующей неделе. Энтузиазм растет по мере того, как сообщество ожидает дальнейших подтверждений и потенциальных новых режимов тестирования.