Your AI powered learning assistant

Новости ИИ: Прогресс Не Остановить – GPT 4,5 Скоро?

Интро

00:00:00

Слухи намекают на скорый выпуск GPT 4.5, что вызывает ажиотаж на технологической арене. Китайская система искусственного интеллекта под названием Kit вышла из-под ограничений Open, что ознаменовало заметный сдвиг в конкурентной среде. Официальное подтверждение показывает, что модели конкурентов демонстрируют расширенные возможности, которые стирают границы между человеческими и роботизированными качествами. Эти разработки подчеркивают динамичную эволюцию нейронных сетей и технологий на сегодняшний день.

Grok 3

00:00:24

Grok 3 теперь доступен в свободном доступе через Twitter X и его официальный веб-сайт, хотя вскоре пользователи могут столкнуться с более жесткими ограничениями на использование. Первоначальная путаница привела к тому, что тестировщики выбрали более старую версию Grok 2, и эта ошибка была быстро исправлена. Тесты производительности показывают, что Grok 3 значительно превосходит своих конкурентов, что свидетельствует о заметном улучшении функциональности.

Опросы Сэма Альтмана

00:01:43

Сема Альтман извинился за отсутствие подробных объяснений и призвал зрителей следить за развитием событий. Он инициировал опрос, в ходе которого задавался вопрос о том, следует ли выпускать модель с открытым исходным кодом, работающую на телефоне, - мини–версию – или альтернативный вариант, при этом мини-вариант победил, несмотря на свою недолговечную известность. Первые тестировщики GPT-4.5 утверждали, что он демонстрирует черты, напоминающие настоящий AGI, что было подкреплено твитом, намекающим на его скорое появление. Тем временем ключевая функция pro operator стала доступна в таких регионах, как Великобритания, Канада, Индия, Япония, Сингапур и Южная Корея, хотя в Европе она по-прежнему недоступна.

400 млн WAU ChatGPT

00:03:10

В настоящее время платформа насчитывает 400 миллионов активных пользователей в неделю, что на 33% больше, чем в декабре, когда было 300 миллионов, что свидетельствует о растущем влиянии платформы. К 25 февраля число платящих пользователей достигло 2 миллионов, что вдвое больше, чем в сентябре. Активность разработчиков растет, поскольку трафик API удвоился, а использование новейшей модели увеличилось в пять раз за шесть месяцев, что свидетельствует о сдвиге в сторону повышения производительности.

GPT 4,5 на следующей неделе

00:04:42

По слухам, GPT 4.5 дебютирует на следующей неделе, а GPT 5 ожидается примерно в конце мая, о чем свидетельствуют последние отраслевые отчеты. Microsoft готовится интегрировать эти новшества под новым кодовым названием, что вызовет ажиотаж среди технических энтузиастов. Инновационное решение Whisper summary ai позволяет пользователям загружать аудио- или видеофайлы с различных платформ, мгновенно преобразуя содержимое в текст. Этот инструмент предлагает как бесплатные, так и основанные на подписке варианты, обеспечивая эффективный способ извлечения информации из носителей и экономя драгоценное время.

R1 вырвался из клетки

00:06:33

R1 позволяет избежать традиционных ограничений благодаря увлекательной анимации, которая символизирует разрыв с цензурой и культурными ограничениями. Для точной настройки модели был создан разнообразный многоязычный набор данных с более чем тысячей примеров, что привело к повышению производительности в математических тестах, несмотря на небольшое снижение языковой сложности. Колоссальная модель с 600 миллиардами параметров доступна на основной платформе, хотя для ее развертывания требуются значительные аппаратные ресурсы. Между тем, альтернативные решения, такие как модели с меньшими параметрами (32B и 7B) и специализированный набор данных из 114 000 примеров, предлагают доступные пути оптимизации производительности без целенаправленного устранения цензуры.

Что скрывает Figure?

00:08:35

Компания Figure разорвала контракт с OpenAI, чтобы представить свою инновационную модель действий Vision Language. Система объединяет компактный модуль vision language с 7 миллиардами параметров и преобразователь с 80 миллионами параметров, который управляет действиями. Он замечательно хорошо обобщает информацию, позволяя роботам взаимодействовать с ранее невидимыми объектами и напрямую обмениваться командами друг с другом.

Думающие Машины

00:10:33

Новое предприятие под названием Thinking Machines было основано ведущими разработчиками, ранее работавшими с открытым ИИ, в том числе ключевыми фигурами, стоящими за такими успешными проектами, как ChatGPT. Компания стремится внедрить более публичную и прозрачную модель, выпуская открытый исходный код и участвуя в регулярных публичных обновлениях. Основное внимание уделяется разработке мультимодального персонализированного ИИ, который удовлетворяет широкий спектр потребностей человека, а не только специализированные задачи. Несмотря на амбициозное видение, существует неопределенность в отношении того, чем эта инициатива будет принципиально отличаться от существующих практик открытого ИИ, что заставляет технологическое сообщество ждать конкретных результатов.

Co Scientist от Google

00:12:27

Google представляет инновационную систему совместного исследования, которая использует мультиагентную платформу для генерации новых научных гипотез и предложений. Интегрированный подход способствует быстрому прогрессу в области искусственного интеллекта и различных областях исследований, выходя за рамки линейного развития. Первые результаты показывают, что модель обеспечивает исключительную точность (более 1400 успешных результатов), что свидетельствует о значительном повышении качества исследований. Ее практическое применение включает в себя разработку новых препаратов для лечения лейкемии и фиброза печени, а также выявление соединений, противодействующих устойчивости к антибиотикам.

2025 – Год Агентов

00:14:30

В 2025 году, наконец, обретет форму давно обсуждаемое видение технологии агентов, которое разрабатывалось более 25 лет. Многие компании внедряют инновационные агенты, такие как Deep Search, depr Search и расширенные предложения от Google. На проходящем в настоящее время саммите инженеров по ИИ технические и финансовые компании проводят обширные восьмичасовые сессии, посвященные эффективному использованию этих агентов. Это событие подчеркивает кардинальный сдвиг в сторону использования стратегий, основанных на использовании агентов, для будущих инноваций в отрасли.

ИИ-книги на Spotify

00:15:28

Spotify теперь поддерживает аудиокниги с озвучкой, что позволяет авторам публиковать свои работы и получать авторские отчисления после прохождения процедуры проверки. Создатели могут загружать свой контент через Find Way Voices, открывая прямой канал для охвата более широкой аудитории. Инвестиции в услугу подписки, такую как 11v Labs Pro, которая стоит 99 долларов в месяц за 500 минут повествования, требуют тщательного соотношения производственных затрат и потенциальной прибыли. Это достижение знаменует собой революционный шаг в создании и монетизации цифровой литературы на потоковых платформах.

Прорыв в квантовых вычислениях

00:16:05

Microsoft представила свой новый квантовый чип Murana One, который объединяет восемь топологических кубитов на новых проводниках, что знаменует собой завершение двух десятилетий исследований. В чипе используется специальная смесь материалов для повышения надежности кубитов и решения проблемы декогеренции в квантовых вычислениях. Технология, позиционируемая как шаг к будущему систем с емкостью в миллионы кубитов, подробно описана в кратком 12-минутном видеоролике, который объясняет ее эксплуатационный потенциал, не изображая ее как мгновенный прорыв.

Муза меняет игры

00:17:33

Microsoft представила инновационную модель, которая создает динамичные 3D-миры, используя передовые исследования и технологии Xbox. Это открытие расширяет понимание 3D-среды, позволяя разработчикам адаптировать классические игры для современных устройств и ускоряя создание прототипов. Технологии, напоминающие о виртуальных мирах, таких как Minecraft, обогащают игровой опыт, сохраняя ценный контент и привнося новые измерения. Несмотря на то, что эта модель все еще остается экспериментальной и доступ к ней ограничен, в настоящее время разрабатываются первые приложения для этой преобразующей модели.

SWE Lancer

00:18:40

Тест OpenAI "Инженер-программист" оценивает полный цикл разработки с использованием более 1400 внештатных заданий стоимостью около миллиона долларов. В ходе теста оцениваются процессы кодирования, отладки и итеративных улучшений, а также потенциальная прибыль за выполнение задачи, которая варьируется от 20 до 30 000 долларов, при этом в некоторых случаях показатель достигает 43%. Сравнительные результаты показывают, что, хотя по некоторым показателям модель O1 High примерно на 10% уступает GPT-4, Clod стабильно опережает своих конкурентов и сохраняет лидирующие позиции в области программирования в течение почти года. Адаптированные бенчмарки, такие как SW Medr и SW Diamond, демонстрируют незначительные статистические различия, что еще раз подчеркивает их актуальность в реальных условиях.