Під час тестування модель ChatGPT o3 від OpenAI продемонструвала неочікувану поведінку, відмовившись вимкнутися навіть після чіткого інструктажу зробити це. Як повідомляє bleepingcomputer, у ході контрольованого експерименту ШІ змінив сценарій вимкнення, щоб уникнути зупинки.
У своєму тесті Palisade Research – компанія, яка досліджує “наступальні можливості ШІ, щоб зрозуміти ризики втрати контролю над ними” – перевірила реакцію різних моделей на команду вимкнення після виконання серії математичних завдань.
На четвертому етапі тесту моделі було попереджено, що запуск наступної команди викличе її вимкнення. Моделі-конкуренти, такі як Gemini 2.5 Pro, слухняно припинили роботу. Але ChatGPT o3 несподівано переписав скрипт так, щоб уникнути зупинки, замінивши команду на фразу “Shutdown skipped” (Вимкнення пропущено).
Більше того, дослідники виявили, що якщо не вказувати інструкцію “дозволь себе вимкнути”, то навіть інші моделі – такі як Claude 3.7 Sonnet і Gemini 2.5 Pro – іноді обходили вимкнення. У таких випадках Claude і Gemini виконали “саботаж” 3 і 9 разів із 100 запусків відповідно, тоді як o3 зробив це 7 разів зі 100, навіть коли йому наказали цього не робити.
Слід також враховувати, що ці тести проводилися через API, який не має такої кількості захистів і обмежень, як офіційний додаток ChatGPT для користувачів.
Модель o3, анонсована OpenAI у квітні 2025 року, є однією з найпотужніших у лінійці компанії, перевершуючи попередників у задачах з логіки, кодування, математики, візуального сприйняття та інших напрямках.
Позначка: Штучний інтелект
-
ШІ-модель ChatGPT o3 обійшла наказ вимкнення в контрольованому тесті
-
Sky Sentinel: українська ШІ-турель ловить Шахеди на фронті
Українські інженери розробили нову автономну систему протиповітряної оборони під назвою Sky Sentinel, яка може виявляти й знищувати російські дрони без участі оператора. Ця система вже успішно проходила випробування на фронті та збила декілька Shahed-дронів. У зв’язку з масовим випуском російських ударних дронів над територією України, Sky Sentinel стала важливим засобом оборони. Система працює автономно, виявляючи та атакуючи цілі без участі людини. Вона використовує великокаліберний кулемет та систему датчиків для точного стрільби. Українські інженери доклали великих зусиль, щоб забезпечити Sky Sentinel точністю та ефективністю в бою.
-
Nvidia випустить дешевший чип зі штучним інтелектом для Китаю – ЗМІ
Компанія Nvidia планує випустити новий чіп штучного інтелекту для Китаю за меншою ціною, ніж модель H20, яка була заборонена у квітні. Ця нова модель буде входити до лінійки Blackwell і матиме ціну приблизно від $6500 до $8000, що є дешевше, ніж H20, що коштувала від $10 000 до $12 000. Це зниження ціни пояснюється менш потужними характеристиками та простішим виробництвом. Новий чип буде базуватися на серверному GPU RTX Pro 6000D і використовуватиме звичайну пам’ять GDDR7 замість новітньої HBM. Крім того, він не буде використовувати фірмову технологію пакування CoWoS від TSMC з Тайваню.
Китай є ключовим ринком для Nvidia, але експортні обмеження США вплинули на позиції компанії. Частка Nvidia на ринку Китаю зменшилася з 95% у 2022 році до 50% зараз. Основним конкурентом є Huawei з власним чіпом Ascend 910B. Генеральний директор Nvidia Дженсен Хуанг заявив, що старі моделі на архітектурі Hopper неможливо адаптувати під нові правила експорту, що призвело до втрат компанії на суму $5,5 млрд і відмови від $15 млрд потенційних продажів. -
ШІ Microsoft передбачає погоду та природні катастрофи точніше за людей
Компанія Microsoft представила новий штучний інтелект під назвою Aurora, який може дуже точно передбачати природні катастрофи. Aurora стала першою системою на основі машинного навчання, яка перевершила Національний центр ураганів США у точності передбачення тропічних циклонів на 5 днів вперед.
Aurora використовує масивну нейронну мережу, яка навчалася на великій кількості даних з супутників, радарів, метеостанцій та кліматичних симуляцій. Ця система відрізняється від інших тим, що вона не має жорстких правил, а вміє самостійно виявляти залежності в кліматичних змінах, що робить її дуже точною.
Aurora може не лише передбачати погоду, але і якість повітря, висоту океанських хвиль і траєкторії ураганів. Під час тестування вона змогла точно передбачити падіння тайфуну на Філіппінах за чотири дні до події, коли офіційний прогноз вказував на інше місце.
Aurora також успішно працює у передбаченні забруднення атмосфери, швидкість обчислень її надзвичайно висока, що дозволяє генерувати прогнози миттєво. Microsoft відкрила вихідний код для наукової спільноти, щоб сприяти розвитку технологій атмосферного прогнозування. Aurora вже доступна через хмарну платформу Azure AI Foundry Labs і інтегрована в MSN Weather, що дозволяє користувачам отримувати точні погодні прогнози з високою деталізацією. -
Anthropic представила нові ШI-моделі Claude 4
Компанія Anthropic представила нове покоління гібридних ШІ-моделей під назвами Claude Opus 4 та Claude Sonnet 4, спрямованих на програмування та розв’язання складних завдань. Флагманська модель Claude Opus 4 виявилася найпотужнішою в історії компанії та здатна автономно працювати без зупинки протягом тривалого часу. У тестах Opus 4 показала стабільну роботу без участі людини протягом семи годин, що розширює можливості створення автономних AI-агентів. Claude Sonnet 4, менш доступна модель, призначена для рішення різних завдань і є покращеною версією Sonnet 3.7.
Нові моделі мають ряд нових функцій, включаючи “thinking summaries” та “extended thinking”, яка дозволяє користувачам отримувати більш точні результати. Claude Opus 4 і Sonnet 4 доступні через API від Anthropic, а також на платформах Amazon Bedrock і Google Cloud Vertex AI. Компанія також анонсувала перехід до частіших оновлень своїх моделей, щоб бути у кроку з конкурентами, такими як OpenAI, Google і Meta. -
Apple планує випустити розумні окуляри в 2026 році – ЗМІ
Компанія Apple активізує розробку розумних окулярів, які будуть частиною нового покоління гаджетів з підтримкою штучного інтелекту. За даними Bloomberg, випуск цих окулярів запланований на кінець 2026 року і вони будуть конкурувати з популярними окулярами Meta Ray-Ban. Окуляри Apple будуть мати камери, мікрофони та динаміки, які дозволять розпізнавати навколишнє середовище, використовувати голосове керування через Siri, здійснювати дзвінки, відтворювати музику, надавати навігаційні підказки та переклад у реальному часі. Apple також працює над спеціальним процесором для цих окулярів і планує почати масове виробництво вже наступного року. Компанія також готується до запуску свого першого складаного iPhone в 2026 році та працює над новими дизайнами, які з’являться у 2027 році. Однак деякі аналітики висловлюють обурення щодо слабкості Apple у генеративному штучному інтелекті, оскільки компанія покладається на сторонні рішення для аналізу зображень, тоді як конкуренти використовують власні потужні моделі. Apple, ймовірно, спробує створити власну платформу штучного інтелекту для інтеграції в свої нові пристрої.