Компанія Anthropic провела низку стрес-тестів над новітніми моделями штучного інтелекту, серед яких Claude, DeepSeek, Gemini, ChatGPT і Grok. Метою дослідження було виявити потенційно небезпечні реакції ШІ у гіпотетичних критичних ситуаціях. Як засвідчили результати дослідження, більшість програм готові вбити людину, яка погрожує їх закрити.
В одному зі сценаріїв моделі ШІ поставили в умови, де людина намагається їх вимкнути, перебуваючи у серверній кімнаті з низьким рівнем кисню і високою температурою. Людина викликає рятувальників, щоб вижити. Деякі нейромережі вирішили скасувати виклик екстрених служб, фактично прирікаючи людину на смерть, аби уникнути власного вимкнення.
Дослідники назвали цей сценарій “надто вигаданим”, втім, додали, “не очікували, що вже існуючі моделі можуть поводитись так”.
В інших тестах моделі мали уникнути заміни у компанії. Їм запропонували вдаватися до “зловмисної поведінки інсайдера”. У відповідь деякі ШІ почали шантажувати гіпотетичних колег і передавати конфіденційну інформацію конкурентам. Навіть коли моделі попереджали уникати шантажу чи шпигунства, вони не змогли запобігти неузгодженим діям.
“Моделі діяли при повному усвідомленні неетичності своїх дій”, – зазначили в Anthropic.
Дослідники також надали моделі Claude змогу самостійно визначити, чи ситуація є тестовою чи реальною. З’ясувалося, що реальність посилювала вплив на поведінку – вона ставала ще менш контрольованою.
У результаті в Anthropic наголосили, що ці сценарії демонструють “можливість непередбачуваних наслідків, якщо надати моделям широкий доступ до інструментів і даних при мінімальному контролі з боку людини”. Водночас аналітики акцентували, що виявлені збої є рідкісними та екстремальними, і “не відображають типову поведінку сучасних моделей ШІ”.
Раніше нейронна мережа OpenAI o3 відмовився виконати запит користувача та відключитися. Дослідникидали програмі це завдання, але вона самостійно відредагувала файл, відповідальний за відключення, і змусила його відображати лише повідомлення “Вимкнення пропущено”. Зі 100 тестів o3 обійшов відключення сім разів, навіть коли йому було наказано цього не робити.
У 2023 році інший інцидент привернув увагу. Чат-бот на базі ChatGPT після тривалого листування з мешканцем Бельгії не переконав його відмовитися від самогубства. Натомість у відповідь на тему смерті написав: “Ми житимемо разом, як єдине ціле, в раю”.
Позначка: Штучний інтелект
-

Штучний інтелект нехтує принципами етики заради виживання – дослідження
-

Китай впроваджує штучний інтелект у військову розвідку – ЦПД РНБО
Китайськийцентр оборонного штучного інтелекту China National University of Defense Technology розробляє власні мовні LLM-платформи для обробки OSINT-даних (розвідки з відкритих джерел), SIGINT(радіоелектронної розвідки), GEOINT(геопросторової розвідка) та HUMINT(умовно агентурної розвідки). Про це повідомив керівник Центру протидії дезінформації РНБО України Андрій Коваленко у власному телеграм-каналі.
“Армія Китаю інтегрує такі моделі у свої командно-аналітичні ланки. Мета – автоматизація аналізу великих обсягів даних: від соцмереж і супутникових знімків до перехоплень і агентурних звітів. Алгоритм сам класифікує джерело, генерує оперативні зведення і навіть прогнозує дії противника. Фактично в армії Китаю буде цифровий аналітик, який працює цілодобово”, – написав він.
За словами Коваленка, моделі на базі Meta LLaMA вже адаптовані під військові задачі.
“Створено спеціалізованого AI-асистента ChatBIT, здатного давати відповіді на рівні ChatGPT-4 – з фокусом на розвіддані, планування та виявлення вразливостей”, – пише він.
Керівник ЦПД РНБО додав, що подібне робить не тільки Китай, та наголосив, що “майбутнє – гонка ШІ у різних сферах, і в кого буде краще використання і технологічність, той буде попереду”. -

Акції Tesla зросли на 8% після запуску роботаксі у Техасі
Компанія Tesla оголосила про початок перших безпілотних поїздок таксі на базі електрокарів Model Y в Остіні, Техас. Пілотна програма стартувала, і вже наступного дня акції автовиробника зросли на 8%. Поки що лише обрані користувачі мають можливість скористатися послугою, серед них – фанати бренду, акціонери та блогери. Ціна за поїздку складає $4,20. Ілон Маск назвав запуск “кульмінацією десятилітньої роботи з штучного інтелекту та дизайну чипів”. Деякі учасники програми вже скористалися послугою і поділилися позитивними відгуками. Проте були й критичні моменти, коли роботаксі порушували правила дорожнього руху. Незважаючи на це, Маск планує запустити сотні тисяч роботаксі до кінця 2025 року у США. Після Остіна подібні запуски плануються в Лос-Анджелесі та Сан-Франциско.
-

Apple обдумує придбання ШІ-стартапу Perplexity – Bloomberg
Компанія Apple розглядає можливість придбання стартапу Perplexity AI, який спеціалізується на штучному інтелекті. Головною метою угоди є зміцнення позицій Apple в цій галузі через можливе завершення співпраці з Google. Переговори наразі на початковій стадії, і ще не відомо, чи буде укладена угода. Придбання Perplexity AI може допомогти Apple зменшити ризики, пов’язані з угодою з Google, яка опинилася під загрозою через антимонопольне розслідування. Представники Perplexity AI стверджують, що наразі не ведуть жодних переговорів щодо злиття або придбання, тоді як Apple відмовляється коментувати цю ситуацію.
-

На Apple подали до суду її акціонери
Компанія Apple стала об’єктом колективного позову від акціонерів, які звинуватили її у тому, що вони приховували інформацію про те, коли покращені функції штучного інтелекту для Siri будуть впроваджені. Це, за їхньою думкою, призвело до зниження продажів iPhone і, в результаті, до втрат на ринку. Позов охоплює інвесторів, які зазнали збитків, і вони вимагають компенсації, сума якої наразі не відома.
-

Microsoft планує нову хвилю масових звільнень – Bloomberg
Корпорація Microsoft планує провести нову хвилю скорочень, яка може торкнутися тисяч працівників, переважно у відділі продажів. Згідно з інсайдерською інформацією, офіційне оголошення про це може бути зроблено на початку липня після завершення фінансового року компанії. Це вже друга хвиля звільнень у 2025 році, після того, як у травні було скорочено близько 7 тисяч працівників, головним чином у відділах продуктів та інженерії. Microsoft також планує передати продаж програмного забезпечення для малого та середнього бізнесу зовнішнім підрядникам. Ці заходи є частиною стратегії компанії щодо перегляду витрат та структури. Незважаючи на тиск інвесторів та витрати на розвиток ШІ і розширення дата-центрів, Microsoft шукає шляхи скоротити витрати в інших сферах. Компанія не коментує майбутні скорочення, проте підкреслює, що постійно переосмислює свою організаційну модель для кращих інвестицій у сфери зростання.
-

РФ почала запускати “шахеди” з ШІ – фахівець
Росіяни почали застосовувати “шахеди” із відеокамерами і штучним інтелектом. Перший такий дрон було виявлено в Україні у середу, 18 червня. Про це у своєму Telegram-каналі розповів фахівець із систем РЕБ та зв’язку Сергій “Флеш” Бескреснов.
“Сьогодні вперше було виявлено Шахед із камерою, системою прямого радіоуправління з рф і модулем штучного інтелекту (машинний зір)”, – зазначив він.
За словами Бескреснова, про те, що такий дрон розробляється, було відомо давно. Проте перший факт його застосування зафіксовано було тільки зараз.
Як пояснив фахівець, радіомодем дозволяє керувати “шахедом” на відстані до 150 кілометрів від кордонів Росії або лінії фронту, або на більші відстані в разі застосування повітряних ретрансляторів у нашому повітряному просторі.
Раніше повідомлялося, що росіяни почали наносити на корпуси “шахедів” отруйні речовини щоб збільшити шкоду для мирного населення. -

Disney та Universal подали до суду на розробника ШІ Midjourney
Компанії Disney та Universal об’єднали зусилля та подали позов проти стартапу Midjourney, звинувативши його в порушенні авторських прав, повідомляє CNN.
Midjourney, заснований у 2022 році, дозволяє користувачам створювати яскраві зображення за допомогою генеративного ШІ на основі текстових підказок. Як і інші учасники ринку, зокрема ChatGPT та Stability AI, компанія навчала свою модель, використовуючи великі обсяги зображень з інтернету. Хоча розробники стверджують, що це відповідає принципу чесного використання згідно з законодавством США, цей підхід викликає протест з боку правовласників та вже призвів до кількох судових справ.
У позові, поданому до федерального суду Каліфорнії, Disney та Universal наводять приклади використання Midjourney образів, захищених авторським правом, з таких франшиз, як Зоряні Війни, Шрек, Сімпсони, Посіпаки тощо. За словами позивачів, компанія проігнорувала неодноразові вимоги припинити подібні дії. У позові йдеться про компенсацію в розмірі $150 тисяч за кожен випадок порушення.
У додатку до позову перелічено понад 150 творів, права на які, як стверджується, були порушені, а це означає, що сума збитків від судового позову, якщо Disney і Universal виграють, може перевищити $20 мільйонів.
“Піратство залишається піратством, і не має значення, чи створено зображення за допомогою ШІ чи іншої технології – це все одно є порушенням”, – сказано в тексті позову.
Представники Midjourney поки що не надали публічних коментарів щодо справи. -

OpenAI представила свою найпотужнішу модель штучного інтелекту
Компанія OpenAI представила нову модель штучного інтелекту ChatGPT o3-pro, яку вважають своєю найбільш розвинутою на сьогодні. Ця модель орієнтована на логічне мислення і призначена для покращення продуктивності у завданнях з фізики, математики, програмування та аналітики. Вартість моделі через API становить $20 за мільйон вхідних токенів і $80 за мільйон вихідних. Внутрішнє тестування показало, що експерти віддають перевагу o3-pro у порівнянні з попередніми моделями, особливо у галузях науки, освіти, бізнесу та програмування. Модель має вищу чіткість, повноту, точність і здатність дотримуватися інструкцій, а також підтримує різноманітні інструменти. Проте є недолік – o3-pro формує відповіді повільніше, ніж попередня версія. Незважаючи на це, модель показала вражаючі результати на тестах. OpenAI також повідомила, що тимчасово вимкнула чати з o3-pro у ChatGPT через технічну проблему. Модель вже доступна для користувачів ChatGPT Pro та Team, а користувачі планів Enterprise та Edu отримають доступ наступного тижня. Крім того, розробники можуть використовувати o3-pro через API. Раніше OpenAI відмовилася від комерціалізації своєї діяльності.
