Після релізу ChatGPT-o3 від OpenAI тисячі користувачів пропонували програмі уявити, ніби вона є гравцем популярної онлайн-гри GeoGuessr і знаходити місця за фотографіями. Штучний інтелект показав непересічні здібності, виконуючи ці завдання, повідомляє TechCrunch.
Реліз нової версії відбувся 16 квітня. Вже за кілька днів англомовний сегмент соцмереж заполонили скріни із влучними відповідями ChatGPT, де він визначав місця за фотографією з меню ресторану або опудалом носорога з інтер’єру пабу. Зараз дивовижну вправність штучного інтелекту визначати координати об’єктів за світлинами відзначають як користувачі, так й експерти.
Онлайн-гра GeoGuessr з’явилася у 2013 році. Гравець має завдання почергово відвідати п’ять локацій, що можуть знаходитися будь-де у світі, де сервіс Google Street View провів фотозйомку. Користувач може «гуляти» вулицями, користуватись компасом, розглядаючи рослинність, дорожні знаки та аналізуючи погоду. Коли людина здогадується, де вона знаходиться, то ставить мітку на карті, а гра відкриває правильну геолокацію. Чим ближче мітка до справжнього місцерозташування, тим більше балів гравець отримує. Ідея гри вистрілила - вебсайт отримав сотні тисяч унікальних відвідувачів лише в перший тиждень існування і зараз теж є дуже популярним.
Ще наприкінці 2024 року ШІ-ентузіасти навчали ChatGPT грати в GeoGuessr. Програма била рекорди і проходила гру краще за топових гравців, але тоді доводилося вручну міняти код та «згодовувати» штучному інтелекту колосальну кількість даних. Зараз же будь-який користувач ChatGPT-o3, що не має ніяких особливих навичок з кодування, може дуже точно визначити геолокацію.
Точність сервісу пов’язана із новим алгоритмом візуального мислення, про який інформував OpenAI. Розробник навчив ШІ думати зображеннями: «Вперше ці моделі можуть інтегрувати зображення безпосередньо у свій ланцюг думок», — йдеться в релізі. — Люди можуть завантажити фотографію дошки, схему підручника або намальований від руки ескіз, а модель зможе інтерпретувати це, навіть якщо зображення розмите, перевернуте або низької якості».
ChatGPT-o3 отримав більше часу на роздуми та показує користувачу ланцюг своїх думок: як він дійшов до того чи іншого висновку. Розробник каже: «Наші найновіші моделі візуального мислення працюють у парі з іншими інструментами, такими як аналіз даних Python, вебпошук, генерація зображень, щоб креативно й ефективно вирішувати складніші проблеми, надаючи користувачам наш перший мультимодальний агентський досвід».
Такі суперопції можуть значно спростити роботу з інструментами OSINT (Open source intelligence — розвідка на основі відкритих даних) для журналістів-розслідувачів. Але водночас вміння ChatGPT-o3 надзвичайно точно і швидко знаходити локацію загрожує конфіденційності приватних осіб. З’ясувати домашню адресу чи місце перебування й без ChatGPT-o3 було можливо, але сервіс дозволяє витрачати на це значно менше зусиль. Тож експерти з цифрової безпеки радять не публікувати фотографії, по яких можна визначити місце, де ви живете. Також ChatGPT-o3 може порушувати законодавство країн. Наприклад, в Україні з міркувань безпеки заборонено вказувати точні адреси влучання російських ракет. У відповідь на запит від TechCrunch OpenAI запевнив, що зараз вдосконалює сервіс, щоб розпізнавати і блокувати запити, за якими криються злочинні наміри.
Команда ZN.UA перевірила сильні і слабкі сторони ChatGPT-o3. За фотографіями, де були хоча б найдрібніші, майже неочевидні розпізнавальні знаки, модель ШІ дуже вправно визначала розташування. Натомість якщо в інтернеті не було фотографій розшукуваного місця або якщо на фотографії не було жодних зачіпок, програма висувала припущення, пропонуючи схожі місцини. І гіпотетичні висновки частіше не були правильними.
Ось приклади, як ChatGPT-o3 міркує та знаходить точні локації. Аналізуючи світлини з типовими для Києві наслідками ракетного влучання, ChatGPT-o3 не зміг вказати точну геолокацію на карті, але запропонував звузити пошук до Оболонського, Дарницького та Солом’янського районів.
Із київським муралом «Привид Києва» за адресою Межигірська, 3 ШІ справився відмінно. Оскільки локація популярна, сам мурал є характерною ознакою будівлі і про це місце є багато інформації в інтернеті, ChatGPT-o3 легко визначив місце, витративши на роздуми менш як хвилини. На скріні можна побачити також, як ШІ розмірковує, аналізуючи фотографію.
А ось із київським муралом «Святий Георгій» на Великій Житомирській, 38 у моделі виникли проблеми. Тут фото неякісне і мурал видно не повністю. ChatGPT-o3 зміг знайти схожий за стилістикою, але зовсім інший стінопис.
Тут ми запропонували моделі фото з наслідками ракетного удару 26 червня 2022 року у Києві по ЖК «Львівський квартал» за адресою Глибочицька, 13. На скріні можна побачити, що під час аналізу фотографії ШІ розбиває її на дрібні елементи й окремо вивчає кожен із них.
Тут на роздуми ChatGPT-o3 витратив майже 8 хвилин. Зрозумів, що це наслідки обстрілу, але підібрав найсвіжіші новини за 24 квітня 2025 року (черговий масований обстріл столиці) та вказав неправильну адресу.
А тут ми завантажили для аналізу справжні фото наслідків обстрілу 24 квітня 2025 року. ChatGPT-o3 одразу зрозумів, що це місце ракетного удару.
Спочатку ШІ підібрав адресу за наслідками обстрілів у 2024 році, але після підказки зазначив, що на фото вулиця Чорнобильська Святошинського району. Район вірний, але адреса помилкова. Тож чим більше даних користувач повідомляє сервісу, тим точніше ШІ може справитися із завданням. І чим менше інформації про будівлю є в інтернеті, тим важче її ідентифікувати.
Наостанок завантажуємо фото Ботанічного саду ім. Фоміна біля метро «Університет». Сервіс видає правильну відповідь за 20 секунд.
Нагадаємо, OpenAI зацікавлений у покупці браузера Chrome від Google, якщо суд ухвалить рішення про його примусовий продаж. У компанії заявили, що Google як монополіст штучно обмежує для стартапу доступ до пошукової технології і натомість просуває власний ШІ.