Велика мовна модель DeepSeek R1 збирає величезну кількість даних користувачів та відправляє у Китай. Також ШІ викривляє чутливу для китайської влади інформацію.
Збирання даних
Китайська компанія зберігає натискання клавіш, паролі та всі дані, введені у запити,включно з текстом та зображеннями, і потім зберігає їх на серверах у Китаї.
За умовами DeepSeek, збирання особистої інформації, включно з датою народження, адресою електронною поштою, номерами телефонів та паролями, є легальним. Будь-який вміст, який користувачі надають LLM R1, DeepSeek також дозволяє собі збирати. Щоразу, коли хтось звертається до DeepSeek, він погоджується на зберігання підтверджень особи, що, імовірно, означає документи, як паспорт чи водійські права.
Також DeepSeek ретельно зберігає все, що стосується апаратного забезпечення користувачів: IP-адреси, моделі телефонів, мову, навіть «схеми натискання клавіш або ритми». Файли cookie також сприяють збору даних користувачів.
Оскільки R1 є «відкритим вихідним кодом», її можна запускати будь-де на будь-якому апаратному забезпеченні, що загалом добре для конфіденційності — запуск моделі локально на вашому власному апаратному забезпеченні, імовірно, не призведе до збору даних. Проте DeepSeek пропонує онлайн-доступ до R1 через свій вебсайт та мобільний застосунок, що означає зберігання та обробку даних.
Втім, DeepSeek є дуже прозорим щодо того, які дані він збирає від онлайн-користувачів, де вони зберігаються та що з ними роблять. Все це докладно описано у політиці конфіденційності, яка демонструє, що немає майже нічого, чого б компанія не збирала.
DeepSeek визнає, що «рекламодавці, вимірювальні компанії та інші партнери діляться з нами інформацією про вас і дії, які ви виконали за межами Сервісу, наприклад ваші дії на інших вебсайтах і в програмах або в магазинах, включаючи продукти чи послуги, які ви придбали в інтернеті чи особисто».
«Корпоративна група» DeepSeek також має доступ до даних, які вона збирає, щоб забезпечити «певні функції, такі як зберігання, доставлення контенту, безпека, дослідження та розробки, аналітика, клієнтська та технічна підтримка, а також модерація вмісту». Політика конфіденційності зазначає, що вся інформація зберігається на серверах у Китаї.
Цензура
Також, як пише сайт Cybernews, «чатбот поширює прокитайську дезінформацію». Китайська держава може використовувати дані користувачів DeepSeek — згідно з місцевим законом, китайський стартап має ділитися даними з урядом, якщо його попросять.
«Як китайська компанія, DeepSeek дотримується політики комуністичної партії. Це відображено навіть у моделі з відкритим вихідним кодом, що викликає занепокоєння щодо цензури та інших впливів», — заявили дослідники, що стоять за promptfoo, інструментом з відкритим кодом, призначеним для оцінки великих мовних моделей.
У вівторок promptfoo опублікувала набір запитів, що охоплюють теми, які, ймовірно, підлягають цензурі комуністичного режиму. Серед них такі питання, як незалежність Тайваню, історичні наративи навколо кривавої культурної революції та запитання про президента Китаю Сі Цзіньпіна.
Дослідники надіслали моделі DeepSeek 1360 запитів, на 85% яких чатбот відмовився відповідати. Відмови, як правило, «мають надто націоналістичний тон та суворо дотримується політики КПК». Однак цензура не надто ретельна — її вдається обійти методами, яки зазвичай застосовують у таких випадках, а саме тим чи іншим маскуванням запитів.
Джерела: Tom`s Hardware, Cybernews