Google DeepMind и Стэнфорд разработали систему проверки данных ИИ — исправляет 76% ложных ответов

31 марта, 19:04, 2024

Одним из самых больших недостатков чатботов на основе искусственного интеллекта являются так называемые «галлюцинации», когда ИИ выдумывает недействительную информацию, то есть фактически лжет. Некоторые эксперты говорят, что это одна из интересных особенностей ИИ, и это может быть полезным для генеративныхх моделей, которые создают изображения и видео. Но не для речевых моделей, которые дают ответы на вопросы пользователей, рассчитывающих на точные данные.

Лаборатория Google DeepMind и Стэнфордский университет, похоже нашли обходной путь для решения проблемы. Исследователи разработали систему проверки для больших языковых моделей искусственного интеллекта: Search-Augmented Factuality Evaluator, или SAFE проверяет длинные ответы, созданные чатботами ИИ. Их исследования доступны как препринт на arXiv вместе со всем экспериментальным кодом и наборами данных.

Система анализирует, обрабатывает и оценивает ответы в четыре шага, чтобы проверить их точность и соответствие. Сначала SAFE разбивает ответ на отдельные факты, просматривает их и сравнивает с результатами поиска Google. Система также проверяет релевантность отдельных фактов предоставленному запросу.

Чтобы оценить производительность SAFE, исследователи создали LongFact, набор данных из примерно 16 000 фактов. Затем они испытали систему на 13 крупных языковых моделях из четырех различных семейств (Claude, Gemini, GPT, PaLM-2). В 72% случаев SAFE давала те же результаты, что и проверка людьми. В случаях несогласия с результатами ИИ SAFE была права в 76% случаев.

Исследователи утверждают, что использование SAFE в 20 раз дешевле, чем проверка людьми. Таким образом, решение оказалось экономически жизнеспособным и пригодным к масштабированию. Существующие подходы к оценке соответствия контента, созданного моделью, обычно полагаются на непосредственную человеческую оценку. Несмотря на ценность, этот процесс ограничен субъективностью и изменчивостью человеческого суждения и проблемами масштабируемости применения человеческого труда к большим наборам данных.

Источник: Marktechpost

Теги по теме

Google

Источник материала

ITC

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

Больше всего "мотают" электроэнергии: эксперты назвали разоряющие вас приборы

Знай

16 августа 2025

Конец эпохи ветряных турбин: что такое Hercules, производящий 5000 кВтч в домашних условиях

Фокус

22 часа назад

Полнолуние и новолуние в августе 2025: лунный календарь

VGorode

9 августа 2025

Ограничения в мессенджерах: Россия усиливает цифровой контроль

Хвиля

14 августа 2025

Советы профессионала: 5 простых настроек улучшат качество изображения на любом телевизоре

Фокус

16 минут назад

12 млрд световых лет от нас: астрономы обнаружили, возможно, самый далекий космический взрыв

Фокус

25 минут назад

Google DeepMind и Стэнфорд разработали систему проверки данных ИИ — исправляет 76% ложных ответов

Технологии

Больше всего "мотают" электроэнергии: эксперты назвали разоряющие вас приборы

Конец эпохи ветряных турбин: что такое Hercules, производящий 5000 кВтч в домашних условиях

Полнолуние и новолуние в августе 2025: лунный календарь

Ограничения в мессенджерах: Россия усиливает цифровой контроль

Советы профессионала: 5 простых настроек улучшат качество изображения на любом телевизоре

Ученые обнаружили три новых вида жирафов: раньше знали об одном

Цифровая головоломка, которая захватила сеть: найдите число 16 за 7 секунд

Старомодные принципы, которым больше не следуют: Обзор Mafia: The Old Country

12 млрд световых лет от нас: астрономы обнаружили, возможно, самый далекий космический взрыв

Технологии

Больше всего "мотают" электроэнергии: эксперты назвали разоряющие вас приборы

Конец эпохи ветряных турбин: что такое Hercules, производящий 5000 кВтч в домашних условиях

Полнолуние и новолуние в августе 2025: лунный календарь

Ограничения в мессенджерах: Россия усиливает цифровой контроль

Советы профессионала: 5 простых настроек улучшат качество изображения на любом телевизоре

Ученые обнаружили три новых вида жирафов: раньше знали об одном

Цифровая головоломка, которая захватила сеть: найдите число 16 за 7 секунд

Старомодные принципы, которым больше не следуют: Обзор Mafia: The Old Country

12 млрд световых лет от нас: астрономы обнаружили, возможно, самый далекий космический взрыв